Как только посетитель попадает на R&D-этаж General Intuition в нью-йоркском офисе, 31-летний сооснователь и CEO компании Пим де Витте сразу обращает внимание на монитор, стоящий на регулируемом столе. Кто-то явно играет во что-то вроде Fortnite. Но это не человек.
«Наш агент играет уже 100 часов подряд», — с гордостью говорит Кент Роллинс, директор по продукту компании.
Прежде чем гость успевает увлечься зрелищем того, как ИИ перемещается в виртуальной среде игры, он слышит электронные шаги большого четвероногого робота, приближающегося к нему.
«Тот же самый мозг, который управляет агентом в игре, управляет и роботом», — объясняет де Витте.
Джош Дюплантис, аналитик данных, держащий ноутбук с прямой трансляцией с единственной камеры робота, поясняет: режим бота по умолчанию — «исследование». Полагаясь на эту камеру, свой единственный глаз, огромный похожий на жука робот подходит к человеку, обходит его и продолжает движение по офису. Иногда он задевает ножки стульев или натыкается на мусорную корзину — совсем как ребенок, который ещё не научился соотносить своё тело с окружающим миром. Дюплантис добавляет, что для тонкой настройки модели ИИ под четвероногого робота потребовалось всего восемь минут реальных данных с робота. Более того, эти данные были собраны на улице, а не внутри офиса, где робот сейчас ориентируется самостоятельно.
Агентная модель, способная обобщать данные из игрового процесса на симуляцию и на физическое воплощение — это и есть смысл существования General Intuition. А способность этой модели определять своё место в мире обеспечила поддержку нескольких тяжеловесов.
В четверг General Intuition объявила о привлечении 320 миллионов долларов при оценке в 2,3 миллиарда долларов, подтвердив информацию, ранее опубликованную TechCrunch. Этот раунд доводит общий объём раскрытого финансирования General Intuition до 454 миллионов долларов после раунда в 134 миллиона долларов, который стартап привлек при запуске в октябре прошлого года.
Стартап был выделен из другой компании де Витте — Medal, которая позволяет геймерам загружать и делиться игровыми клипами. Сотни миллионов часов загруженного геймплея стали исходным набором данных для обучения модели General Intuition пространственно-временному мышлению — то есть пониманию того, как перемещаться в пространстве и времени.
Но ключевым ингредиентом были не сами кадры геймплея, а метки действий, встроенные в эти клипы: записи того, какие именно кнопки нажимал игрок и когда. Большинство конкурентов, утверждает де Витте, пытаются вывести действия только из видео, что, по его мнению, недостаточно.
«Мы рассматриваем это как следующий этап будущего пре-тренинга, — говорит де Витте. — У нас есть единая модель, которая может реагировать на информацию Fortnite на экране и предпринимать действия, но также понимать реальную динамику мира так, как языковая модель никогда не сможет».
В какой-то момент де Витте предоставил журналисту ноутбук с world model от General Intuition — симулированной средой, генерируемой покадрово, а не отрисовываемой традиционным игровым движком. Как часто бывает при тестировании world models, гость попробовал пройти сквозь стену. В отличие от некоторых других демо, агент не прошёл сквозь неё. Из миллионов часов геймплея модель каким-то образом узнала, что стены — это стены, лестницы нужны для подъёма, а тени удлиняются по мере движения солнца.
Для General Intuition эта world model не является продуктом; это тренировочная среда (внутри компании её называют «спортзалом»). В конечном счёте компания хочет продавать саму агентную модель, и де Витте утверждает, что встроенные в геймплей данные о действиях помогают модели отличать «себя» от «окружения», что даёт ей более глубокое понимание причинно-следственных связей.
Впечатляюще, но General Intuition — не единственная компания, пытающаяся решить эту проблему. Более того, пока никому не удалось масштабировать такую модель для физического мира. Большинство подобных подходов требуют огромных объёмов реальных данных, которые собираются медленно и дорого. Ставка General Intuition в том, что игровой процесс станет масштабируемым коротким путём.
Инвесторы готовы принять эту ставку. Последний раунд General Intuition возглавила Khosla Ventures, с участием General Catalyst, Джеффа Безоса, Эрика Шмидта, Нико Росберга, а также исследователей из Google DeepMind и MIT.
Основная часть средств пойдёт на масштабирование вычислительных мощностей. General Intuition заключила сделку с CoreWeave и планирует сосредоточиться на пре-тренинге следующей версии модели. Часть бюджета зарезервирована для того, чтобы сделать API более широко доступным к концу лета.
Винод Хосла, чья фирма возглавила раунд, говорит, что его привлекли видение де Витте и уникальное положение компании в отношении данных.
«Если посмотреть на языковые модели, когда возникло рассуждение, это был квантовый скачок, — сказал Хосла в телефонном интервью. — В world models, я думаю, квантовым скачком станет появление интуиции у ИИ, способности, похожей на человеческую интуицию. Данные о действиях и реакциях людей, которые есть в играх, — ключевая часть возникновения интуиции».
Видение — компания масштаба поколения

General Intuition — не единственная компания, заметившая, что данные о действиях человека из Medal — ключевой элемент для создания динамических world models и универсальных агентов. Брианна Мартин, начальник штаба стартапа, рассказала, что компания отчасти родилась после того, как Medal отклонил предложение о покупке от крупной лаборатории. С тех пор были и другие предложения.
Де Витте и его сооснователи — Элой Алонсо, Адам Джелли и Винсент Микели — не заинтересованы в продаже, и инвесторы стартапа тоже пока не ищут выхода. Объём и качество проприетарных данных, которые General Intuition получает через Medal, — одна из причин, по которой Хосла убеждён, что стартап — это ставка на поколение, а не цель для M&A; что он может стать основой для универсальных агентов и world models как в симуляции, так и в реальном мире.
«На данный момент это было бы просто приобретением данных, что неинтересно», — говорит Хосла.
Часть этой ставки также связана с доверием к ценностям де Витте. Предприниматель три года проработал в гуманитарной сфере, в том числе с организацией «Врачи без границ». Поэтому он чётко обозначил границы использования технологии General Intuition: никакие агенты не будут применяться для нанесения вреда людям.
«Мы не хотим быть частью эскалационной системы, — говорит де Витте. — Представьте, если бы я заявил: „Мы занимаемся летальной автономией“. Что бы, по-вашему, произошло в других странах?»
Это ограничение на военное применение появляется в то время, как Кремниевая долина всё активнее поддерживает военные разработки, хотя де Витте отмечает, что его модели могут использоваться для поисково-спасательных миссий.
Де Витте — голландец, и большая часть его команды — европейцы, что формирует идентичность компании. Он говорит, что взял Мартин на работу отчасти из-за её решения публично уйти из Palantir в знак протеста против её работы с иммиграционной и таможенной службой США.
«Я не понимаю, почему Кремниевая долина делает то, что делает, — говорит он. — Есть причина, по которой меня там нет».
Этика де Витте не просто ограничивает то, чего не будут делать модели. Будучи геймером, который в подростковом возрасте заработал 1,5 миллиона долларов на создании и хостинге частного сервера RuneScape, де Витте также думает о том, что произойдет с людьми, которых технологии ИИ могут оставить позади.
Недавно General Intuition запустила платформу под названием Nerve — маркетплейс для заработка, который позволяет геймерам зарабатывать деньги, используя свои текущие игровые установки. Те, кто регистрируется, начинают с разметки данных и могут впоследствии перейти к телеуправлению роботами и другим задачам. Де Витте отмечает, что пользовательская база Medal — это то самое поколение, которое наиболее подвержено риску замещения из-за ИИ, и он хочет, чтобы они были вовлечены в то, что будет дальше.
Маховик данных
Де Витте хочет, чтобы General Intuition стала поставщиком экосистемы, как Anthropic или OpenAI, — провайдером моделей, позволяющим другим строить на основе их технологии. Сегодня у стартапа есть несколько клиентов в игровой сфере, симуляции и робототехнике.
«Мы не собираемся создавать компанию по производству самоуправляемых автомобилей, — говорит де Витте. — Мы сделаем так, чтобы следующему человеку было в 10 раз легче создать такую компанию».
Компания утверждает, что как только её API попадёт в руки большего числа клиентов, она сможет проверить свои возможности в различных сценариях использования: тестирование робота в цифровом двойнике заводского цеха, управление человекообразным ботом в игровой студии или отправка четвероногого робота в опасные среды.
Хотя четвероногий робот — первое физическое воплощение, которое General Intuition испробовала в реальном мире, компания также тестировала дроны и другие устройства, включая испытание модели в гоночных играх.
«Оно работает на всём, чем можно управлять с помощью геймпада или клавиатуры с мышью», — говорит де Витте.
Возможность построить маховик данных — одна из целей.
«Мы будем выбирать клиентов, где сможем диверсифицировать типы воплощений, для которых эта обобщённая фундаментальная модель служит основой, — говорит де Витте. — Поэтому мы в первую очередь будем отдавать приоритет клиентам, которые могут предложить реальные данные, интересные и полезные для продвижения исследований. А также тем, у кого есть гибкая внутренняя команда, чтобы мы могли быть настоящими встроенными партнёрами и учиться друг у друга».
Хосла говорит, что проприетарные данные General Intuition позволили ей добиться таких успехов, и способность продолжать собирать данные, которых нет ни у кого другого, будет иметь решающее значение. Особенно потому, что, несмотря на впечатляющие демонстрации, вопрос о том, можно ли масштабировать перенос из симуляции в реальный мир, остаётся открытым и пока никем полностью не решён.