Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Веб-модели мира для стабильных ИИ-миров

Исследователи из Принстона, UCLA и Пенсильвании разработали веб-модели мира: код на TypeScript задает правила, языковые модели добавляют описания. Это создает бесконечные, но последовательные окружения для ИИ-агентов без хранения данных. Демо включают атласы, игры и симуляции, обещая баланс надежности и гибкости.

11 января 2026 г.
4 мин
20

Специалисты из Принстонского университета, UCLA и Университета Пенсильвании придумали способ создавать для ИИ-агентов постоянные миры, где можно свободно исследовать пространство. Обычный веб-код устанавливает базовые правила, а языковая модель добавляет сюжеты, описания и живые детали.

Веб-модели мира делят пространство на два уровня. Первый уровень — это код на TypeScript без лишних примесей. Он определяет существующие объекты, связи между ними и допустимые действия. Такой код гарантирует строгую логику: агенты не пройдут сквозь закрытые двери и не потратят деньги, которых нет.

Второй уровень обеспечивают языковые модели. Они оживили базовую структуру, придумывая описания локаций, реплики неигровых персонажей и визуальные нюансы. Главное преимущество: модель строго следует рамкам, заданным кодом. Любое действие сначала проходит проверку в коде на допустимость, и только после этого модель генерирует описание исхода. Даже самая изобретательная модель не сможет обойти установленные ограничения.

Хэш-функции генерируют "бесконечные" миры без затрат на память

Самое умное в подходе — решение вопроса хранения. Как сохранить почти бесконечную вселенную? Разработчики отказались от хранения данных вовсе и генерируют каждую локацию заново по ее координатам. Когда агент заходит на планету, координаты проходят через хэш-функцию — математическую формулу, которая для одного и того же входа всегда выдает одинаковый результат. Этот результат задает начальные параметры для языковой модели, так что планета каждый раз выглядит идентично.

Агент может уйти с планеты, вернуться через время — и все останется прежним. Не из-за сохранения данных, а благодаря неизменности математики. Авторы называют это "сохранением объектов без затрат на хранение".

Система устойчива и без языковой модели. Если она тормозит или выходит из строя, подключаются готовые шаблоны. Мир теряет яркие описания, но правила продолжают работать. Это отличает метод от чисто генеративных систем, где сбой модели парализует все приложение.

От туристических атласов до карточных баталий

Чтобы доказать универсальность, команда собрала семь демонстраций. "Infinite Travel Atlas" превращает Землю в интерактивный глобус для исследований. Кликните в любую точку — и появятся данные о местах, маршрутах, местных историях. География берется из кода, а нарративы — от языковой модели.

"Galaxy Travel Atlas" расширяет идею на вымышленную sci-fi-вселенную. Код создает галактики, звездные системы и планеты по четким правилам. Языковая модель дополняет миссиями, персонажами и обучающим контентом. На каждой планете агента ждет брифинг о ландшафте, небе, сигналах и угрозах.

Карточная игра "AI Spire" позволяет запрашивать персональные карты. Введите "огненный шар, который наносит много урона огнем, но замораживает противника" — и система выдаст подходящую карту. Код с проверкой схем гарантирует соответствие игровым правилам, лимитам затрат и типам карт.

Другие примеры: песочница "AI Alchemy" с реакциями элементов и подсказками модели по новым правилам; 3D-эксплорер планет "Cosmic Voyager" с непрерывными комментариями ИИ; генератор статей в стиле Википедии "WWMPedia"; система для длинных повествовательных текстов "Bookshelf".

Перспективы для подготовки ИИ-агентов

Авторы видят в веб-моделях мира баланс между жесткими базами данных и хаотичными генераторами. Они соединяют надежность традиционной веб-разработки с гибкостью языковых моделей.

Это актуально для создания ИИ-агентов, которые действуют автономно. Им нужны тренировочные среды с предсказуемостью для эффективного обучения, но с достаточной вариативностью для неожиданных сценариев.

Пока неясно, как метод справится с усложнениями. Демо впечатляют, но просты. Нет тестов на множественных агентов или динамические изменения правил.

Интерес к средам для ИИ-агентов растет. Недавнее исследование Microsoft Research и американских вузов подтвердило: дообученные языковые модели предсказывают условия окружения с точностью свыше 99 процентов. Лауреат премии Тьюринга Ричард Саттон считает такие модели мира основой для обучения агентов на опыте.