Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Gen-4.5 от Runway обходит Google и OpenAI в тестах

Runway выпустила Gen-4.5, модель для генерации видео из текста, которая лидирует в бенчмарке Artificial Analysis с Elo 1247, обходя Veo 3 от Google и Sora 2 Pro от OpenAI. Несмотря на прогресс в визуальной последовательности и отзывчивости, система все еще сталкивается с ошибками в логике, такими как проблемы с причинностью и сохранностью объектов. Runway планирует дорабатывать эти аспекты для улучшения моделей мира.

2 декабря 2025 г.
2 мин
3
Runway’s Gen-4.5 edges past Google and OpenAI in text-to-video benchmark

Runway представила Gen-4.5 — свою новую модель для создания видео. Компания утверждает, что обновление показывает лучшие результаты в некоторых тестах по сравнению с конкурентами, хотя базовые ошибки в логике, типичные для таких систем, никуда не делись.

Runway анонсировала Gen-4.5, подчеркивая повышенную чуткость к запросам пользователей и большую стабильность изображений по сравнению с предыдущей версией.

В объявлении акцент сделан на данных из теста Artificial Analysis Text to Video. На 30 ноября 2025 года Gen-4.5 занимает первое место с рейтингом Elo 1247. Это немного опережает Veo 3 от Google с 1226 баллами и версию 2.5 от Kling с 1225. За ними следует "Sora 2 Pro" от OpenAI с 1206 очками.

Новая модель, знакомые трудности

Runway заявляет, что Gen-4.5 точнее воспроизводит физические взаимодействия, чем прошлые варианты. Разработка велась совместно с Nvidia, а обучение и генерация видео происходят на графических процессорах Hopper и Blackwell.

Несмотря на улучшения, старые проблемы никуда не исчезли. Runway указывает, что Gen-4.5 по-прежнему путается в причинно-следственных связях. Например, дверь может распахнуться до того, как персонаж коснется ручки. Сохранность объектов тоже вызывает вопросы: вещи исчезают, стоит им ненадолго скрыться за чем-то. Кроме того, модель склонна к "предвзятости успеха", из-за чего действия чаще всего завершаются благополучно, даже если в реальности они бы провалились, как, скажем, неточный выстрел.

По словам Runway, такие недостатки особенно критичны для создания надежных моделей мира, и компания намерена над ними работать дальше.

Gen-4.5 скоро станет доступна всем пользователям. В то же время Kling представила свою новинку — Kling Video O1, которую называют мощной мультимодальной системой для видео.