Luma AI выпустила Uni-1 — топ в RISEBench по логике

Luma AI анонсировала Uni-1 — свою первую модель, которая в единой архитектуре сочетает анализ изображений и их создание.

Как и Nano Banana Pro от Google с GPT Image 1.5, Uni-1 использует автотрегрессивный трансформер. Такая система строит контент по порядку, токен за токеном, а не извлекает картинки из шума, как это делают классические диффузионные модели. Текст и изображения проходят через единый канал обработки.

Разработчики отмечают: модель разбирает запросы до старта генерации и прямо в процессе, разбивая запутанные указания и продумывая сцены. Это дает высокую точность соблюдения промптов, и Uni-1 полностью соответствует этому правилу. Например, она берет ряд снимков и создает на их основе свежую композицию.

Несколько обычных фото питомцев слили в одну сцену, созданную ИИ: собака, кошка и бостон-терьер в академических одеяниях перед доской с научными чертежами и логотипом Luma AI. — Несколько обычных фото питомцев слили в сцену выше. Промт: "Combine the black and white curly-haired dog with pink bandana, the Boston Terrier in plaid harness, and the black-and-white cat into a single scene where they are dressed in academic regalia, standing before a whiteboard filled with scientific diagrams and text, with the Luma AI logo placed in the top-left corner." | Изображение: Luma

Сверх простого создания изображений Uni-1 дорабатывает объекты через несколько шагов диалога без потери контекста, меняет фото на более чем 76 художественных стилей, принимает эскизы и графические команды, копирует внешность, ракурсы и layout из образцов в новые работы. В демонстрации она построила полную цепочку кадров от единственного фото, показав, как пианист меняется с возрастом от ребенка до старика.

Кадр с сайта Luma AI: шесть ключевых моментов из последовательности ИИ — мальчик за пианино проходит стадии ребенка, подростка, молодого супруга, отца, зрелого мужчины и пенсионера. Сверху текст промта и пояснение к пятому кадру. — Из одного образцового фото Uni-1 сгенерировала цепочку, где пианист стареет от юности до зрелых лет — с постоянным ракурсом камеры и сценой. | Изображение: Luma AI

Luma сообщает: Uni-1 показывает лучший результат в RISEBench на задачах логической работы с изображениями, чуть опередив Nano Banana 2 и GPT Image 1.5. Функции генерации усиливают способности к визуальному восприятию. В определении объектов она почти сравнялась с Gemini 3 Pro. Поддержка идет для разных языков.

Столбчатая диаграмма итогов RISEBench для Uni-1, Nano Banana 2, Nano Banana Pro, GPT Image 1.5, GPT Image и Qwen-Image-2 по разделам Overall, Causal, Spatial, Temporal, Logical. Uni-1 набрала максимум 0.51 в общем. — Uni-1 на первом месте в общем зачете RISEBench, немного вперед Nano Banana 2 и GPT Image 1.5 — модели изображений для ChatGPT. | Изображение: Luma AI

Uni-1 вскоре запустят в Luma Agents — новом инструменте для творчества, — плюс в Luma API. Детали о стоимости не раскрыты.

Uni-1 от Luma AI обошла Nano Banana 2 и GPT Image 1.5 в логических тестах

Горячее

Anthropic объяснила быстрый расход лимитов Claude Code

5 лёгких и безопасных альтернатив OpenClaw для ИИ-агентов

Топ-5 CLI-инструментов для агентного кодирования

Топ-5 API-провайдеров открытых ИИ-моделей

Open Notebook: альтернатива NotebookLM

Сейчас в тренде