Luma AI Uni-1 лидирует в бенчмарках ИИ

Luma AI выпустила Uni-1 — унифицированную модель для анализа и генерации изображений на автотрегрессивном трансформере. Она лидирует в RISEBench по логической обработке, обходит Nano Banana 2 и GPT Image 1.5, точно следует сложным промптам. Через API цены стартуют от 0,09 доллара за 2K-изображение, модель уже доступна для тестов.

Сравнение изображений, сгенерированных моделями ИИ

Гиперреалистичное фото DSLR: обезьяна с розовой банановой держит на тигре впереди. Сзади лошадь скачет на астронавте. Астронавт снизу как живая 'космическая упряжь для лошади', лошадь сверху, в роли наездника. 100% однозначно: лошадь наездник, астронавт оседлан. Высокое разрешение, резкий фокус, реалистичное освещение. (Лучшее из трех попыток, все три удачные) — Гиперреалистичное фото DSLR: обезьяна с розовой банановой держит на тигре впереди. Сзади лошадь скачет на астронавте. Астронавт снизу как живая "космическая упряжь для лошади", лошадь сверху, в роли наездника. 100% однозначно: лошадь наездник, астронавт оседлан. Высокое разрешение, резкий фокус, реалистичное освещение. (Лучшее из трех попыток, все три удачные…)

Uni-1 от Luma AI уже доступна для использования. По результатам тестов предпочтений людей с рейтингом Elo модель занимает первое место в общих показателях, в категориях стиля и редактирования, а также генерации на основе референсов — так утверждают в Luma Labs. В чистой генерации изображений по текстовому описанию она на втором месте, уступая только Nano Banana от Google.

Эта модель идеально справляется с тестовым промптом автора, показывая результаты на уровне Nano Banana Pro, а то и превосходя его. По сравнению с свежей Midjourney v8 прогресс заметен: та версия с таким же запросом провалилась. Важный нюанс: изображение создано через агент генерации изображений Luma, так что при запуске через будущий API результаты могут немного отличаться. Uni-1 можно протестировать бесплатно прямо в Luma Labs.

В целом Uni-1 приближается к флагманской модели Google по качеству, но обходится дешевле при схожем разрешении: для 2K средняя цена через грядущий API составит около 0,09 доллара за изображение — в зависимости от количества загружаемых референсных снимков.

Характеристика	Uni-1	Nano Banana 2	Nano Banana Pro
Текст в изображение (2048px)	$0.0909	$0.101	$0.134
Редактирование изображения / i2i (2048px)	$0.0933	$0.101	$0.134
Множественные референсы, 1 изображение (2048px)	$0.0933	$0.101	$0.134
Множественные референсы, 2 изображения (2048px)	$0.0957	$0.101	$0.134
Множественные референсы, 8 изображений (2048px)	$0.1101	$0.101	$0.134

Nano Banana 2 позволяет генерировать изображения меньшего разрешения по сниженной стоимости: 0,5K обойдется примерно в 0,045 доллара, а 1K — около 0,067 доллара.

Uni-1 от Luma AI лидирует в логических бенчмарках над Nano Banana 2 и GPT Image 1.5

Luma AI анонсировала Uni-1 — свою первую модель, которая объединяет анализ изображений и их создание в единой архитектуре.

Как и Nano Banana Pro от Google или GPT Image 1.5, Uni-1 использует автотрегрессивный трансформер — архитектуру ИИ, которая строит контент последовательно, токен за токеном, а не извлекает изображения из шума, как это делают классические диффузионные модели. Текст и визуалы проходят через общий конвейер обработки.

По словам разработчиков, модель способна анализировать запросы до и во время генерации: разбирать запутанные инструкции и заранее планировать композицию сцены. Такой подход обеспечивает высокую точность исполнения промптов, и Uni-1 здесь не исключение. К примеру, она способна взять несколько обычных фото и слить их в совершенно новую картину.

Несколько снимков домашних питомцев объединены в одну сцену ИИ-генерации: собака, кошка и бостон-терьер в академических мантиях перед доской с научными схемами и логотипом Luma AI — Несколько обычных фото питомцев слиты в единую сцену. Промт: "Combine the black and white curly-haired dog with pink bandana, the Boston Terrier in plaid harness, and the black-and-white cat into a single scene where they are dressed in academic regalia, standing before a whiteboard filled with scientific diagrams and text, with the Luma AI logo placed in the top-left corner." | Изображение: Luma

Помимо базовой генерации Uni-1 умеет дорабатывать объекты через несколько шагов диалога, сохраняя контекст, преобразовывать фото в более чем 76 художественных стилей, принимать наброски и визуальные указания как входные данные, переносить внешность, позы и композиции из референсных снимков в новые изображения. В одном из примеров модель создала целую последовательность на основе единственного фото, показав, как пианист стареет от детства до глубокой старости.

Кадры с сайта Luma AI: шесть ключевых моментов последовательности ИИ-генерации, где мальчик за пианино стареет — от ребенка до старика. Рядом промт и описание пятого кадра — Из одного референсного фото Uni-1 строит последовательность, где пианист стареет от детства до старости — с постоянным углом камеры и coherentной сценой. | Изображение: Luma AI

Как сообщает Luma, Uni-1 показывает лучшие результаты в тесте RISEBench по логической обработке изображений, опережая Nano Banana 2 и GPT Image 1.5. Возможности генерации также усиливают понимание визуалов. В распознавании объектов модель почти догоняет Gemini 3 Pro от Google. Поддержка нескольких языков включена по умолчанию.

Гистограмма RISEBench: результаты Uni-1, Nano Banana 2, Nano Banana Pro, GPT Image 1.5, GPT Image и Qwen-Image-2 по категориям Overall, Causal, Spatial, Temporal, Logical. Uni-1 — лидер с 0.51 общим баллом — Uni-1 на вершине рейтинга RISEBench, чуть впереди Nano Banana 2 и GPT Image 1.5 — текущей модели изображений в ChatGPT. | Изображение: Luma AI

Uni-1 вскоре появится в Luma Agents — свежем творческом ассистенте — и через API Luma. Информация о ценах пока не раскрыта.

Uni-1 от Luma AI бросает вызов Nano Banana

Uni-1 от Luma AI лидирует в логических бенчмарках над Nano Banana 2 и GPT Image 1.5

Горячее

Anthropic открыла офис в Сеуле и новые партнерства в Корее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Как быстро запустить дата-центр? Дайте ему гибкость в энергопотреблении

Subquadratic утверждает, что решила ключевую проблему больших языковых моделей

Сейчас в тренде