

Uni-1 от Luma AI уже доступна для использования. По результатам тестов предпочтений людей с рейтингом Elo модель занимает первое место в общих показателях, в категориях стиля и редактирования, а также генерации на основе референсов — так утверждают в Luma Labs. В чистой генерации изображений по текстовому описанию она на втором месте, уступая только Nano Banana от Google.
Эта модель идеально справляется с тестовым промптом автора, показывая результаты на уровне Nano Banana Pro, а то и превосходя его. По сравнению с свежей Midjourney v8 прогресс заметен: та версия с таким же запросом провалилась. Важный нюанс: изображение создано через агент генерации изображений Luma, так что при запуске через будущий API результаты могут немного отличаться. Uni-1 можно протестировать бесплатно прямо в Luma Labs.
В целом Uni-1 приближается к флагманской модели Google по качеству, но обходится дешевле при схожем разрешении: для 2K средняя цена через грядущий API составит около 0,09 доллара за изображение — в зависимости от количества загружаемых референсных снимков.
| Характеристика | Uni-1 | Nano Banana 2 | Nano Banana Pro |
|---|---|---|---|
| Текст в изображение (2048px) | $0.0909 | $0.101 | $0.134 |
| Редактирование изображения / i2i (2048px) | $0.0933 | $0.101 | $0.134 |
| Множественные референсы, 1 изображение (2048px) | $0.0933 | $0.101 | $0.134 |
| Множественные референсы, 2 изображения (2048px) | $0.0957 | $0.101 | $0.134 |
| Множественные референсы, 8 изображений (2048px) | $0.1101 | $0.101 | $0.134 |
Nano Banana 2 позволяет генерировать изображения меньшего разрешения по сниженной стоимости: 0,5K обойдется примерно в 0,045 доллара, а 1K — около 0,067 доллара.
Uni-1 от Luma AI лидирует в логических бенчмарках над Nano Banana 2 и GPT Image 1.5
Luma AI анонсировала Uni-1 — свою первую модель, которая объединяет анализ изображений и их создание в единой архитектуре.
Как и Nano Banana Pro от Google или GPT Image 1.5, Uni-1 использует автотрегрессивный трансформер — архитектуру ИИ, которая строит контент последовательно, токен за токеном, а не извлекает изображения из шума, как это делают классические диффузионные модели. Текст и визуалы проходят через общий конвейер обработки.
По словам разработчиков, модель способна анализировать запросы до и во время генерации: разбирать запутанные инструкции и заранее планировать композицию сцены. Такой подход обеспечивает высокую точность исполнения промптов, и Uni-1 здесь не исключение. К примеру, она способна взять несколько обычных фото и слить их в совершенно новую картину.

Помимо базовой генерации Uni-1 умеет дорабатывать объекты через несколько шагов диалога, сохраняя контекст, преобразовывать фото в более чем 76 художественных стилей, принимать наброски и визуальные указания как входные данные, переносить внешность, позы и композиции из референсных снимков в новые изображения. В одном из примеров модель создала целую последовательность на основе единственного фото, показав, как пианист стареет от детства до глубокой старости.

Как сообщает Luma, Uni-1 показывает лучшие результаты в тесте RISEBench по логической обработке изображений, опережая Nano Banana 2 и GPT Image 1.5. Возможности генерации также усиливают понимание визуалов. В распознавании объектов модель почти догоняет Gemini 3 Pro от Google. Поддержка нескольких языков включена по умолчанию.

Uni-1 вскоре появится в Luma Agents — свежем творческом ассистенте — и через API Luma. Информация о ценах пока не раскрыта.