Стартап Luma, специализирующийся на генерации видео с помощью ИИ, представил платформу Luma Agents. Эти агенты берут на себя весь процесс творческой работы — от текста и изображений до видео и аудио. В основе лежат модели семейства Unified Intelligence, обученные на единой мультимодальной системе для рассуждений.
Разработчики позиционируют Luma Agents как инструмент, меняющий подход к задачам в рекламных агентствах, маркетинговых отделах, дизайн-студиях и крупных компаниях. Агенты умеют планировать и создавать контент в разных форматах, а также взаимодействовать с другими ИИ-моделями, такими как Ray 3.14 от Luma, Veo 3 и Nano Banana Pro от Google, Seedream от ByteDance и голосовые модели ElevenLabs.

Платформа построена на модели Uni-1 — первой из семейства Unified Intelligence. Она прошла обучение на данных по аудио, видео, изображениям, языку и пространственному мышлению, рассказал сооснователь и CEO Luma Амит Джайн.
По словам Джайна, Uni-1 способна рассуждать на языке и визуализировать идеи в пикселях или изображениях — это они называют
«интеллектом в пикселях». Поддержка аудио и видео появится в следующих версиях моделей.
Джайн подчеркнул: клиенты Luma не просто приобретают инструмент, а полностью меняют свои бизнес-процессы.
Платформа уже доступна некоторым клиентам, включая глобальные агентства Publicis Groupe и Serviceplan, а также бренды Adidas, Mazda и саудовскую компанию Humain по ИИ.
Почему Luma Agents меняют правила игры
Ключевой особенностью агентов стала способность сохранять контекст между активами, участниками проекта и итерациями. Они оценивают результаты, дорабатывают их и улучшают через цикл самокритики, отметил Джайн.
Такая функция проверки и правки делает агенты похожими на полезные инструменты для кодинга.
Нужна возможность оценивать свою работу, исправлять ошибки и повторять цикл, пока результат не станет точным, — объяснил он.
Сейчас в креативных командах использование ИИ часто сводится к выбору из сотен моделей и изучению промтов для каждой. Luma Agents избавляют от этого: не приходится запрашивать каждую итерацию заново. Система генерирует множество вариантов, а пользователь корректирует направление через диалог.
Благодаря пониманию контента на уровне моделей Unified Intelligence платформа справляется с задачами от начала до конца, добавил Джайн.
Как это работает на практике
Представьте архитектора, который рисует здание: в голове формируется образ структуры, освещения, пространства и ощущения. Unified Intelligence использует тот же принцип.
В демонстрации 200-словный бриф и фото помады привели к идеям локаций, моделей и цветовых схем для рекламной кампании.
В другом случае агенты преобразовали годичную кампанию бренда стоимостью 15 миллионов долларов в локализованные версии для разных стран. Это заняло 40 часов и обошлось менее чем в 20 тысяч долларов, при этом материалы прошли внутренние проверки качества и точности, сообщил Джайн.
Luma Agents теперь открыты для всех через API, но доступ вводят постепенно, чтобы избежать сбоев в рабочих процессах и обеспечить стабильность.