Microsoft представила MAI-Image-2 генератор изображений

Команда сверхинтеллекта Microsoft под руководством Мустафы Сулемана представила MAI-Image-2 — модель для генерации изображений из текста, занявшую 3-е место на Arena.ai. Она сильна в фотореализме, освещении, тонах кожи и рендере текста, интегрируется в Copilot, Bing и Playground. По сравнению с MAI-Image-1 из 2025 года это заметный прогресс.

Команда сверхинтеллекта Microsoft представила дебютный продукт: MAI-Image-2, инструмент для создания изображений из текста, который интегрируется в сервисы компании и вскоре станет доступен через API.

Под руководством Мустафы Сулемана разработчики выпустили модель ИИ, преобразующую текстовые запросы в картинки. Сейчас она занимает третью строчку в лидерборде Arena.ai среди генераторов изображений из текста, заметно уступая GPT-Image-1.5 от OpenAI и Nano Banana 2 от Google.

Microsoft подчеркивает сильные стороны MAI-Image-2 в генерации правдоподобных фотографий с реалистичным освещением и верными оттенками кожи. Модель уверенно справляется как с сложными детализированными сюжетами, так и с сюрреалистичными композициями. Над ней работали фотографы, дизайнеры и визуальные художники.

Три изображения от MAI-Image-2 бок о бок: портрет с эффектами теней на лице, крупный план ириса и человек в голубой ледниковой пещере. — Microsoft отмечает, что MAI-Image-2 создает фотореалистичные картинки с естественным светом и высокой детализацией — портрет с тенями, макросъемка ириса, ледниковая пещера. | Изображение: Microsoft

MAI-Image-2 демонстрирует хорошие результаты в повседневных сценариях, например, четко воспроизводит текст на постерах, инфографике или схемах.

Три постера от MAI-Image-2 бок о бок: модерновый с красным кругом, меню кафе с оранжевой графикой и афиша конного события с скачущей лошадью. — Microsoft уверяет: MAI-Image-2 стабильно вставляет текст в изображения, что подходит для постеров и типографики. | Изображение: Microsoft

Протестировать модель можно в MAI Playground — доступность зависит от региона. Скоро она появится в Copilot и Bing Image Creator. API пока открыт только для отдельных корпоративных клиентов, но через Microsoft Foundry его получат все разработчики. Детали о архитектуре, стоимости и данных для обучения компания не раскрыла.

В октябре 2025 года Microsoft запустила первую внутреннюю модель MAI-Image-1. Та стартовала на девятом месте в Arena.ai и не привлекла внимания. Прорыв MAI-Image-2 до топ-3 сигнализирует об улучшениях, хотя до лидеров OpenAI и Google Microsoft еще нужно догонять, и это входит в ее планы.

Microsoft представила MAI-Image-2 генератор изображений

Горячее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Subquadratic утверждает, что решила ключевую проблему больших языковых моделей

Всё больше людей узнают новости от ИИ-чатботов, но доверие остаётся низким

Cursor анонсировал ИИ-модель, Origin и мобильное приложение

Сейчас в тренде