Команда сверхинтеллекта Microsoft представила дебютный продукт: MAI-Image-2, инструмент для создания изображений из текста, который интегрируется в сервисы компании и вскоре станет доступен через API.
Под руководством Мустафы Сулемана разработчики выпустили модель ИИ, преобразующую текстовые запросы в картинки. Сейчас она занимает третью строчку в лидерборде Arena.ai среди генераторов изображений из текста, заметно уступая GPT-Image-1.5 от OpenAI и Nano Banana 2 от Google.
Microsoft подчеркивает сильные стороны MAI-Image-2 в генерации правдоподобных фотографий с реалистичным освещением и верными оттенками кожи. Модель уверенно справляется как с сложными детализированными сюжетами, так и с сюрреалистичными композициями. Над ней работали фотографы, дизайнеры и визуальные художники.

MAI-Image-2 демонстрирует хорошие результаты в повседневных сценариях, например, четко воспроизводит текст на постерах, инфографике или схемах.

Протестировать модель можно в MAI Playground — доступность зависит от региона. Скоро она появится в Copilot и Bing Image Creator. API пока открыт только для отдельных корпоративных клиентов, но через Microsoft Foundry его получат все разработчики. Детали о архитектуре, стоимости и данных для обучения компания не раскрыла.
В октябре 2025 года Microsoft запустила первую внутреннюю модель MAI-Image-1. Та стартовала на девятом месте в Arena.ai и не привлекла внимания. Прорыв MAI-Image-2 до топ-3 сигнализирует об улучшениях, хотя до лидеров OpenAI и Google Microsoft еще нужно догонять, и это входит в ее планы.