Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Microsoft бросает вызов ИИ-соперникам тремя новыми базовыми моделями

Microsoft AI выпустила три базовые модели ИИ: MAI-Transcribe-1 для транскрипции речи на 25 языках, MAI-Voice-1 для генерации аудио и MAI-Image-2 для видео. Они дешевле аналогов от Google и OpenAI, разработаны командой супер-интеллекта под Мустафу Сулемана. Компания сохраняет партнерство с OpenAI, инвестировав более 13 млрд долларов.

2 апреля 2026 г.
3 мин
30

Новые базовые модели ИИ от Microsoft

Лаборатория Microsoft AI поделилась анонсом трех базовых моделей искусственного интеллекта, которые умеют обрабатывать текст, генерировать голос и создавать изображения.

Такой шаг подчеркивает усилия компании по развитию собственного набора мультимодальных моделей ИИ для конкуренции с другими разработчиками, хотя тесные связи с OpenAI никуда не делись.

Возможности моделей

MAI-Transcribe-1 распознает речь на 25 языках и превращает ее в текст — при этом работает в 2,5 раза быстрее сервиса Azure Fast, как указано в пресс-релизе компании. MAI-Voice-1 создает аудиофайлы: она выдает 60 секунд звука всего за секунду и позволяет настроить голос под себя. MAI-Image-2 занимается генерацией видео.

MAI-Image-2 впервые появилась 19 марта в MAI Playground — это платформа для тестирования больших языковых моделей. Теперь все три модели доступны на Microsoft Foundry, а модели для распознавания речи и синтеза голоса интегрированы также в MAI Playground.

Кто стоит за разработкой

Эти модели создала команда MAI Superintelligence — исследовательская группа под руководством Мустафы Сулемана, главы Microsoft AI. Команду собрали и представили публике в ноябре 2025 года.

«В Microsoft AI мы разрабатываем гуманистический ИИ. У нас особый взгляд на создание моделей: человек в центре, оптимизация под реальное общение людей, обучение с учетом практических задач», — написал Сулеман в блоге. «Вскоре ждите от нас новых моделей в Foundry и прямо в продуктах Microsoft».

Преимущества в цене

На фоне насыщенного рынка больших языковых моделей Microsoft делает ставку на более низкие цены по сравнению с предложениями Google и OpenAI, как отметили в блоге.

MAI-Transcribe-1 обойдется от 0,36 доллара в час. MAI-Voice-1 — от 22 долларов за миллион символов. Для MAI-Image-2 входные текстовые токены стоят от 5 долларов за миллион, а выходные изображения — от 33 долларов за миллион токенов.

Партнерство с OpenAI продолжается

Даже запуская собственные разработки, Сулеман в интервью VentureBeat подтвердил верность партнерству с OpenAI. Недавние переговоры по договору дали Microsoft свободу для исследований в области супер-интеллекта, рассказал он The Verge.

Компания вложила свыше 13 миллиардов долларов в лабораторию ИИ и интегрирует ее модели в свои продукты по долгосрочному соглашению. С чипами подход похож: Microsoft делает свои, но продолжает закупки у Nvidia и AMD.