Анонс нового процессора Maia 200
Microsoft объявила о запуске чипа Maia 200. Компания называет его кремниевым "трудягой", специально созданным для расширения инференса искусственного интеллекта.
Эта модель пришла на смену Maia 100, выпущенной в 2023 году. Она позволяет запускать мощные модели ИИ с большей скоростью и эффективностью. В чипе разместили свыше 100 миллиардов транзисторов. Он обеспечивает более 10 петафлопс в 4-битной точности и примерно 5 петафлопс в 8-битной — это большой шаг вперед по сравнению с прошлой версией.
Что такое инференс и почему его оптимизируют
Инференс — это вычисления для работы готовой модели ИИ, в отличие от ресурсоемкого обучения. Компании в сфере ИИ все чаще тратят на инференс значительную часть бюджета, поэтому появляются новые способы сделать этот процесс дешевле и быстрее.
Microsoft видит в Maia 200 инструмент для такой оптимизации. Он помогает ИИ-проектам работать стабильно, с меньшим расходом энергии.
Один узел Maia 200 без проблем запускает самые крупные модели прямо сейчас и оставляет запас мощности для будущих гигантов, — заявили в компании.
Тренд на собственные чипы среди гигантов
Maia 200 вписывается в общую картину: крупные компании переходят на самодельные процессоры, чтобы меньше зависеть от Nvidia. Графические ускорители Nvidia стали основой успеха многих ИИ-проектов.
Google давно использует TPU — тензорные процессоры. Их не продают отдельно, а предлагают как облачную вычислительную мощность. Amazon недавно представила Trainium3 — ускоритель ИИ от гиганта электронной коммерции. Такие чипы берут на себя часть нагрузки, которую раньше целиком отдавали GPU Nvidia, и снижают общие расходы на железо.
Как Maia 200 конкурирует с альтернативами
Microsoft с Maia 200 бросает вызов этим решениям. Производительность в FP4 у него в три раза выше, чем у Trainium третьего поколения от Amazon. А в FP8 Maia превосходит седьмое поколение TPU от Google.
Maia уже в деле у Microsoft
Чип активно задействован в моделях ИИ от команды Superintelligence компании. Он также обеспечивает работу чат-бота Copilot. Microsoft пригласила разработчиков, исследователей и передовые лаборатории ИИ тестировать свой набор для разработки ПО под Maia 200 в реальных задачах.