Microsoft выпустила чип Maia 200 для вывода ИИ-моделей. Этот ускоритель создан под нагрузки инференса и дает на 30 процентов выше производительность за доллар по сравнению с чипами текущего поколения в дата-центрах компании. Его произвели по 3-нанометровому техпроцессу TSMC с более чем 140 миллиардами транзисторов и 216 ГБ скоростной памяти.
Компания сообщает, что Maia 200 стал самым мощным собственным чипом среди ведущих облачных провайдеров. По FP4 он в три раза эффективнее Trainium 3 от Amazon, а по FP8-вычислениям опережает TPU v7 от Google — хотя независимые тесты эти показатели еще не проверили.
Maia 200 уже запускает модели GPT 5.2 от OpenAI и Microsoft 365 Copilot. Разработчики, желающие протестировать, могут подать заявку на предварительный доступ к SDK Maia. Пока чип доступен в дата-центре Айовы, за ним последует Аризона. Технические подробности читайте по ссылке.