Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Gemini 3.1 Flash Live — самая естественная голосовая ИИ-модель Google

Google анонсировала Gemini 3.1 Flash Live — топовую голосовую ИИ-модель с быстрыми откликами и естественными беседами. В тестах Big Bench Audio она набирает 95,9% на высоком уровне мышления и доступна по низкой цене через API и сервисы компании в 200+ странах.

26 марта 2026 г.
2 мин
20

Google представила Gemini 3.1 Flash Live — свою лучшую модель ИИ для голоса и аудио. Она обеспечивает ускоренные ответы, реалистичные диалоги и возможность настройки уровней обработки для разработчиков. Компания отмечает повышенную точность в распознавании тона и эмоций, а также стабильную работу в условиях шума. Теперь эта модель лежит в основе режима реального времени в приложении Gemini.

По данным Artificial Analysis, модель достигает 95,9% на бенчмарке Big Bench Audio при уровне мышления "High", уступая лишь Step-Audio R1.1 Realtime (97,0%) при времени отклика 2,98 секунды. На минимальном уровне "Minimal" точность падает до 70,5%, зато отклик ускоряется до 0,96 секунды.

Результаты Gemini 3.1 Flash Live на Big Bench Audio Benchmark
Gemini 3.1 Flash Live показывает 95,9% на Big Bench Audio при максимальном уровне мышления, немного уступая Step-Audio R1.1 Realtime.

Модель интегрирована в Gemini Live API, Google AI Studio, Gemini Live и Search Live — всего в более чем 200 странах. Стоимость идентична предшественнику Gemini 2.5: 0,35 доллара за час аудиоввода и 1,40 доллара за час аудиовыхода, что относит ее к наиболее бюджетным аудиомоделям ИИ. Модель Step Audio с чуть лучшими показателями дешевле на вводе, но дороже на выводе.