Google выпустила Gemini 3.1 Flash Live для голосового ИИ

Google анонсировала Gemini 3.1 Flash Live — топовую голосовую ИИ-модель с быстрыми откликами и естественными беседами. В тестах Big Bench Audio она набирает 95,9% на высоком уровне мышления и доступна по низкой цене через API и сервисы компании в 200+ странах.

Google представила Gemini 3.1 Flash Live — свою лучшую модель ИИ для голоса и аудио. Она обеспечивает ускоренные ответы, реалистичные диалоги и возможность настройки уровней обработки для разработчиков. Компания отмечает повышенную точность в распознавании тона и эмоций, а также стабильную работу в условиях шума. Теперь эта модель лежит в основе режима реального времени в приложении Gemini.

По данным Artificial Analysis, модель достигает 95,9% на бенчмарке Big Bench Audio при уровне мышления "High", уступая лишь Step-Audio R1.1 Realtime (97,0%) при времени отклика 2,98 секунды. На минимальном уровне "Minimal" точность падает до 70,5%, зато отклик ускоряется до 0,96 секунды.

Результаты Gemini 3.1 Flash Live на Big Bench Audio Benchmark — Gemini 3.1 Flash Live показывает 95,9% на Big Bench Audio при максимальном уровне мышления, немного уступая Step-Audio R1.1 Realtime.

Модель интегрирована в Gemini Live API, Google AI Studio, Gemini Live и Search Live — всего в более чем 200 странах. Стоимость идентична предшественнику Gemini 2.5: 0,35 доллара за час аудиоввода и 1,40 доллара за час аудиовыхода, что относит ее к наиболее бюджетным аудиомоделям ИИ. Модель Step Audio с чуть лучшими показателями дешевле на вводе, но дороже на выводе.

Gemini 3.1 Flash Live — самая естественная голосовая ИИ-модель Google

Горячее

Anthropic открыла офис в Сеуле и новые партнерства в Корее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Личный ИИ-ассистент на Python: опыт создания с GPT-4o

Как быстро запустить дата-центр? Дайте ему гибкость в энергопотреблении

Сейчас в тренде