Обновленный Gemini 2.5 Flash: голос умнее

Gemini 2.5 Flash Native Audio: лучшие голосовые задачи

Google обновил Gemini 2.5 Flash Native Audio, чтобы голосовые помощники лучше брали сложные задачи, точно следовали инструкциям и вели естественные разговоры. В бенчмарке ComplexFuncBench модель обошла gpt-realtime от OpenAI. Обновление доступно в ключевых сервисах Google для тестирования и использования.

17 декабря 2025 г.

1 мин

Обновление Gemini 2.5 Flash Native Audio от Google

Google представил свежую версию модели Gemini 2.5 Flash Native Audio, которая повышает возможности голосовых ассистентов. Теперь она надежнее справляется с многоэтапными процессами, аккуратнее выполняет команды пользователей и ведет диалоги естественнее. Уровень соблюдения указаний разработчиков подскочил с 84% до 90%, а качество многоходовых бесед тоже заметно выросло.

Модель набрала 71,5% точности в обработке вызовов функций по тесту ComplexFuncBench — это опережает показатель gpt-realtime от OpenAI в 66,5%. Однако сравнение, вероятно, проводилось не с самой актуальной realtime-версией, которую OpenAI анонсировал вчера.

Новинка уже развернута в Google AI Studio, Vertex AI, Gemini Live и Search Live. Пользователи Google Cloud активно ее применяют, а разработчики могут протестировать через Gemini API.

Gemini 2.5 Flash Native Audio: лучшие голосовые задачи

Обновление Gemini 2.5 Flash Native Audio от Google

Горячее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Subquadratic утверждает, что решила ключевую проблему больших языковых моделей

Как быстро запустить дата-центр? Дайте ему гибкость в энергопотреблении

Личный ИИ-ассистент на Python: опыт создания с GPT-4o

Сейчас в тренде