Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Gemini 2.5 Flash Native Audio: лучшие голосовые задачи

Google обновил Gemini 2.5 Flash Native Audio, чтобы голосовые помощники лучше брали сложные задачи, точно следовали инструкциям и вели естественные разговоры. В бенчмарке ComplexFuncBench модель обошла gpt-realtime от OpenAI. Обновление доступно в ключевых сервисах Google для тестирования и использования.

17 декабря 2025 г.
1 мин
20

Обновление Gemini 2.5 Flash Native Audio от Google

Google представил свежую версию модели Gemini 2.5 Flash Native Audio, которая повышает возможности голосовых ассистентов. Теперь она надежнее справляется с многоэтапными процессами, аккуратнее выполняет команды пользователей и ведет диалоги естественнее. Уровень соблюдения указаний разработчиков подскочил с 84% до 90%, а качество многоходовых бесед тоже заметно выросло.

Модель набрала 71,5% точности в обработке вызовов функций по тесту ComplexFuncBench — это опережает показатель gpt-realtime от OpenAI в 66,5%. Однако сравнение, вероятно, проводилось не с самой актуальной realtime-версией, которую OpenAI анонсировал вчера.

Новинка уже развернута в Google AI Studio, Vertex AI, Gemini Live и Search Live. Пользователи Google Cloud активно ее применяют, а разработчики могут протестировать через Gemini API.