Обновление Gemini 2.5 Flash Native Audio от Google
Google представил свежую версию модели Gemini 2.5 Flash Native Audio, которая повышает возможности голосовых ассистентов. Теперь она надежнее справляется с многоэтапными процессами, аккуратнее выполняет команды пользователей и ведет диалоги естественнее. Уровень соблюдения указаний разработчиков подскочил с 84% до 90%, а качество многоходовых бесед тоже заметно выросло.
Модель набрала 71,5% точности в обработке вызовов функций по тесту ComplexFuncBench — это опережает показатель gpt-realtime от OpenAI в 66,5%. Однако сравнение, вероятно, проводилось не с самой актуальной realtime-версией, которую OpenAI анонсировал вчера.
Новинка уже развернута в Google AI Studio, Vertex AI, Gemini Live и Search Live. Пользователи Google Cloud активно ее применяют, а разработчики могут протестировать через Gemini API.