Google разрабатывает возможность клонирования голоса для пользователей AI Studio. Специалисты из TestingCatalog заметили скрытую функцию под названием "Create Your Voice". Она активируется при выборе модели "Flash Native Audio Preview", которая сейчас работает на базе Gemini 2.5 Flash. При клике открывается интерфейс для записи аудио или загрузки файла, но сама опция пока не запускается. Такие находки указывают на то, что компания подводит итоги к запуску встроенной поддержки аудио в Gemini 3 Flash. Благодаря этому разработчики смогут генерировать синтетические голоса, используя образцы реальных записей. Еще в декабре 2024 года вышло обновление для Gemini 2.5 Flash Native Audio, которое повысило качество синтеза речи и сделало модель лучше в выполнении заданий.
Параллельно нашли вариант для загрузки полных наборов кода прямо из репозиториев GitHub. Главная страница сервиса тоже меняется: в скором времени там разделят показ активностей и данных по использованию.