Клонирование голоса в Gemini 3 Flash от Google

Google тестирует клонирование голоса в AI Studio на базе Gemini 3 Flash с опцией "Create Your Voice" для записи аудио. Это позволит создавать синтетические голоса из реальных образцов, а обновление декабря 2024 улучшило качество. Появились функции импорта кода из GitHub и обновленный интерфейс главной страницы.

Google разрабатывает возможность клонирования голоса для пользователей AI Studio. Специалисты из TestingCatalog заметили скрытую функцию под названием "Create Your Voice". Она активируется при выборе модели "Flash Native Audio Preview", которая сейчас работает на базе Gemini 2.5 Flash. При клике открывается интерфейс для записи аудио или загрузки файла, но сама опция пока не запускается. Такие находки указывают на то, что компания подводит итоги к запуску встроенной поддержки аудио в Gemini 3 Flash. Благодаря этому разработчики смогут генерировать синтетические голоса, используя образцы реальных записей. Еще в декабре 2024 года вышло обновление для Gemini 2.5 Flash Native Audio, которое повысило качество синтеза речи и сделало модель лучше в выполнении заданий.

Параллельно нашли вариант для загрузки полных наборов кода прямо из репозиториев GitHub. Главная страница сервиса тоже меняется: в скором времени там разделят показ активностей и данных по использованию.

Google готовит клонирование голоса для Gemini 3 Flash

Горячее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Subquadratic утверждает, что решила ключевую проблему больших языковых моделей

Как быстро запустить дата-центр? Дайте ему гибкость в энергопотреблении

Личный ИИ-ассистент на Python: опыт создания с GPT-4o

Сейчас в тренде