Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

DeepL осваивает голосовой перевод в реальном времени

DeepL анонсировала инструменты для перевода речи в реальном времени с поддержкой Zoom, Teams, мобильных чатов и групповых сессий по QR-коду. Система адаптируется к терминологии, балансирует задержку и точность, а в будущем перейдет на end-to-end модель. Конкурируют Sanas с изменением акцентов, Camb.AI для видео и Palabra с сохранением голоса.

16 апреля 2026 г.
3 мин
5

Новые инструменты для перевода речи

Компания DeepL, заслужившая популярность благодаря сервисам перевода текста, представила комплекс решений для перевода речи в речь. Эти инструменты подходят для конференций, бесед через мобильные устройства и веб-интерфейсы, а также групповых обсуждений сотрудников на передовой с помощью кастомных приложений. Параллельно DeepL открыла API, благодаря которому разработчики и предприятия могут интегрировать технологию в свои продукты — к примеру, в системы колл-центров.

«Мы долго работали над переводом текста, так что голос стал следующим очевидным направлением», — поделился в беседе с TechCrunch генеральный директор DeepL Ярек Кутыловски. «В области перевода текстов и документов мы достигли серьезных успехов. Однако по-настоящему удобного решения для перевода речи онлайн не существовало».

По словам Кутыловски, основная трудность при разработке такого продукта — достижение равновесия между сокращением задержки (промежутка от произнесенного слова до звучания перевода) и сохранением высокого уровня точности.

Интеграции и сценарии использования

DeepL подготовила расширения для Zoom и Microsoft Teams. В них слушатели получают перевод речи в прямом эфире на своем языке или видят субтитры в реальном времени на экране. Сейчас эта функция доступна в режиме раннего тестирования, и компания принимает заявки от организаций. Отдельно разработано решение для личных или удаленных разговоров через мобильные и веб-приложения.

Участники групповых бесед — например, на обучающих сессиях или семинарах — подключаются по QR-коду.

Система голосового перевода DeepL подстраивается под специальный словарь: она учитывает отраслевые термины, названия компаний и имена людей.

Кутыловски уверен, что ИИ радикально меняет клиентский сервис будущего. Доступный перевод позволяет обслуживать клиентов на языках, где квалифицированных специалистов мало или их услуги стоят дорого.

DeepL полностью контролирует весь процесс обработки голоса. На данный момент речь преобразуется в текст, затем переводится и озвучивается заново. Опыт в текстовом переводе дает преимущество по качеству. В планах — прямая модель end-to-end, которая обойдет текстовый этап.

Конкуренты на рынке

DeepL выходит на арену, где уже действуют несколько стартапов с солидным финансированием. Sanas в прошлом году собрала 65 миллионов долларов от Quadrille Capital и Teleperformance. Ее ИИ меняет акцент операторов колл-центров прямо во время звонка.

Дубайская Camb.AI специализируется на синтезе речи и переводе для медиа- и развлекательных компаний вроде Amazon Web Services. Она помогает озвучивать и локализовать видео массово.

Palabra, поддержанная венчурным фондом Reddit- сооснователя Алексиса Оханиана Seven Seven Six, создает движок для перевода речи онлайн. Он сохраняет как смысл, так и тембр голоса говорящего, что делает ее прямым соперником DeepL.