Speechify изначально служил инструментом для прослушивания статей, PDF-файлов и документов. Теперь компания внедряет в свое расширение для Chrome возможности распознавания речи, включая голосовой ввод текста и ассистента, который отвечает на вопросы.
За последние 12 месяцев рынок заполнился инструментами распознавания голоса благодаря прогрессу в моделях речи. Speechify присоединяется к этому тренду и запускает свой инструмент диктовки с поддержкой английского языка. Как и в других подобных сервисах, голосовой ввод от Speechify исправляет ошибки и убирает слова-паразиты.
В ходе краткого тестирования, длившегося чуть больше суток, стало ясно, что у инструмента Speechify есть пространство для доработки. Он нормально функционирует в Gmail и Google Docs, но на платформах вроде WordPress возникают проблемы с активацией диктовки и ее стабильной работой. Представители компании отметили, что оптимизация для популярных сайтов происходит поэтапно.

По части точности уровень ошибок в словах оказался выше, чем у альтернатив вроде Wispr Flow, Willow и Monologue. В Speechify объяснили, что их модель быстро адаптируется при регулярном использовании, и количество ошибок со временем снижается.
Стартап также представляет разговорного голосового ассистента, который размещается в боковой панели браузера. С его помощью можно задавать вопросы о содержимом сайта, например: "Какие три главных идеи?" или "Объясни проще".
Хотя ChatGPT и Gemini предлагают режимы разговора, Speechify подчеркивает, что в их приложениях голосовая функция часто кажется вторичной. По мнению разработчиков, в ChatGPT и Gemini чат остается основным интерфейсом, а голос — дополнительным элементом.
"Мы уверены, что чат всегда будет стандартным опытом для пользователей ChatGPT и Gemini при запуске приложений. Именно этого ожидают их аудитории. Голос в таких случаях остается на втором плане — и порой просто дополнением для ChatGPT и Gemini. За годы работы над Speechify мы убедились: значительная часть рынка, включая наших пользователей, предпочитает голос как основной режим по умолчанию при каждом взаимодействии с ИИ", — поделился с TechCrunch по email Рохан Павулури, главный бизнес-офицер компании.
Один из недостатков — ассистент Speechify пока не совместим с браузерами, у которых уже есть встроенные боковые панели, такие как Atlas от OpenAI, Comet от Perplexity и Dia. Однако в стартапе не видят в этом большой проблемы, поскольку расширение ориентировано прежде всего на Chrome с его огромной аудиторией.
Speechify намерена постепенно интегрировать голосовой ввод и ассистента во все свои приложения для десктопа и мобильных устройств.
Кроме того, компания планирует создать агентов, которые будут выполнять задачи от имени пользователя. Полный план не раскрыт, но приведен пример: звонки для записи на прием или ожидание на линии в службе поддержки. Подобные цели преследуют и другие фирмы, такие как Truecaller и Cloaked.