речевые-технологии

25 публикаций по теме

речевые-технологии

Amazon тестирует Alexa+ в Индии с поддержкой хинди

Amazon начала бета-тестирование Alexa+ в Индии с поддержкой хинди, приглашая пользователей через закрытую программу. Ассистент на базе генеративного ИИ учится понимать местные нюансы и смешанную речь, чтобы охватить более 600 миллионов носителей языка. Запуск в Индии ожидается, но точные сроки не объявлены.

1 мин

25 июня 2026 г.

Статьи

Лучшие ИИ-приложения для диктовки речи: тест и рейтинг

Рейтинг лучших приложений для диктовки речи на базе ИИ после тестирования: Wispr Flow с кастомными стилями, Willow с фокусом на приватность, Superwhisper для файлов. Каждое предлагает уникальные функции вроде низкой задержки, оффлайн-работы или больших бесплатных лимитов, цены от бесплатных до пожизненных лицензий.

9 мин

2 мая 2026 г.

Статьи

Локальная транскрипция аудио с Faster-Whisper

Гайд по настройке локальной транскрипции аудио с Faster-Whisper, которая в 4 раза быстрее оригинального Whisper и тратит меньше памяти. Описаны установка на CPU/GPU, предобработка файлов pydub+FFmpeg и готовые скрипты для MP3 в текст. Система работает оффлайн, защищая приватность.

Nothing представила ИИ-диктовку Essential Voice

Nothing представила Essential Voice — ИИ-инструмент для голосового ввода текста в любом приложении смартфона. Он удаляет слова-паразиты, поддерживает кастомные шорткаты и перевод на 100+ языков, стартовав на Phone (3). Функция ускоряет набор в четыре раза по сравнению с печатью.

1 мин

24 апреля 2026 г.

Новости

Speechify представила Windows-приложение с локальными моделями

Speechify запустила приложение для Windows с локальными моделями для диктовки, транскрипции и озвучивания текстов на Copilot+ PC. Оно использует VITS Neural, Silero VAD и Whisper, поддерживает 50 млн пользователей. CEO подчеркнул удобство для миллиарда юзеров Windows и корпоративного сектора.

3 мин

31 марта 2026 г.

Новости

Particle: ИИ-приложение выделяет ключевые клипы из подкастов для новостей

Новостное ИИ-приложение Particle от бывших инженеров Twitter запустило Podcast Clips: функция извлекает релевантные фрагменты из подкастов и добавляет их к новостям в ленте. Пользователи слушают клипы или читают подсвеченные транскрипты, а для персоналий вроде Сэма Альтмана собирается персональный фид выступлений. Вышла подписка Particle+ за $2.99/мес с премиум-опциями и версия для Android.

4 мин

23 февраля 2026 г.

Новости

ИИ вернул музыканту голос после БАС

БАС лишил музыканта Патрика Дарлинга голоса, но ИИ от ElevenLabs позволил воссоздать клон по старым записям и вернуться к композициям. С помощью voice clone и музыкального генератора он сочинил песню и впервые за два года выступил на сцене с группой. Технология уже помогает жертвам БМН и других болезней творчески самовыражаться.

4 мин

13 февраля 2026 г.

Новости

Apple использует Gemini для Siri

Apple заключила многолетнюю сделку с Google, чтобы использовать модели Gemini в AI-функциях, включая Siri, из-за накопившихся проблем в ее архитектуре. Компания тратит более миллиарда долларов в год на это партнерство и параллельно разрабатывает собственную модель с триллионом параметров. Такие шаги помогут преодолеть технические ограничения текущей системы Siri.

2 мин

12 января 2026 г.

Новости

Речевой нейроимплант: мужчина с БАС общается с точностью 99%

Кейси Харрелл с БАС почти три года использует речевой мозговой имплант, который декодирует его мысли в слова с точностью 99%. Устройство позволило ему вернуться к работе и общению с семьёй, а исследователи продолжают совершенствовать систему, стремясь восстановить полноценный голос.

3 мин

19 июня 2026 г.

Новости

Открытая Voxtral TTS: синтез речи от Mistral AI

Mistral AI представила Voxtral TTS — открытую модель TTS с 4 млрд параметров для 9 языков. Она клонирует голос за 3 секунды аудио, обеспечивает задержку 70 мс и RTF 9.7x. Подходит для реального времени в агентах, поддержке и локализации.

12 мин

1 мая 2026 г.

Статьи

Устройство SpeakOn для диктовки: плюсы и ограничения

SpeakOn — легкий гаджет на 25 г для голосовой диктовки, крепится к iPhone через MagSafe и работает независимо от микрофона смартфона. Устройство распознает речь в 2 футах, переводит на 12 языков, но страдает от шумов, ограничено iOS и навязчиво редактирует текст. Стоит $129 за 5000 слов в неделю, перспективно при доработках.

5 мин

26 апреля 2026 г.

Новости

DeepL осваивает голосовой перевод в реальном времени

DeepL анонсировала инструменты для перевода речи в реальном времени с поддержкой Zoom, Teams, мобильных чатов и групповых сессий по QR-коду. Система адаптируется к терминологии, балансирует задержку и точность, а в будущем перейдет на end-to-end модель. Конкурируют Sanas с изменением акцентов, Camb.AI для видео и Palabra с сохранением голоса.

3 мин

16 апреля 2026 г.

Новости

Google Translate расширяет Live Translate на iOS

Google Translate расширил функцию Live Translate на iOS и новые страны вроде Германии и Японии, где она работает с любыми наушниками в 70+ языках. В тот же день вышла глобальная версия Search Live для разговорного поиска с камерой в 200+ странах.

2 мин

26 марта 2026 г.

Новости

Wispr Flow представила Android-приложение для ИИ-диктовки

Wispr Flow запустила Android-приложение для ИИ-диктовки с плавающим пузырем для голосового ввода. Оно стало быстрее на 30%, поддерживает 100+ языков и Hinglish, а пользователи уже наговорили 1,3 млн слов. Стартап привлек 81 млн долларов инвестиций при оценке в 700 млн.

3 мин

23 февраля 2026 г.

Новости

Практический тест Bee от Amazon

Bee — носимое ИИ-устройство от Amazon — упрощает запись и анализ бесед, разбивая их на сегменты с краткими пересказами. Оно интегрируется с Google-сервисами для задач, хранит воспоминания и факты о пользователе, но удаляет аудио после обработки и требует разрешения на запись. Пока идея повседневного использования вызывает вопросы о приватности и культурных нормах.

4 мин

13 января 2026 г.

Новости

Subtle выпустила наушники с изоляцией голоса

Стартап Subtle запустил беспроводные наушники Voicebuds с технологией изоляции голоса для звонков и заметок в шумных условиях. Устройство обещает в пять раз меньше ошибок транскрипции, чем AirPods Pro 3 с OpenAI, и интегрируется с iOS-приложением для голосового ввода без клавиш. Доступны предзаказы за 199 долларов с годовой подпиской.

2 мин

4 января 2026 г.

речевые-технологии

Amazon тестирует Alexa+ в Индии с поддержкой хинди

Лучшие ИИ-приложения для диктовки речи: тест и рейтинг

Локальная транскрипция аудио с Faster-Whisper

Nothing представила ИИ-диктовку Essential Voice

Speechify представила Windows-приложение с локальными моделями

Particle: ИИ-приложение выделяет ключевые клипы из подкастов для новостей

ИИ вернул музыканту голос после БАС

Apple использует Gemini для Siri

Речевой нейроимплант: мужчина с БАС общается с точностью 99%

Открытая Voxtral TTS: синтез речи от Mistral AI

Устройство SpeakOn для диктовки: плюсы и ограничения

DeepL осваивает голосовой перевод в реальном времени

Google Translate расширяет Live Translate на iOS

Wispr Flow представила Android-приложение для ИИ-диктовки

Практический тест Bee от Amazon

Subtle выпустила наушники с изоляцией голоса

Сейчас в тренде

Популярные темы