ElevenLabs лидирует в бенчмарке AA-WER v2.0 речи-в-текст

Artificial Analysis выпустил AA-WER v2.0 — обновлённый бенчмарк для речи-в-текст, где Scribe v2 от ElevenLabs лидирует с 2,3% ошибок слов, а Gemini 3 Pro от Google — со 2,9%. Без специального обучения Gemini демонстрирует сильные мультимодальные способности. В тесте для ассистентов лидеры те же, Whisper Large v3 от OpenAI в середине.

Artificial Analysis представил версию 2.0 бенчмарка AA-WER для оценки моделей преобразования речи в текст. Лидером стала Scribe v2 от ElevenLabs с уровнем ошибок слов всего 2,3%. За ней следует Gemini 3 Pro от Google (2,9%) и Voxtral Small от Mistral (3,0%). Почти не отстают Gemini 3 Flash от Google (3,1%) и более ранняя Scribe v1 от ElevenLabs (3,2%). Стоит отметить: Google не настраивал модель специально под транскрипцию — успех обеспечивают универсальные мультимодальные возможности Gemini. Популярная открытая модель Whisper Large v3 от OpenAI занимает средние позиции с 4,2%, а в конце списка оказались Qwen3 ASR Flash от Alibaba (5,9%), Nova 2 Omni от Amazon (6,0%) и Rev AI (6,1%).

Столбчатая диаграмма общего рейтинга AA-WER v2.0 с уровнями ошибок слов от 2,3% (Scribe v2) до 6,1% (Rev AI) — Scribe v2 от ElevenLabs возглавила общий рейтинг AA-WER v2.0 с наименьшим уровнем ошибок слов. За ней — Gemini 3 Pro от Google и Voxtral Small от Mistral. Источник: Artificial Analysis

Такие же тенденции видны в отдельном тесте AA-AgentTalk, где оценивается речь, направленная на голосовые ассистенты: Scribe v2 показывает 1,6%, Gemini 3 Pro — 1,7%, а третье место с 2,3% занимает Universal-3 Pro от AssemblyAI.

Столбчатая диаграмма рейтинга AA-AgentTalk с уровнями ошибок слов от 1,6% (Scribe v2) до 6,1% (Rev AI) — В тесте AA-AgentTalk для голосовых ассистентов Scribe v2 от ElevenLabs и Gemini 3 Pro от Google снова показывают лучшие результаты с минимальными ошибками. Источник: Artificial Analysis

ElevenLabs и Google лидируют в бенчмарке речи-в-текст от Artificial Analysis

Горячее

Тревожный сигнал: реальная цена ИИ от Google и Amazon

Alibaba запрещает сотрудникам использовать Claude Code

Последний экзамен человечества — отвлекающий манёвр?

Gemini Spark от Google теперь доступен на Mac

Anthropic представила Claude Science — ИИ-помощника для учёных

Сейчас в тренде