Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Inception Labs представила Mercury 2 — первую модель рассуждений на диффузии

Стартап Inception Labs представил Mercury 2 — первую модель ИИ для рассуждений на диффузии, которая генерирует 1009 токенов/с с задержкой 1,7 с на Nvidia Blackwell и стоит в 2–4 раза дешевле Gemini 3 Flash и Claude Haiku 4.5. Качество на уровне лидеров, поддержка 128K контекста, инструментов и JSON. Это часть тренда на поиск альтернатив Transformer.

24 февраля 2026 г.
3 мин
30

Стартап Inception Labs выпустил первую модель ИИ для рассуждений на основе диффузии. Она работает быстро и стоит недорого.

В отличие от стандартных языковых моделей, которые проходят по тексту слово за словом, Mercury 2 дорабатывает сразу несколько блоков текста. Создатели сравнивают подход с редактором, который смотрит на весь черновик целиком, а не ковыряется в отдельных словах.

Пока что ключевые плюсы — это скорость и низкая цена. На GPU Nvidia Blackwell модель выдает 1009 токенов в секунду при полной задержке всего 1,7 секунды. Для сравнения: Gemini 3 Flash тратит 14,4 секунды, а Claude Haiku 4.5 с рассуждениями — 23,4 секунды. По качеству выход близок к лидерам среди быстрых моделей, уверяют в компании.

Цена — 0,25 доллара за миллион входных токенов и 0,75 доллара за миллион выходных. По входу это вдвое дешевле Gemini 3 Flash (0,50/3,00 доллара), а по выходу — вчетверо. С Claude Haiku 4.5 (1,00/5,00 доллара) вход вчетверо доступнее, выход — более чем вдвое.

МодельЗадержка E2E (с)GPQA DiamondLCBSciCodeIFBenchAIMETAU
Mercury 21.7746738719153
GPT-5 Nano (Minimal)4.5434729332726
Claude 4.5 Haiku (Non-Reasoning)5.0655134423933
Gemini 2.5 Flash-Lite (Reasoning)7.8715929536931
Gemini 3 Flash (Reasoning)14.4909151787880
Gemini 2.5 Flash (Reasoning)15.6796939505732
GPT-5 Mini (Medium)22.8806941714871
Claude 4.5 Haiku (Reasoning)23.4676243548455

Модель поддерживает контекст в 128K токенов, работу с инструментами и вывод в формате JSON. Inception нацеливается на бизнес с приложениями, чувствительными к задержкам: голосовые помощники, инструменты для программирования, поисковые системы.

Mercury 2 уже работает через API, совместимый с OpenAI.

Индустрия ИИ ищет замену архитектуре Transformer

В ноябре Inception собрала 50 миллионов долларов от инвесторов вроде Microsoft, Nvidia и Snowflake. В начале 2025 года стартап показал первый прототип. Mercury 2 — это готовая к бою версия с полноценными рассуждениями.

Google DeepMind тоже пробует языковые модели на диффузии. Gemini Diffusion дотянула до уровня Gemini 2.0 Flash Lite в бенчмарках. Но после премьеры в мае 2025 года от Google тишина.

Шире смотря, множество стартапов роет альтернативы главной архитектуре Transformer. Выживут ли диффузионные языковые модели в перспективе — покажет время.