С помощью Gemini 3.1 Pro Google усиливает базовый интеллект всей линейки моделей. На сложном тесте по мышлению результаты выросли более чем вдвое по сравнению с предыдущей версией. Однако тесты остаются лишь тестами.
Google анонсировал Gemini 3.1 Pro — развитие семейства Gemini 3, которое дает большой шаг вперед в решении задач. Версия в предварительном доступе уже развертывается для разработчиков, бизнеса и конечных пользователей.
Модель обеспечивает повышенный базовый интеллект, аналогичный тому, что лежит в основе Gemini 3 Deep Think, обновленного неделю назад. Deep Think решает сложные вопросы в науке, исследованиях и инженерии, а 3.1 Pro делает эти возможности доступными для рутинных сценариев, как отмечает команда Gemini в блоге.
3.1 Pro сочетает продвинутое мышление с простотой: она преодолевает разрыв между сложными API и удобным интерфейсом. В качестве примера компания приводит живую панель аэрокосмических данных, где модель сама подключила публичный поток телеметрии и показала орбиту Международной космической станции.
Среди других примеров — создание анимированных SVG по текстовому описанию для вставки на сайты или сборка полноценных веб-страниц чисто из кода.
Мышление на ARC-AGI-2 улучшилось более чем вдвое
Самый заметный прогресс виден на ARC-AGI-2 — тесте на абстрактную логику: Gemini 3.1 Pro набирает 77,1%, что более чем вдвое превышает 31,1% у Gemini 3 Pro. По данным Google, Anthropic Opus 4.6 отстает с 68,8%, а OpenAI GPT-5.2 — с 52,9%. Некоторые другие системы показывают еще выше, но без переворота в мире ИИ.
3.1 Pro лидирует почти везде: GPQA Diamond по научным знаниям — 94,3%, MCP Atlas — 69,2%, BrowseComp — 85,9%. На SWE-Bench Verified для кодинга с агентами — 80,6%, почти наравне с Opus 4.6 (80,8%). В LiveCodeBench Pro модель достигла Elo 2887, обогнав Gemini 3 Pro (2439) и GPT-5.2 (2393).
Тем не менее, не все идеально. На мультимодальном MMMU Pro предшественник Gemini 3 Pro чуть лучше — 81,0% против 80,5%. А на Humanity's Last Exam с поддержкой инструментов лидирует Opus 4.6 с 53,1%. Модели Google часто уступают в эффективном использовании инструментов по сравнению с OpenAI и Anthropic.
Бенчмарки отражают лишь часть картины, особенно при небольших обновлениях вроде перехода от 3.0 к 3.1. Лучше проверять модели на своих запросах, где заранее известен идеальный результат и поведение старых версий — так проще увидеть прогресс.
Запуск на всех фронтах с гибким ценообразованием
3.1 Pro сразу выходит на множество платформ. Разработчики найдут ее в Gemini API, Google AI Studio, Gemini CLI, платформе для агентов Google Antigravity и Android Studio. Бизнесу — через Vertex AI и Gemini Enterprise. Обычным пользователям — в приложении Gemini и NotebookLM, но последнему только для подписок Pro и Ultra.
Цены API зависят от длины промта и совпадают с Gemini 3 Pro — заметно ниже, чем у Opus от Anthropic.
| Категория | До 200 000 токенов | Свыше 200 000 токенов |
|---|---|---|
| Ввод | $2.00 / 1M токенов | $4.00 / 1M токенов |
| Вывод | $12.00 / 1M токенов | $18.00 / 1M токенов |
| Кэширование | $0.20 / 1M токенов | $0.40 / 1M токенов |
| Хранение кэша | $4.50 / 1M токенов в час | $4.50 / 1M токенов в час |
| Поиск | 5000 промтов/месяц бесплатно, затем $14.00 / 1000 запросов |
Пока это preview-версия. Google продолжит ее дорабатывать по отзывам пользователей, особенно для сложных сценариев с агентами, перед полным релизом.