Gemini 3.1 Pro от Google удвоил логику на ARC-AGI-2

С помощью Gemini 3.1 Pro Google усиливает базовый интеллект всей линейки моделей. На сложном тесте по мышлению результаты выросли более чем вдвое по сравнению с предыдущей версией. Однако тесты остаются лишь тестами.

Google анонсировал Gemini 3.1 Pro — развитие семейства Gemini 3, которое дает большой шаг вперед в решении задач. Версия в предварительном доступе уже развертывается для разработчиков, бизнеса и конечных пользователей.

Модель обеспечивает повышенный базовый интеллект, аналогичный тому, что лежит в основе Gemini 3 Deep Think, обновленного неделю назад. Deep Think решает сложные вопросы в науке, исследованиях и инженерии, а 3.1 Pro делает эти возможности доступными для рутинных сценариев, как отмечает команда Gemini в блоге.

3.1 Pro сочетает продвинутое мышление с простотой: она преодолевает разрыв между сложными API и удобным интерфейсом. В качестве примера компания приводит живую панель аэрокосмических данных, где модель сама подключила публичный поток телеметрии и показала орбиту Международной космической станции.

Среди других примеров — создание анимированных SVG по текстовому описанию для вставки на сайты или сборка полноценных веб-страниц чисто из кода.

Мышление на ARC-AGI-2 улучшилось более чем вдвое

Самый заметный прогресс виден на ARC-AGI-2 — тесте на абстрактную логику: Gemini 3.1 Pro набирает 77,1%, что более чем вдвое превышает 31,1% у Gemini 3 Pro. По данным Google, Anthropic Opus 4.6 отстает с 68,8%, а OpenAI GPT-5.2 — с 52,9%. Некоторые другие системы показывают еще выше, но без переворота в мире ИИ.

3.1 Pro лидирует почти везде: GPQA Diamond по научным знаниям — 94,3%, MCP Atlas — 69,2%, BrowseComp — 85,9%. На SWE-Bench Verified для кодинга с агентами — 80,6%, почти наравне с Opus 4.6 (80,8%). В LiveCodeBench Pro модель достигла Elo 2887, обогнав Gemini 3 Pro (2439) и GPT-5.2 (2393).

Тем не менее, не все идеально. На мультимодальном MMMU Pro предшественник Gemini 3 Pro чуть лучше — 81,0% против 80,5%. А на Humanity's Last Exam с поддержкой инструментов лидирует Opus 4.6 с 53,1%. Модели Google часто уступают в эффективном использовании инструментов по сравнению с OpenAI и Anthropic.

Бенчмарки отражают лишь часть картины, особенно при небольших обновлениях вроде перехода от 3.0 к 3.1. Лучше проверять модели на своих запросах, где заранее известен идеальный результат и поведение старых версий — так проще увидеть прогресс.

Запуск на всех фронтах с гибким ценообразованием

3.1 Pro сразу выходит на множество платформ. Разработчики найдут ее в Gemini API, Google AI Studio, Gemini CLI, платформе для агентов Google Antigravity и Android Studio. Бизнесу — через Vertex AI и Gemini Enterprise. Обычным пользователям — в приложении Gemini и NotebookLM, но последнему только для подписок Pro и Ultra.

Цены API зависят от длины промта и совпадают с Gemini 3 Pro — заметно ниже, чем у Opus от Anthropic.

Категория	До 200 000 токенов	Свыше 200 000 токенов
Ввод	$2.00 / 1M токенов	$4.00 / 1M токенов
Вывод	$12.00 / 1M токенов	$18.00 / 1M токенов
Кэширование	$0.20 / 1M токенов	$0.40 / 1M токенов
Хранение кэша	$4.50 / 1M токенов в час	$4.50 / 1M токенов в час
Поиск	5000 промтов/месяц бесплатно, затем $14.00 / 1000 запросов

Пока это preview-версия. Google продолжит ее дорабатывать по отзывам пользователей, особенно для сложных сценариев с агентами, перед полным релизом.

Google выпустил Gemini 3.1 Pro с удвоенной логикой

Мышление на ARC-AGI-2 улучшилось более чем вдвое

Запуск на всех фронтах с гибким ценообразованием

Горячее

Возможности OpenCode + Ollama + Qwen3-Coder локально

Краткий курс по ComfyUI для новичков

Топ-5 API-провайдеров открытых ИИ-моделей

Генератор видео ChatUp AI без цензуры: ключевые возможности

Топ-7 открытых моделей OCR

Сейчас в тренде