Новая модель от Google упорствует на скорость и доступность. Gemini 3 Flash обеспечивает мышление на уровне дорогих аналогов, но стоит гораздо меньше. Главный вопрос: хватит ли этой быстрой и дешевой модели, чтобы вытеснить средние варианты.
Google анонсировал Gemini 3 Flash — свежую модель из линейки Gemini. Компания уверяет: она дает возможности мышления, близкие к большим Gemini 3 Pro, при заметно меньшей стоимости. Разработчики, раньше выбирающим между быстродействием и продвинутыми опциями, теперь получают удобный баланс.
| Модель | Ввод (за 1M токенов) | Вывод (за 1M токенов) |
|---|---|---|
| Gemini 3 Flash | $0.50 | $3.00 |
| Gemini 3 Pro | $2.00 | $12.00 |
| Claude Sonnet 4.5 | $3.00 | $15.00 |
| GPT-5.2 Extra High (OpenAI) | $1.75 | $14.00 |
Разработчики добьются дополнительных экономий с помощью кэширования контекста — оно снижает расходы до 90%, если повторно использовать токены. А batch API дает еще 50% скидку на асинхронные задачи.
По данным анализа от Artificial Analysis, Gemini 3 Flash обходит Gemini 2.5 Pro, работает втрое быстрее и обходится дешевле. Google подчеркивает: даже базовый режим мышления модели часто превосходит максимальные настройки предыдущих версий.
Google Search по всему миру переходит на Gemini 3 Flash
Google установил Gemini 3 Flash как основную модель для AI Mode в поиске, так что она теперь обрабатывает большинство повседневных запросов. Модель лучше распознает намерения пользователей, подтягивает свежие данные и ссылки, а также структурирует ответы с картинками и подсказками. Она справляется с запутанными многоэтапными вопросами — например, с составлением маршрута поездки или быстрым освоением новой темы.
Опубликованные бенчмарки Google демонстрируют: на тесте GPQA Diamond уровня PhD по науке Gemini 3 Flash набирает 90.4%. На Humanity's Last Exam — 33.7% самостоятельно и 43.5% с поиском и инструментами для кода. В математическом AIME 2025 — 95.2% без инструментов и 99.7% с исполнением кода. На кодовом бенчмарке SWE-bench Verified модель достигает 78%, что выше, чем у Gemini 3 Pro, хотя и уступает GPT-5.2 с Claude Opus 4.5.
Для разработчиков важнее надежность на обычных задачах. Google заявляет: модель подстраивает длительность обдумывания под сложность и тратит меньше токенов, чем 2.5 Pro, на типичных нагрузках.
Визуальное мышление и исполнение кода стали лучше
Google отмечает улучшения в визуальном и пространственном мышлении модели, что полезно для анализа видео. Gemini 3 Flash запускает код, чтобы приближать изображения, считать объекты или вносить правки. Чтобы задействовать это, разработчикам нужно активировать «thought signatures» в API или применить новый Interactions API.
Модель доступна в Google AI Studio, Gemini API, Google Antigravity, Gemini CLI и Android Studio. Для бизнеса — через Vertex AI. Google выделяет Gemini CLI как идеальный инструмент для тех, кто много работает в терминале.
Некоторые компании уже интегрируют Gemini 3 Flash. Игровая платформа Astrocade применяет ее для создания полных планов игр и готового кода по одному запросу к модели.
Ник Уолтон из Latitude рассказывает: модель позволяет команде решать сложные задачи в их игровом движке на ИИ без трат на дорогие варианты вроде Sonnet 4.5. Resemble AI использует Gemini 3 Flash для обнаружения дипфейков в реальном времени. По словам компании, анализ мультимодального контента теперь идет в четыре раза быстрее, чем с Gemini 2.5 Pro.
Google недавно запустил режим «Deep Think» для подписчиков Gemini Ultra — он на другом конце шкалы скорости. Модель рассуждает параллельно для трудных задач, но отвечает гораздо медленнее. Такой компромисс ограничивает применение нишевыми сценариями: большинство пользователей не готово ждать улучшенных ответов ИИ, как видно по откату роутера от OpenAI.