Google представил быструю и недорогую модель Gemini 3 Flash, построенную на базе Gemini 3, о которой объявили в прошлом месяце, чтобы потеснить конкурентов вроде OpenAI. Теперь эта модель стала основной в приложении Gemini и в режиме ИИ для поиска.
С момента анонса Gemini 2.5 Flash прошло полгода, и новая версия показывает заметный прогресс. На тестах Gemini 3 Flash сильно обходит предшественника и в отдельных показателях догоняет лидеров вроде Gemini 3 Pro или GPT-5.2.
Например, без использования инструментов она набрала 33,7% на бенчмарке Humanity’s Last Exam, проверяющем знания по разным областям. Для сравнения: Gemini 3 Pro — 37,5%, Gemini 2.5 Flash — 11%, а свежий GPT-5.2 — 34,5%.
На тесте мультимодальности и рассуждений MMMU-Pro модель лидирует с результатом 81,2%.
Распространение среди пользователей
В приложении Gemini Gemini 3 Flash теперь работает по умолчанию для всех стран, вытеснив Gemini 2.5 Flash. Для задач по математике и программированию можно переключиться на Pro-версию через выбор модели.
Модель круто справляется с разными типами данных: загрузи короткое видео с пиклбола — получи советы, нарисуй набросок — она угадает, что это, или кинь аудиозапись — разберёт или сделает тест.
Она точнее улавливает, чего хочет пользователь, и чаще выдаёт ответы с картинками или таблицами.
С помощью этой модели в Gemini можно генерировать прототипы приложений прямо по текстовым запросам.
Gemini 3 Pro открыли для всех в США в поиске, а модель Nano Banana Pro для изображений стала доступна большему числу американцев.

Доступ для бизнеса и разработчиков
Компании вроде JetBrains, Figma, Cursor, Harvey и Latitude уже применяют Gemini 3 Flash через Vertex AI и Gemini Enterprise.
Разработчикам модель доступна в предварительной версии через API и в Antigravity — новом инструменте для кодинга от Google, запущенном недавно.
Gemini 3 Pro набирает 78% на верифицированном бенчмарке SWE-bench по кодингу, уступая только GPT-5.2. Она подходит для разбора видео, извлечения данных и вопросов по картинкам, а благодаря скорости годится для быстрых повторяющихся задач.

Стоимость: 0,50 доллара за миллион входных токенов и 3 доллара за миллион выходных. Это чуть дороже, чем у Gemini 2.5 Flash (0,30 и 2,50 доллара), но модель быстрее Gemini 2.5 Pro втрое, а на размышления тратит на 30% меньше токенов. В итоге для многих задач выходит экономия.
«Flash мы видим как основную рабочую лошадку. Взгляните на цены в таблице: она дешевле по входу и выходу, что позволяет компаниям обрабатывать большие объёмы», — рассказала Tulsee Doshi, старший директор и глава продукта Gemini Models, в беседе с журналистами.
С запуска Gemini 3 Google ежедневно пропускает через API свыше 1 триллиона токенов в гонке с OpenAI за скорость и качество.
Недавно Сэм Альтман разослал в OpenAI мемо «Code Red» из-за падения трафика ChatGPT на фоне роста доли Google. В ответ OpenAI выкатили GPT-5.2 и новую модель для генерации изображений. Они также отметили рост корпоративного использования: объём сообщений в ChatGPT вырос в 8 раз с ноября 2024 года.
Google не комментировал напрямую соперничество, но подчеркнул, что новые релизы заставляют всех двигаться вперёд.
«В отрасли модели продолжают улучшаться, конкурировать и раздвигать границы. Плюс появляются свежие бенчмарки и методы оценки — это тоже мотивирует», — добавила Doshi.