Gemini 3 Flash от Google: новый лидер в скорости и тестах

Google представил быструю и недорогую модель Gemini 3 Flash, построенную на базе Gemini 3, о которой объявили в прошлом месяце, чтобы потеснить конкурентов вроде OpenAI. Теперь эта модель стала основной в приложении Gemini и в режиме ИИ для поиска.

С момента анонса Gemini 2.5 Flash прошло полгода, и новая версия показывает заметный прогресс. На тестах Gemini 3 Flash сильно обходит предшественника и в отдельных показателях догоняет лидеров вроде Gemini 3 Pro или GPT-5.2.

Например, без использования инструментов она набрала 33,7% на бенчмарке Humanity’s Last Exam, проверяющем знания по разным областям. Для сравнения: Gemini 3 Pro — 37,5%, Gemini 2.5 Flash — 11%, а свежий GPT-5.2 — 34,5%.

На тесте мультимодальности и рассуждений MMMU-Pro модель лидирует с результатом 81,2%.

Распространение среди пользователей

В приложении Gemini Gemini 3 Flash теперь работает по умолчанию для всех стран, вытеснив Gemini 2.5 Flash. Для задач по математике и программированию можно переключиться на Pro-версию через выбор модели.

Модель круто справляется с разными типами данных: загрузи короткое видео с пиклбола — получи советы, нарисуй набросок — она угадает, что это, или кинь аудиозапись — разберёт или сделает тест.

Она точнее улавливает, чего хочет пользователь, и чаще выдаёт ответы с картинками или таблицами.

С помощью этой модели в Gemini можно генерировать прототипы приложений прямо по текстовым запросам.

Gemini 3 Pro открыли для всех в США в поиске, а модель Nano Banana Pro для изображений стала доступна большему числу американцев.

Результаты Gemini 3 Flash на бенчмарке SWE-bench — Автор изображения: Google

Доступ для бизнеса и разработчиков

Компании вроде JetBrains, Figma, Cursor, Harvey и Latitude уже применяют Gemini 3 Flash через Vertex AI и Gemini Enterprise.

Разработчикам модель доступна в предварительной версии через API и в Antigravity — новом инструменте для кодинга от Google, запущенном недавно.

Gemini 3 Pro набирает 78% на верифицированном бенчмарке SWE-bench по кодингу, уступая только GPT-5.2. Она подходит для разбора видео, извлечения данных и вопросов по картинкам, а благодаря скорости годится для быстрых повторяющихся задач.

Сравнение эффективности токенов Gemini 3 Flash — Автор изображения: Google

Стоимость: 0,50 доллара за миллион входных токенов и 3 доллара за миллион выходных. Это чуть дороже, чем у Gemini 2.5 Flash (0,30 и 2,50 доллара), но модель быстрее Gemini 2.5 Pro втрое, а на размышления тратит на 30% меньше токенов. В итоге для многих задач выходит экономия.

«Flash мы видим как основную рабочую лошадку. Взгляните на цены в таблице: она дешевле по входу и выходу, что позволяет компаниям обрабатывать большие объёмы», — рассказала Tulsee Doshi, старший директор и глава продукта Gemini Models, в беседе с журналистами.

С запуска Gemini 3 Google ежедневно пропускает через API свыше 1 триллиона токенов в гонке с OpenAI за скорость и качество.

Недавно Сэм Альтман разослал в OpenAI мемо «Code Red» из-за падения трафика ChatGPT на фоне роста доли Google. В ответ OpenAI выкатили GPT-5.2 и новую модель для генерации изображений. Они также отметили рост корпоративного использования: объём сообщений в ChatGPT вырос в 8 раз с ноября 2024 года.

Google не комментировал напрямую соперничество, но подчеркнул, что новые релизы заставляют всех двигаться вперёд.

«В отрасли модели продолжают улучшаться, конкурировать и раздвигать границы. Плюс появляются свежие бенчмарки и методы оценки — это тоже мотивирует», — добавила Doshi.

Google выпустил Gemini 3 Flash как основной в Gemini

Распространение среди пользователей

Доступ для бизнеса и разработчиков

Горячее

5 лёгких и безопасных альтернатив OpenClaw для ИИ-агентов

Claude Cowork уязвим к краже файлов

Знакомство со Stickerbox: ИИ для детских стикеров

Топ-7 планов для вайб-кодинга

Топ-5 API-провайдеров открытых ИИ-моделей

Сейчас в тренде