Google подготовил подробное руководство по моделям Nano Banana для создания изображений, где описаны отличия между всеми тремя вариантами и даны советы по их применению.
В гайде акцент сделан на недавно вышедшую Nano Banana 2 на базе Gemini 3.1 Flash Image. Теперь в линейке три модели, и документ помогает разработчикам с креативщиками подобрать нужный вариант под задачу.
Nano Banana 2 покрывает большинство сценариев дешевле Pro
По словам Google, Nano Banana 2 достигает примерно 95% возможностей более дорогой Nano Banana Pro, но при существенно меньших расходах. Поэтому NB2 предлагают использовать по умолчанию в новых проектах.
| Разрешение | Nano Banana 2 (Gemini 3.1 Flash) | Nano Banana Pro (Gemini 3 Pro) |
|---|---|---|
| 0.5K | 0.045 USD | - |
| 1K | 0.067 USD | 0.134 USD |
| 2K | 0.101 USD | 0.134 USD |
| 4K | 0.151 USD | 0.240 USD |
Модель Pro оправдана только для очень сложных многоуровневых запросов или строгих логических условий, где NB2 не справляется. При этом Google подчеркивает, что Nano Banana Pro остается сильнейшей в семействе.
Старая Nano Banana 1 по-прежнему самая доступная и скоростная, поскольку не использует режим мышления, но для свежих проектов ее не советуют. Принудительного перехода пока нет, старые процессы работают стабильно. Для новых конвейеров, где нужна большая детализация, отслеживание запросов или свежие функции вроде заземления, лучше выбрать NB2. Полезный момент: при разрешении 512 пикселей NB2 стоит столько же, сколько NB1.
Nano Banana 2 находит референсные изображения в сети перед генерацией
Ключевой новинкой Nano Banana 2 стало визуальное заземление через Google Search. Nano Banana Pro уже умела брать текстовые данные из сети, но NB2 шагнула дальше: теперь модель ищет реальные фото объектов для понимания их вида перед созданием.
Эта функция особенно эффективна для точных локаций вроде церквей, мостов или площадей, а также конкретных видов животных и растений. В гайде приводят пример церкви в Voiron во Франции и различия между двумя видами бабочек. Поиск изображений не применяется к людям.

Пока функция доступна только через API, не в приложении Gemini. Подробности реализации есть в документации и Python-ноутбуке Colab из официального кулинарного сборника.
Новые разрешения и пропорции экономят ресурсы и расширяют возможности
Nano Banana 2 генерирует изображения в 512 пикселей, что ускоряет процесс и уравнивает цены с Nano Banana 1. Google советует многоэтапный подход: через batch API с 50-процентной скидкой создавать десятки вариантов в 512px, а потом масштабировать удачные до 1K, 2K или 4K.
NB2 также работает с экстремальными пропорциями 1:8 и 1:4 в портретной и альбомной ориентациях. Такие форматы годятся для баннеров сайтов, бесконечной прокрутки или комиксов в стиле франко-бельгийской школы. Ниже таблица возможностей моделей.
| Характеристика | Nano Banana 2 (Gemini 3.1 Flash Image) | Nano Banana Pro (Gemini 3 Pro Image) |
|---|---|---|
| Макс. входных токенов | 131.072 | 65.536 |
| Макс. выходных токенов | 32.768 | 32.768 |
| Разрешения | 0.5K (512px), 1K, 2K, 4K | 1K, 2K, 4K |
| Пропорции | 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9, 1:4, 4:1, 1:8, 8:1 | 1:1, 3:2, 2:3, 3:4, 4:3, 4:5, 5:4, 9:16, 16:9, 21:9 |
| Текстовое заземление (поиск в сети) | Yes | Yes |
| Визуальное заземление (поиск изображений) | Yes | No |
| Входные изображения | До 14 референсов (PNG, JPEG, WebP, HEIC, HEIF) | До 14 референсов (PNG, JPEG, WebP, HEIC, HEIF) |
| Входные документы | Текст и PDF (макс. 50 MB через API, 7 MB через Console) | Текст и PDF (макс. 50 MB через API, 7 MB через Console) |
| Выход | Текст и изображения | Текст и изображения |
| База знаний | Статус на январь 2025 | Статус на январь 2025 |
| Поиск в сети в реальном времени | Yes | Yes |
| Стандарты безопасности | C2PA content credentials, SynthID watermark | C2PA content credentials, SynthID watermark |
Google также рекомендует отключать режим мышления по умолчанию для Nano Banana, так как он только увеличивает время и затраты при обычной генерации изображений. Включать стоит лишь в трех ситуациях: если результаты бессмысленные, для сложных инфографики или при комбинации визуального заземления с пространственным анализом.