Google совершенствует свою модель генерации изображений, добавляя расширенные возможности редактирования, поддержку повышенных разрешений, улучшенное отображение текста и функцию поиска в интернете.
Новая модель, получившая название Nano Banana Pro, разработана на базе последней большой языковой модели Google — Gemini 3, которая вышла в свет на этой неделе. По утверждению компании, Nano Banana Pro превосходит предыдущую версию Nano Banana за счет создания более детализированных изображений, точного текста, а также генерации текста в разнообразных стилях, шрифтах и языках.

Модель обладает возможностями поиска в сети, что позволяет, например, запросить рецепт и сгенерировать карточки для запоминания.
Google подчеркивает, что Nano Banana Pro ориентирована на предоставление специалистам большего контроля над изображениями, включая управление углами камеры, освещением сцены, глубиной резкости, фокусировкой и цветокоррекцией. В отличие от ограничения Nano Banana в 1024 x 1024 пикселей, с Nano Banana Pro можно создавать изображения в 2K или 4K.
Компания отметила, что хотя Nano Banana Pro обеспечивает более высокое качество, она работает медленнее и дороже предшественницы, где стоимость составляла 0,039 доллара за изображение 1024 пикселей. Новая модель обходится в 0,139 доллара за 1080p или 2K изображение и 0,24 доллара за 4K.

Новая модель способна использовать шесть снимков высокого качества или комбинировать до 14 объектов в одном изображении. Она также сохраняет последовательность и сходство до пяти человек. Компания выпустила демонстрационное приложение, где можно протестировать эти функции.
Nano Banana Pro внедряется в множество существующих инструментов ИИ от Google. Приложение Gemini теперь по умолчанию применяет новую модель для создания изображений, но пользователи бесплатной подписки смогут генерировать ограниченное количество изображений, после чего перейдут на исходную Nano Banana.
Подписчики Google AI Plus, Pro и Ultra получат повышенные лимиты генерации, хотя точные значения не раскрыты. Эти пользователи также смогут использовать модель в Notebook LM.
Google интегрирует модель в поиск через режим ИИ для подписчиков Pro и Ultra в США. Подписчики Ultra имеют доступ к ней в видео-инструменте компании Flow, а также для клиентов Workspace — в Google Slides и Vids.
Разработчики могут применять Nano Banana Pro через API Gemini, Google AI Studio и новую IDE компании Antigravity.
Кроме того, компания внедряет SynthID — технологию для водяных знаков и обнаружения изображений, созданных ИИ, — в приложение Gemini. Пользователи могут загрузить изображение, и чат-бот сообщит, было ли оно создано или изменено моделями изображений компании.
Google не уточнила, планирует ли поддерживать другие стандарты водяных знаков для ИИ, такие как C2PA.