GPT-Image 1.5 от OpenAI: на равных с Nano Banana Pro

OpenAI выпустила GPT-Image 1.5 — обновление для ChatGPT, которое точнее следует промтам, лучше редактирует изображения и работает быстрее. Модель сравнялась по качеству с Nano Banana Pro от Google на сложных тестах, а цены в API даже снизились. Теперь она доступна всем пользователям и разработчикам.

OpenAI заявляет, что свежая GPT-Image 1.5 лучше понимает запросы, точнее сохраняет детали и создает картинки заметно быстрее.

Компания OpenAI представила GPT-Image 1.5 — обновление с ключевыми улучшениями: точнее следует инструкциям из промта, лучше держит мелкие детали и работает в разы шустрее предшественника.

Скорость генерации выросла до четырехкратной, а пользователи могут ставить в очередь новые запросы, пока предыдущие обрабатываются. Модель уже доступна всем владельцам ChatGPT и через API.

Смотреть демонстрационное видео генерации изображения собаки

CEO приложения OpenAI Fidji Simo назвала новую генерацию картинок частью большого перехода: ChatGPT эволюционирует от простого текстового ответчика к полноценному генеративному интерфейсу, который подбирает нужные инструменты под задачу пользователя.

Правки в изображениях стали стабильнее по свету, композиции и лицам

Обновленная модель иначе подходит к редактированию фото. Она вносит точечные изменения, не трогая остальное, и лучше сохраняет единый стиль освещения, композицию и черты лиц по сравнению с прошлой версией. OpenAI подчеркивает: теперь можно добавлять, убирать, склеивать, смешивать или переставлять элементы изображения.

Такие возможности подходят для правки снимков, виртуальной примерки одежды или причесок, преобразования стиля. В примерах компании — слияние нескольких людей и собаки с разных фото в единую сцену или превращение обычного кадра в постер в духе голливудской классики.

Сложные промты модель выполняет куда точнее

Новинка явно лучше справляется с подробными инструкциями. OpenAI протестировала ее на сетке 6 x 6, где каждая ячейка требовала конкретного объекта, — старая версия ошиблась в расстановке, а новая все разместила верно. Это упрощает создание композиций, где позиция элементов критична.

Рендеринг текста тоже шагнул вперед: модель выводит мелкий и плотный шрифт, так что читаемы выдержки из статей, небольшие таблицы или инфографика с цифрами. Правда, OpenAI признает слабости — длинные фрагменты текста, редкие шрифты, несколько лиц на снимке или генерация на других языках пока даются тяжело.

Мы проверили свой бенчмарк — сложную фотореалистичную сцену с необычным поворотом: лошадь верхом на астронавте, концепция, которой модели точно не видели в обучении. Предыдущие поколения буксовали, но свежие, включая Flux 2, справляются лучше. GPT-Image 1.5 показывает результаты на уровне Nano Banana Pro от Google и сильно обходит прошлую итерацию.

Первое впечатление: картинки от ChatGPT выглядят насыщеннее, чем у Nano Banana Pro от Google. С одинаковым промтом последняя склонна к буквальному толкованию и бытовому фото, а не к студийному лоску. Впрочем, это может зависеть от формулировки запроса.

Цены в API снизились на 20%, хотя качество выросло

Разработчики подключают модель как GPT Image 1.5 через API. OpenAI снизила стоимость ввода и вывода изображений на 20% по сравнению с прошлой. Тарифы: 8 долларов за миллион токенов ввода и 32 доллара за вывод для картинок, для текста — 5 долларов ввода и 10 долларов вывода на миллион токенов. У предшественника GPT-1 цена на изображения варьировалась от 0,02 до 0,19 цента за штуку в зависимости от качества.

Модель лучше фиксирует логотипы брендов и визуальные элементы, что полезно для маркетинга и онлайн-торговли. Старая версия генератора изображений для ChatGPT осталась доступна как кастомный GPT.

Новая модель изображений OpenAI сравнялась с Nano Banana Pro

Правки в изображениях стали стабильнее по свету, композиции и лицам

Сложные промты модель выполняет куда точнее

Цены в API снизились на 20%, хотя качество выросло

Горячее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Как быстро запустить дата-центр? Дайте ему гибкость в энергопотреблении

Subquadratic утверждает, что решила ключевую проблему больших языковых моделей

Личный ИИ-ассистент на Python: опыт создания с GPT-4o

Сейчас в тренде