Alibaba представила Qwen-Image-2512 — обновление модели для генерации изображений по текстовому описанию. Разработчики утверждают, что свежая версия точнее воспроизводит людей: лица выходят с повышенной детализацией, без характерного искусственного блеска прошлых итераций.
Качество текста на картинках тоже подтянули — теперь он четче отображается в инфографике или слайдах презентаций. Пейзажи, мех животных и прочие элементы природы стали выглядеть естественнее и богаче деталями.
Более 10 тысяч слепых сравнений на платформе AI Arena от Alibaba поставили Qwen-Image-2512 на четвертое место в общем рейтинге — и на первое среди открытых моделей, по данным компании. Она опередила такие открытые проекты, как HunyuanImage-3.0, Z-image и Flux.2.
Скачать Qwen-Image-2512 можно на Hugging Face или ModelScope, а опробовать прямо в браузере — через Qwen Chat. Все технические детали описаны в техническом отчете и на блоге проекта.