Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Новый бенчмарк DeepImageSearch проверяет ИИ на поиск фото в личных коллекциях по контексту из нескольких снимков. Текущие модели дают 10–14% точности, лучшие с инструментами — до 29%, проблема в планировании поиска. DISBench с 122 запросами и 109 тыс. фото доступен публично.
Немецкоязычная Википедия ввела строгий запрет на контент от ИИ после голосования сообщества, в отличие от более мягких подходов в других версиях и у Фонда Wikimedia. Политика предусматривает исключения для переводов и проверок, но вызывает споры из-за проблем с обнаружением нарушений. Проект сталкивается с конкуренцией от ИИ-энциклопедий вроде Grokipedia и потерей трафика.
Команда Qwen из Alibaba выпустила Qwen-Image-2.0 — 7-миллиардную модель для генерации и редактирования изображений с почти идеальным текстом, включая древнюю каллиграфию. Она лидирует в тестах Arena, обходя специализированных конкурентов. Скоро ожидаются открытые веса, как с предыдущей версией.
Открытые модели ИИ для редактирования изображений быстро развиваются и предлагают мощные инструменты для творцов. Мы разобрали пять топовых вариантов: от скоростных FLUX.2 до моделей с мышлением вроде Step1X. Их можно запускать локально или в облаке, сохраняя полный контроль.
Генеративный ИИ вроде DALL-E жрет много энергии на фотореалистичные изображения. Термодинамические вычисления обещают сократить расход в десять миллиардов раз, используя естественный шум вместо цифровых операций. Ученые уже симулировали систему, генерирующую рукописные цифры, без традиционных нейросетей.
Интенсивный курс по ComfyUI объясняет узловую систему для генерации изображений с Stable Diffusion и Flux. От основ архитектуры и установки до продвинутых техник вроде LoRA, ControlNet и inpainting. Полный контроль без кода для новичков и профи.
Google Photos в США предлагает функцию «Me Meme», где ИИ превращает селфи в персонализированные мемы. Пользователи выбирают шаблон, добавляют фото себя, а модель генерирует результат. Пока запуск ограничен США, детали — на сайте поддержки.
Ollama теперь поддерживает генерацию изображений ИИ локально на macOS с моделями Z-Image Turbo и Flux 2 Klein. Функция экспериментальная, с планами на расширение. Пользователи могут настраивать параметры и сохранять результаты в удобном формате.
Независимые режиссеры в Google Flow Sessions использовали инструменты вроде Veo и Gemini для короткометражек вроде Murmuray и Mimesis, воплотив идеи без больших бюджетов. ИИ ускоряет и удешевляет процесс, но вызывает споры о творчестве, рабочих местах и этике. Творцы видят в нем помощника, если направлять осознанно, иначе студии зададут правила.
Региональный суд Германии отказал в авторских правах на три логотипа, сгенерированные ИИ. Судьи подчеркнули: для охраны нужен заметный творческий вклад человека, а усилия и платные сервисы не считаются. Это решение перекликается с практикой США.
PaperBanana — фреймворк от Пекинского университета и Google, где пять ИИ-агентов автоматически создают научные диаграммы из описаний методов. Система превосходит простые генераторы по качеству и уже применяется для улучшения человеческих рисунков, хотя редактирование остаётся вызовом. Тесты на 292 примерах из NeurIPS 2025 подтвердили её преимущества, но выявили проблемы с точностью деталей.
Adobe Firefly позволяет подписчикам генерировать изображения и видео без ограничений, используя модели вроде Google Nano Banana Pro и Runway Gen-4 Image. Функция интегрирована с веб-сайтом, приложениями и Creative Cloud. Среди профессионалов ИИ стал ежедневным инструментом, а промты удлинились вдвое.
Pinterest уволит менее 15% сотрудников, чтобы сосредоточиться на ИИ и сократить офисные расходы. Ресурсы пойдут на специализированные команды и продукты на базе искусственного интеллекта. Это часть стратегии компании на фоне недавних запусков вроде AI-помощника для шопинга.
Google Photos добавил функцию Me Meme для создания мемов с собственными фото с помощью ИИ Gemini. Сначала доступна в США, помогает экспериментировать с изображениями. Пользователи смогут выбирать шаблоны и генерировать забавные картинки.
Google позволяет пользователям Google AI Pro и Ultra делиться данными из Gmail и Photos для персонализированных результатов поиска. Система анализирует бронирования, фото отпусков и покупки, предлагая релевантные рекомендации. Функция "Personal Intelligence" работает в Gemini на модели Gemini 3 только по желанию пользователя, без поддержки Workspace.
SnapGen++ от Snap Inc. генерирует изображения 1024×1024 за 1,8 секунды на iPhone 16 Pro Max благодаря диффузионному трансформеру с 0,4 млрд параметров. Модель превосходит крупные аналоги вроде Flux.1-dev и использует инновации вроде Elastic Training и K-DMD для мобильной эффективности. Это первый шаг к серверному качеству ИИ-изображений на смартфонах.