Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Alibaba открыла доступ к модели Qwen3.5-397B-A17B, которая сочетает текст, изображения и видео в одной архитектуре с 397 миллиардами параметров, из которых активируется 17 миллиардов. Она ускорена до 19 раз по сравнению с предшественниками и лидирует в агентных задачах. Китайские лаборатории продолжают выпускать мощные open-weight модели по низким ценам, усиливая конкуренцию.
Alibaba запустила Qwen3-Coder-Next — компактную открытую модель ИИ для кодинга с 80 миллиардами параметров, из которых активно 3 миллиарда. Она показывает высокие результаты на бенчмарках, конкурируя с более крупными моделями, и поддерживает большой контекст в 256 тысяч токенов. Модель готова к локальному использованию через популярные инструменты и доступна на Hugging Face и ModelScope.
Языковые модели ИИ все чаще выдают похожие ответы на творческие задания, формируя "искусственный роевый разум". Ученые предупреждают, что это грозит унификацией человеческой креативности и культуры. Исследование на 25 моделях выявило высокую степень сходства, включая идентичные фразы от разных разработчиков.
Исследователи из MIT изучили 59 научных моделей ИИ и нашли, что они независимо от данных и архитектур формируют похожие внутренние представления молекул, материалов и белков. Чем лучше модель работает, тем ближе её картина к лидерам, но все они слабы на новых структурах. Это намекает на универсальную модель вещества, хотя до фундаментальных систем ещё далеко.
Alibaba Cloud представила модели Qwen3-TTS-VD-Flash для генерации голосов по описанию и Qwen3-TTS-VC-Flash для клонирования голоса с трех секунд аудио на десяти языках. Они превосходят конкурентов вроде OpenAI и Elevenlabs по качеству и точности. Доступны через API и демо на Hugging Face.
Американская Arcee AI выпустила открытые MoE-модели Trinity Mini и Nano под Apache 2.0 — полностью обученные в США, чтобы конкурировать с китайскими лидерами. Они используют инновационную AFMoE-архитектуру для эффективного рассуждения и длинного контекста. В пути Trinity Large на 420 млрд параметров.
Китайские разработчики представили open-source модель GeoVista для геолокации изображений через анализ картинки и поиск информации онлайн. Система достигла уровня коммерческих решений на городском уровне точности.
Визуальные языковые модели, такие как Qwen 3 VL, позволяют эффективно обрабатывать изображения и текст, превосходя традиционные методы OCR. Статья демонстрирует их применение для распознавания символов и извлечения данных из документов, а также обсуждает ограничения. Эти модели открывают новые перспективы в анализе визуальной информации.
Команда Qwen из Alibaba выпустила Qwen-Image-2.0 — 7-миллиардную модель для генерации и редактирования изображений с почти идеальным текстом, включая древнюю каллиграфию. Она лидирует в тестах Arena, обходя специализированных конкурентов. Скоро ожидаются открытые веса, как с предыдущей версией.
Китайские техгиганты вроде Alibaba, Tencent и ByteDance ускоряют внедрение ИИ-агентов в торговлю, интегрируя их в суперприложения вроде WeChat и Taobao. Это дает преимущество перед западными компаниями, сталкивающимися с фрагментацией данных и строгими правилами. Эксперты прогнозируют взрывной рост агентов в бизнесе и повседневности уже в 2026 году.
Alibaba обновила открытую модель Qwen-Image-2512, чтобы изображения людей и текста выглядели естественнее. В слепых тестах она возглавила рейтинг среди open-source аналогов. Модель уже доступна для скачивания и тестирования на популярных платформах.
Qwen обновил модель Qwen-Image-Edit-2511 для лучшего сохранения идентичности лиц при редактировании портретов и групповых фото. Улучшения затронули освещение, ракурсы, дизайн продуктов и геометрию, плюс интегрированы LoRA из сообщества. Модель открыта под Apache 2.0 с демо на Hugging Face.
Подразделение Qwen от Alibaba выпустило модель Qwen-Image-Layered, разбирающую изображения на прозрачные RGBA-слои для независимого редактирования элементов. Она позволяет менять фон, объекты, текст и многое другое, деля фото на 3 или 8 слоев с возможностью дальнейшего разбиения. Код открыт на GitHub, модели — на Hugging Face и ModelScope, есть демо и подробные материалы.
Модель Rnj-1 от Essential AI показала выдающиеся результаты в тесте SWE-bench Verified, набрав 20.8 баллов. Разработка модели сосредоточена на улучшении предварительного обучения и снижении вычислительных затрат.
Модель Qwen3-VL от Alibaba выделяется в анализе длинных видео и визуальной математике, обходя многие коммерческие аналоги в ключевых тестах. Она обрабатывает огромные контексты и демонстрирует прогресс в OCR и GUI-задачах. Открытые веса делают ее доступной для разработчиков.
Показаны все статьи (15)