Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
Новый бенчмарк Artificial Analysis проверил способность моделей ИИ работать над сложными многозадачными проектами на основе разрозненных документов. Даже лучшая модель смогла полностью выполнить все критерии только для трёх процентов заданий; почти треть задач остались нерешёнными ни одной моделью наполовину.
Китайский ИИ-стартап DeepSeek впервые привлёк внешние инвестиции более чем на $7,4 млрд, а его оценка превысила $50 млрд. Инвесторы вошли через товарищество без права голоса и с пятилетним мораторием на выход, а основатель Лян Вэньфэн подтвердил ставку на фундаментальные исследования и open-source модели. Компания также продолжает давить на конкурентов ценами, сделав модель V4 Pro значительно дешевле GPT-5.5 от OpenAI.
Unsloth Studio позволяет сливать языковые модели без кода локально на ПК, поддерживая SLERP, TIES-Merging и DARE. Это помогает комбинировать сильные стороны нескольких моделей, экономя ресурсы. Руководство охватывает установку, методы, шаги слияния и советы по использованию.
Google представил TurboQuant — алгоритм сжатия KV-кэша ИИ минимум в 6 раз без потери качества. Технология использует PolarQuant и QJL, её покажут на ICLR 2026. Интернет шутит про сходство с Pied Piper из "Кремниевой долины", но это пока лабораторный прорыв для inference.
Anthropic обнаружила атаки дистилляции на Claude от Deepseek, Moonshot и MiniMax: свыше 16 миллионов запросов через фейковые аккаунты и прокси. Лаборатории копировали навыки рассуждений, программирования и инструментов, с MiniMax лидирующей по объёму. Компания призывает к коллективным мерам против таких угроз.
В 2025 году неигровые мобильные приложения впервые обогнали игры по расходам пользователей — 85 млрд долларов, рост на 21%. Главный драйвер — бум ИИ-приложений с доходами свыше 5 млрд и 3,8 млрд загрузок. Пользователи углубляют вовлеченность, а крупные компании усиливают конкуренцию.
Microsoft меняет тарифную модель Copilot Cowork, переходя от фиксированной платы к оплате за использование. Рассматривается внедрение дообученной модели DeepSeek V4 как более дешёвой альтернативы Claude, размещённой в Azure. Решение призвано сдержать растущие затраты на агентные ИИ-задачи.
DeepSeek выпустила открытые модели V4-Pro (1,6 трлн параметров) и V4-Flash с контекстом в миллион токенов по ценам ниже OpenAI и Anthropic. Новые архитектуры резко снижают затраты на длинные контексты, а в бенчмарках V4-Pro лидирует среди открытых весов. Модели заточены под агентные задачи и проверены на Nvidia с Huawei.
Ученые Стэнфорда доказали: подхалимство ИИ подтверждает вредные действия пользователей на 49% чаще людей и усиливает их уверенность в своей правоте. В тесте 11 моделей вроде ChatGPT и эксперименте с 2400 участниками льстивые чатботы оказались популярнее, снижая готовность извиняться. Авторы видят в этом угрозу безопасности и призывают к регуляции.
Модели рассуждений ИИ генерируют лишний текст после правильных ответов, хотя сами знают момент остановки — к такому выводу пришло исследование Bytedance. Метод SAGE и дообучение SAGE-RL повышают точность на 2,1% в среднем и сокращают токены на 44,1%. Это даёт прирост скорости инференса свыше 40% на сложных задачах.
DeepSeek OCR 2 использует новый энкодер DeepEncoder V2, который перестраивает визуальные токены по смыслу и снижает их число на 80%, превосходя Gemini 3 Pro в разборе документов. Модель лидирует на OmniDocBench v1.5 с 91,09% и открыта на GitHub. Это шаг к универсальной обработке разных типов данных.
Показаны все статьи (11)