DeepSeek

11 публикаций по теме

DeepSeek

Новый бенчмарк показал слабость ИИ в реальной интеллектуальной работе

Новый бенчмарк Artificial Analysis проверил способность моделей ИИ работать над сложными многозадачными проектами на основе разрозненных документов. Даже лучшая модель смогла полностью выполнить все критерии только для трёх процентов заданий; почти треть задач остались нерешёнными ни одной моделью наполовину.

1 мин

5 часов назад

Новости

DeepSeek получила первые внешние инвестиции: оценка $50 млрд

Китайский ИИ-стартап DeepSeek впервые привлёк внешние инвестиции более чем на $7,4 млрд, а его оценка превысила $50 млрд. Инвесторы вошли через товарищество без права голоса и с пятилетним мораторием на выход, а основатель Лян Вэньфэн подтвердил ставку на фундаментальные исследования и open-source модели. Компания также продолжает давить на конкурентов ценами, сделав модель V4 Pro значительно дешевле GPT-5.5 от OpenAI.

1 мин

18 июня 2026 г.

Статьи

Объединение языковых моделей с Unsloth Studio

Unsloth Studio позволяет сливать языковые модели без кода локально на ПК, поддерживая SLERP, TIES-Merging и DARE. Это помогает комбинировать сильные стороны нескольких моделей, экономя ресурсы. Руководство охватывает установку, методы, шаги слияния и советы по использованию.

12 мин

20 апреля 2026 г.

Новости

Google представил TurboQuant — алгоритм сжатия памяти ИИ, интернет шутит про Pied Piper

Google представил TurboQuant — алгоритм сжатия KV-кэша ИИ минимум в 6 раз без потери качества. Технология использует PolarQuant и QJL, её покажут на ICLR 2026. Интернет шутит про сходство с Pied Piper из "Кремниевой долины", но это пока лабораторный прорыв для inference.

2 мин

26 марта 2026 г.

Новости

Anthropic обвиняет Deepseek, Moonshot и MiniMax в краже данных Claude

Anthropic обнаружила атаки дистилляции на Claude от Deepseek, Moonshot и MiniMax: свыше 16 миллионов запросов через фейковые аккаунты и прокси. Лаборатории копировали навыки рассуждений, программирования и инструментов, с MiniMax лидирующей по объёму. Компания призывает к коллективным мерам против таких угроз.

2 мин

23 февраля 2026 г.

Новости

Приложения обогнали игры по расходам в 2025 году

В 2025 году неигровые мобильные приложения впервые обогнали игры по расходам пользователей — 85 млрд долларов, рост на 21%. Главный драйвер — бум ИИ-приложений с доходами свыше 5 млрд и 3,8 млрд загрузок. Пользователи углубляют вовлеченность, а крупные компании усиливают конкуренцию.

4 мин

21 января 2026 г.

Новости

Microsoft переводит Copilot Cowork на оплату по факту и может внедрить DeepSeek

Microsoft меняет тарифную модель Copilot Cowork, переходя от фиксированной платы к оплате за использование. Рассматривается внедрение дообученной модели DeepSeek V4 как более дешёвой альтернативы Claude, размещённой в Azure. Решение призвано сдержать растущие затраты на агентные ИИ-задачи.

1 мин

18 июня 2026 г.

Новости

DeepSeek представила V4-Pro и V4-Flash почти бесплатно

DeepSeek выпустила открытые модели V4-Pro (1,6 трлн параметров) и V4-Flash с контекстом в миллион токенов по ценам ниже OpenAI и Anthropic. Новые архитектуры резко снижают затраты на длинные контексты, а в бенчмарках V4-Pro лидирует среди открытых весов. Модели заточены под агентные задачи и проверены на Nvidia с Huawei.

4 мин

24 апреля 2026 г.

Новости

Stanford: опасности подхалимства ИИ в личных советах

Ученые Стэнфорда доказали: подхалимство ИИ подтверждает вредные действия пользователей на 49% чаще людей и усиливает их уверенность в своей правоте. В тесте 11 моделей вроде ChatGPT и эксперименте с 2400 участниками льстивые чатботы оказались популярнее, снижая готовность извиняться. Авторы видят в этом угрозу безопасности и призывают к регуляции.

3 мин

29 марта 2026 г.

Новости

Исследование показало, почему модели ИИ продолжают думать сверх решения

Модели рассуждений ИИ генерируют лишний текст после правильных ответов, хотя сами знают момент остановки — к такому выводу пришло исследование Bytedance. Метод SAGE и дообучение SAGE-RL повышают точность на 2,1% в среднем и сокращают токены на 44,1%. Это даёт прирост скорости инференса свыше 40% на сложных задачах.

5 мин

25 февраля 2026 г.

Новости

DeepSeek OCR 2: токены на 80% меньше, лучше Gemini

DeepSeek OCR 2 использует новый энкодер DeepEncoder V2, который перестраивает визуальные токены по смыслу и снижает их число на 80%, превосходя Gemini 3 Pro в разборе документов. Модель лидирует на OmniDocBench v1.5 с 91,09% и открыта на GitHub. Это шаг к универсальной обработке разных типов данных.

3 мин

1 февраля 2026 г.

Показаны все статьи (11)

DeepSeek

Новый бенчмарк показал слабость ИИ в реальной интеллектуальной работе

DeepSeek получила первые внешние инвестиции: оценка $50 млрд

Объединение языковых моделей с Unsloth Studio

Google представил TurboQuant — алгоритм сжатия памяти ИИ, интернет шутит про Pied Piper

Anthropic обвиняет Deepseek, Moonshot и MiniMax в краже данных Claude

Приложения обогнали игры по расходам в 2025 году

Microsoft переводит Copilot Cowork на оплату по факту и может внедрить DeepSeek

DeepSeek представила V4-Pro и V4-Flash почти бесплатно

Stanford: опасности подхалимства ИИ в личных советах

Исследование показало, почему модели ИИ продолжают думать сверх решения

DeepSeek OCR 2: токены на 80% меньше, лучше Gemini

Сейчас в тренде

Популярные темы