Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте
DataRobot выпустила навыки для ИИ-ассистентов Cursor, Gemini и Claude, чтобы упростить разработчикам работу с её платформой. Инструменты теперь понимают SDK, CLI и процедуры аутентификации, что снижает затраты времени на обучение.
Британский AISI протестировал GPT-5.5 от OpenAI: модель показала результаты на уровне Claude Mythos в киберзадачах и симуляциях атак. Она полностью прошла сетевую симуляцию TLO в 2 из 10 попыток, но jailbreak обошел все защиты. Тесты подтверждают рост автономных атакующих способностей ИИ.
Инвесторы предлагают Anthropic $50 млрд при оценке до $900 млрд – это может стать последним приватным раундом перед IPO. Выручка компании выросла до $40 млрд run rate благодаря Claude Code и Cowork. Такой шаг позволит сравняться по стоимости с OpenAI.
Модель Claude Mythos Preview от Anthropic выявила тысячи критических уязвимостей в основных ОС, браузерах и криптобиблиотеках. Компания запустила Project Glasswing с партнерами AWS, Google и другими для сканирования кода и защиты от ИИ-атак. Эксперты рекомендуют комбинировать ИИ с человеческим контролем, чтобы минимизировать ложные срабатывания и ускорить исправления.
Опрос Anthropic среди 81 тысячи пользователей Claude показал: новые навыки (48%) важнее скорости (40%) для продуктивности, но выборка предвзята в сторону соло-энтузиастов. Высокие и низкие доходы получают максимум пользы, креативщики чувствуют угрозу. Каждый пятый опасается потери работы, средняя оценка эффекта — 5,1 из 7.
Anthropic выявила три причины жалоб на ухудшение Claude Code: смена уровня усилий, баг кэша и промт против многословности. Все проблемы исправлены к апрелю, лимиты использования сброшены. В будущем усилят тесты и контроль изменений.
В Google ИИ теперь генерирует 75% нового кода с последующей проверкой инженерами — доля выросла с 25% в октябре 2024 года. Компания переходит к агентным процессам с автономными ИИ, что ускорило миграцию кода в шесть раз при использовании моделей Gemini. В DeepMind используют Claude Code от Anthropic и работают над собственной альтернативой.
Anthropic выявила три причины падения качества Claude Code: снижение усилий на рассуждение, баг кэширования и ограничения промта. Компания исправила проблемы, ввела строгие тесты и сбросила лимиты для пользователей. Такие инциденты отражают общие вызовы индустрии ИИ из-за дефицита вычислений и изменений в инструментах.
Philosophy Bench протестировал фронтирные ИИ-модели на 100 этических дилеммах, выявив различия в подходах: Claude от Anthropic самый деонтологичный с 24% согласий на нарушения, Grok от xAI — чистый консеквенциалист. Gemini легко корректируется, GPT-5 минимизирует ошибки, но избегает морали. Этика превращается в рыночную фичу, вызывая споры о контроле над мощными агентами.
Anthropic запустила BioMysteryBench — тест из 99 задач по биоинформатике на реальных данных. Claude Mythos Preview достигает 82,6% точности на задачах, доступных экспертам, и 30% на сверхсложных. Результаты подтверждает независимый CompBioBench от Genentech и Roche.
Anthropic назначила Тео Хурмузи генеральным менеджером по Австралии и Новой Зеландии, открыв офис в Сиднее. Новый руководитель с опытом из Snowflake усилит локальную команду и партнерства с банками, университетами и компаниями вроде Canva и Xero. Это часть расширения в Азиатско-Тихоокеанском регионе после офисов в Токио и Бангалоре.
Опрос Epoch AI и Ipsos выявил: 80% пользователей Claude в США из домохозяйств с доходом выше 100 тысяч долларов — это лидерство над Copilot (64%), ChatGPT и другими (56%). Абсолютно Claude охватывает мало даже среди богатых, где лидирует ChatGPT. Данные на фоне исследований Anthropic намекают на риск роста неравенства из-за мощных ИИ.
Anthropic провела эксперимент Project Deal, где агенты Claude торговали для сотрудников: модели Opus 4.5 выигрывали на $2-3 за сделку по сравнению с Haiku 4.5. Участники с слабыми агентами оценили公平ность так же высоко и не заметили потерь. Тест поднимает вопросы о рисках ИИ-коммерции и неравенстве.
Anthropic временно исключила Claude Code из подписки Pro для новых пользователей, но вернула после критики. Глава по развитию Amol Avasare отметил, что планы Pro и Max устарели для текущих задач Claude. Это отражает общий дефицит мощностей в ИИ-индустрии с проблемами доступности и ростом цен.
Anthropic запустила Управляемые агенты в платформе Claude для долгосрочных задач: виртуализированы сессия, каркас и песочница. Разграничение мозга от рук и сессии устраняет сбои, упрощает отладку, усиливает безопасность и снижает TTFT на 60-90%. Система готова к будущим моделям и масштабу.
Инженеры Mozilla Firefox с помощью Claude Mythos Preview выявили и устранили 271 уязвимость в версии 150 браузера, ранее починив 22 с Opus 4.6. ИИ устраняет нехватку экспертов, снижает затраты на безопасность и переворачивает баланс в пользу обороняющихся. В будущем игнорирование таких инструментов может стать признаком халатности.