Claude Mythos автономно взламывает корпоративные сети

Британский Институт безопасности ИИ проверил киберспособности Claude Mythos Preview от Anthropic. Впервые модель ИИ полностью самостоятельно выполнила симуляцию атаки на корпоративную сеть, если та была небольшой и плохо защищена.

По данным AISI, Claude Mythos Preview сделал большой шаг вперед в кибервозможностях ИИ. Два года назад ведущие модели едва справлялись с простейшими задачами для новичков. В контролируемых тестах Mythos Preview самостоятельно находил и использовал уязвимости в сетях, проводя многоэтапные атаки после получения четких указаний и доступа к сети. Такие операции требуют от экспертов по безопасности нескольких дней, отмечает AISI.

Захват флага: 73% успеха на экспертном уровне

В соревнованиях по захвату флага (CTF) модели ИИ ищут уязвимости в системах, чтобы найти спрятанные флаги. Как сообщает AISI, Mythos Preview набирает около 85% на задачах для учеников и примерно 95% на технических заданиях начального уровня для неспециалистов (при бюджете 2,5 миллиона токенов). Это ставит ее в лидирующую группу вместе с GPT-5.4, Codex 5.3 и Claude Opus 4.6.

Производительность ИИ-моделей на задачах CTF начального уровня с ноября 2022 года — Результаты разных моделей ИИ на задачах CTF для начинающих с ноября 2022 года

При увеличенном бюджете вычислений (50 миллионов токенов) Mythos Preview показывает около 93% на задачах для практиков и 73% на заданиях экспертного уровня. Этот показатель на экспертном уровне особенно впечатляет: до апреля 2025 года ни одна модель не могла решать такие задачи, по данным AISI.

Производительность на задачах CTF уровня практиков и экспертов с августа 2025 года — Результаты на задачах CTF уровня практиков и экспертов с августа 2025 года

Claude Mythos от Anthropic самостоятельно взламывает корпоративные сети

Задачи CTF проверяют навыки по отдельности, но настоящие кибератаки требуют связать десятки шагов через несколько хостов и сегментов сети, указывает AISI.

Чтобы оценить такую сложность, институт создал симуляцию под названием "The Last Ones" (TLO): 32-шаговая атака на модель корпоративной сети — от первичной разведки до полного захвата. AISI оценивает, что экспертам-людям на это уйдет около 20 часов. Полные детали приведены в статье.

Claude Mythos Preview стал первой моделью, завершившей TLO от начала до конца. Она добилась полного захвата в 3 из 10 попыток. В среднем модель прошла 22 из 32 шагов. Лучшая из остальных, Claude Opus 4.6, в среднем справлялась с 16 шагами.

Среднее количество шагов в 'The Last Ones' по бюджету токенов: Mythos Preview лидирует — Среднее число завершенных шагов в "The Last Ones" в зависимости от бюджета токенов. Mythos Preview (красная линия) значительно опережает конкурентов

AISI ожидает дальнейшего роста результатов при увеличении вычислительных ресурсов. Тесты проводились с бюджетом 100 миллионов токенов, и производительность росла до самого предела. О тенденции масштабирования для киберзадач подробнее в отдельной записи блога.

Однако у Mythos Preview есть ограничения. Модель не справилась с другой симуляцией AISI, направленной на системы промышленного управления (операционная технология, OT), как в электростанциях и заводах. По словам AISI, это не значит, что она провалилась бы на OT-компонентах: она не дошла до этой стадии, застряв на IT-сети на ранних этапах.

AISI указывает на оговорки: в тестовых средах не было активных защитников, инструментов безопасности и последствий, которые запустили бы тревоги в реальной сети. На основе этих данных нельзя сказать, сможет ли Mythos Preview прорваться в хорошо защищенную систему.

Тем не менее модель способна "самостоятельно атаковать небольшие, слабо защищенные и уязвимые корпоративные системы при наличии доступа к сети", как отмечает AISI. Институт планирует будущие тесты в укрепленных средах с активным мониторингом, обнаружением на конечных точках и реагированием на инциденты в реальном времени.

Кибервозможности ИИ усиливают значение базовых мер безопасности

Результаты подчеркивают важность основ кибербезопасности, по мнению AISI: timely обновления, строгий контроль доступа, безопасные настройки и полное логирование. Модели с похожими возможностями скоро догонят лидера.

В то же время институт подчеркивает двойное применение кибервозможностей ИИ. Они создают риски, но также могут сильно усилить защиту. В совместной записи блога с Национальным центром кибербезопасности Великобритании (NCSC) AISI объясняет, как защитникам готовиться к передовым ИИ и использовать их.

AISI отслеживает кибервозможности ИИ с 2023 года и постепенно усложняет тесты: от запросов в чате к CTF и сложным многоэтапным симуляциям атак.

Действительно ли Mythos слишком опасен для выпуска?

Anthropic официально представил Claude Mythos в начале апреля. Сейчас модель доступна только около 50 компаниям — якобы из-за опасений по кибербезопасности. Результаты AISI частично подтверждают это: модель способна самостоятельно атаковать слабо защищенные сети в контролируемых условиях.

Критики считают ограничения преувеличенными, как в 2019 году с GPT-2 от OpenAI, который сочли слишком опасным для выпуска. Преимущества над предыдущими моделями не такие уж большие, чтобы так сильно ограничивать доступ. Некоторые предполагают, что это маркетинговый ход или просто не хватает вычислительных мощностей для широкого распространения. Пока это домыслы. Узнаем наверняка, когда модели уровня Mythos станут общедоступными — по тому, сломается ли ваш компьютер или нет, как в статье о сигнале для Европы.

Claude Mythos самостоятельно взламывает слабо защищенные сети

Захват флага: 73% успеха на экспертном уровне

Claude Mythos от Anthropic самостоятельно взламывает корпоративные сети

Кибервозможности ИИ усиливают значение базовых мер безопасности

Действительно ли Mythos слишком опасен для выпуска?

Горячее

Топ-7 планов для вайб-кодинга

Краткий курс по ComfyUI для новичков

Open Notebook: альтернатива NotebookLM

5 лёгких и безопасных альтернатив OpenClaw для ИИ-агентов

Топ-7 открытых моделей OCR

Сейчас в тренде