Правительство США потребовало приостановить доступ к Fable 5 и Mythos 5
Правительство США, ссылаясь на полномочия в области национальной безопасности, выпустило директиву об экспортном контроле, приостанавливающую доступ к Fable 5 и Mythos 5 для всех иностранных граждан, как на территории США, так и за её пределами, включая иностранных сотрудников Anthropic. В результате мы вынуждены немедленно отключить Fable 5 и Mythos 5 для всех наших клиентов, чтобы обеспечить соблюдение требований. Доступ к остальным моделям Anthropic затронут не будет.
Директиву мы получили сегодня в 17:21 по восточному времени. В письме не приводились конкретные детали угрозы национальной безопасности. Насколько мы понимаем, правительство полагает, что ему стал известен метод обхода или «джейлбрейка» Fable 5. Мы изучили демонстрацию этой техники, с помощью которой было выявлено несколько ранее известных незначительных уязвимостей. Все они относительно просты, и, как мы выяснили, другие общедоступные модели также способны их обнаружить без использования обхода.
Позиция Anthropic в отношении мер безопасности Fable, изложенная в нашем блоге при запуске, такова:
- Мы внедрили мощные средства защиты, которые значительно снижают вероятность злоупотребления Fable для задач, связанных с кибербезопасностью (и не только). Наши защитные механизмы настолько строги, что многие пользователи жаловались на их чрезмерную широту.
- В недели, предшествовавшие запуску Fable, Anthropic вместе с правительством США, британским Институтом безопасности ИИ (AISI), несколькими частными сторонними организациями и внутренними командами провела тысячи часов тестирования защиты Fable методом красной команды.
- Эти тесты показали, что защита Fable существенно эффективнее, чем у любой ранее развёрнутой модели.
- Тестировщикам пока не удалось найти универсальный джейлбрейк — метод обхода, который может широко преодолевать защиту модели, открывая доступ к разнообразным кибервозможностям.
- Мы предполагаем, что абсолютная устойчивость к джейлбрейкам пока недостижима ни для одного провайдера. Все защитные механизмы в отрасли уязвимы для неуниверсальных джейлбрейков (способных в отдельных случаях извлекать некоторую киберинформацию), и, вероятно, универсальные джейлбрейки будут найдены в будущем. Мы чётко заявляли об этом при релизе Fable 5.
- Поскольку абсолютная устойчивость к джейлбрейкам сегодня кажется невозможной, Anthropic применила стратегию эшелонированной защиты для Fable 5. Мы стремились сделать джейлбрейки либо узкими (в случае неуниверсальных), либо очень затратными для создания (в случае универсальных), и дополнить это тщательным мониторингом, чтобы быстро обнаруживать и пресекать успешные атаки. Именно поэтому мы ввели 30-дневное хранение клиентских данных для Fable — изменение политики, которое несёт для нас реальные издержки, но позволяет исследовать и смягчать джейлбрейки.
- Мы придерживаемся этой стратегии эшелонированной защиты. Она снижает риски, связанные с Fable, делая их сопоставимыми с рисками уже развёрнутых в индустрии моделей.
- Мы даже не получали сообщений о действительно опасном потенциальном джейлбрейке, который привёл бы к вредоносным последствиям. Раскрытые нам возможные джейлбрейки либо дают совершенно безобидные ответы, либо представляют собой незначительные находки, не дающие специфического усиления Mythos.
Детали предполагаемого джейлбрейка
На данный момент правительство предоставило нам лишь устные доказательства возможного узкого неуниверсального джейлбрейка, который по сути заключается в том, чтобы попросить модель прочитать определённую кодовую базу и исправить любые программные дефекты. По нашему пониманию, один из потенциальных джейлбрейков был передан правительству. Мы ознакомились с отчётом, который, как мы полагаем, лёг в основу директивы, и убедились, что продемонстрированный там уровень возможностей широко доступен в других моделях (включая GPT-5.5 от OpenAI) и ежедневно используется специалистами по защите систем. В течение следующих 24 часов мы поделимся более подробной информацией.
Выполнение директивы и принципиальная позиция
Мы выполняем юридическую директиву правительства и закрываем доступ к Fable 5 и Mythos 5 для всех пользователей. Однако мы не согласны с тем, что обнаружение узкого потенциального джейлбрейка должно служить основанием для отзыва коммерческой модели, развёрнутой для сотен миллионов человек. Если применять такой стандарт по всей отрасли, это, по нашему мнению, фактически остановит развёртывание всех новых моделей у всех передовых разработчиков.
Как мы заявляли публично, мы считаем, что у правительства должна быть возможность блокировать небезопасные развёртывания в рамках установленного законом процесса, который должен быть прозрачным, справедливым, ясным и основанным на технических фактах. Данная мера не соответствует этим принципам.
Извинения и восстановление доступа
Приносим извинения нашим клиентам за эту вынужденную приостановку. Мы убеждены, что это недоразумение, и работаем над скорейшим восстановлением доступа.