Claude Opus 4.5 против промпт-инъекций: тест Gray Swan

Claude Opus 4.5 лучше защищён от промпт-инъекций

Модель Claude Opus 4.5 от Anthropic демонстрирует повышенную устойчивость к промпт-инъекциям по сравнению с Gemini 3 Pro и GPT-5.1, но сильные атаки всё равно прорывают её защиту в значительном числе случаев. Тестирование Gray Swan подчёркивает, насколько ограничены текущие меры безопасности в ИИ.

26 ноября 2025 г.

1 мин

Claude Opus 4.5 показывает лучшие результаты по защите от промпт-инъекций среди конкурентов, но эти барьеры всё равно остаются слабыми. Компания по кибербезопасности Gray Swan провела тестирование и выяснила: одна "очень сильная" атака промпт-инъекцией обходит защиты Opus 4.5 в 4,7% случаев. Если злоумышленник попробует десять раз, вероятность успеха вырастет до 33,6%. При ста попытках она достигнет 63%. Несмотря на такие уязвимости, Opus 4.5 всё равно опережает другие модели, например, Gemini 3 Pro от Google и GPT-5.1, где уровень успешных атак может доходить до 92%.

График бенчмарка по устойчивости Claude Opus 4.5 к промпт-инъекциям — Anthropic

Промпт-инъекция подразумевает внедрение скрытых команд в запрос, чтобы обойти фильтры безопасности, это старая проблема больших языковых моделей. В системах с агентами ситуация усугубляется, поскольку они открывают дополнительные точки входа и упрощают эксплуатацию подобных атак.

Claude Opus 4.5 лучше защищён от промпт-инъекций

Горячее

Как ИИ модели думают: новое исследование

Самые актуальные AI-носители и гаджеты для покупки

Nano Banana Pro от Google меняет ИИ-арт

Обзор Abacus AI: ChatLLM и DeepAgent

White-Box-Coder: ИИ с самопроверкой кода

Сейчас в тренде