Новости и статьи об искусственном интеллекте и нейросетях. Мы собираем и обрабатываем самую актуальную информацию из мира AI. О проекте

Новости

Claude Fable 5 опережает GPT-5.5 на 13 баллов в FrontierMath

Новая модель Anthropic Claude Fable 5 достигла 88% на самом сложном уровне бенчмарка FrontierMath, опередив GPT-5.5 на 13 процентных пунктов. Все модели тестировались с максимальными вычислительными усилиями. Результаты подтверждают быстрый прогресс ИИ в сложных математических задачах.

15 июня 2026 г.
1 мин
25
Claude Fable 5 опережает GPT-5.5 на 13 баллов в FrontierMath

Claude Fable 5 обходит GPT-5.5 на самом сложном тесте FrontierMath

Новая модель Anthropic Claude Fable 5 показала впечатляющие результаты в бенчмарке FrontierMath. По информации Epoch AI, Fable 5 достигла 87% точности на первых трёх уровнях сложности и 88% — на самом трудном четвёртом уровне (v2).

Результаты Claude Fable 5 на бенчмарке FrontierMath
Изображение: EpochAI

Модели Anthropic стремительно улучшают математические способности. Ещё в начале 2026 года предыдущая версия Opus 4.5 набирала меньше 10% на четвёртом уровне. OpenAI's GPT-5.5 достигает примерно 75% на том же уровне, заметно уступая Fable 5, хотя уже идёт работа над GPT-5.6.

Все модели тестировались на стандартной платформе Epoch AI с максимальными вычислительными усилиями. FrontierMath считается одним из самых сложных тестов для оценки математического мышления ИИ. Эти успехи не ограничиваются бенчмарками — реальные достижения продолжают накапливаться. Недавно модель OpenAI решила давнюю проблему Эрдёша, а Claude Mythos также нашёл решение этой задачи.