Прорыв в решении задач Эрдёша
Недавно инженер-программист и основатель стартапа Нил Сомани проверял способности новой модели OpenAI к математике. Он ввёл задачу в ChatGPT, дал модели 15 минут на размышления и вернулся к готовому решению. Сомани проверил доказательство и формализовал его с помощью инструмента Harmonic — всё подтвердилось.
Сомани хотел понять, когда большие языковые модели смогут самостоятельно справляться с открытыми математическими задачами, а не только с теми, где они буксуют. Оказалось, что свежая модель сдвинула границу вперёд.
Цепочка рассуждений в ChatGPT поражает: модель перечисляет аксиомы вроде формулы Лежандра, гипотезы Бертрана и теоремы Звезды Давида. В итоге она наткнулась на пост на Math Overflow 2013 года, где математик из Гарварда Ноам Элкис предложил элегантное решение похожей задачи. Однако финальное доказательство ChatGPT отличается от работы Элкиса и даёт более полное решение варианта проблемы, сформулированной легендарным математиком Полем Эрдёшем. Его обширный список нерешённых задач стал полигоном для ИИ.
Такой результат удивляет скептиков машинного интеллекта — и это не единичный случай. ИИ-инструменты проникают в математику: от моделей вроде Aristotle от Harmonic, заточенных под формализацию, до инструментов для анализа литературы вроде deep research от OpenAI. С выходом GPT 5.2, которая по словам Сомани заметно лучше справляется с математическим мышлением, число решённых задач растёт, заставляя задуматься о роли больших языковых моделей в расширении границ знаний.
Задачи Эрдёша как тест для ИИ
Сомани изучал проблемы Эрдёша — коллекцию из более чем тысячи гипотез венгерского математика, которые хранят онлайн. Эти задачи привлекают ИИ-разработчиков разнообразием тем и уровнем сложности. Первые автономные решения появились в ноябре от модели AlphaEvolve на базе Gemini. А в последнее время GPT 5.2 показывает себя особенно сильной в высокоуровневой математике.
С Рождества на сайте Эрдёша статус с «открытых» на «решённые» перешёл 15 задач — и в 11 случаях ИИ-модели напрямую участвовали в процессе.
Знаменитый математик Теренс Тао оценивает прогресс на своей странице в GitHub более детально: ИИ самостоятельно продвинулся по восьми задачам Эрдёша, а в шести других помог, найдя и развив предыдущие исследования. До полной автономии в математике далеко, но большие модели уже играют ключевую роль.
В Mastodon Тао предположил, что масштабируемость ИИ делает их идеальными для «длинного хвоста» малоизвестных задач Эрдёша, многие из которых имеют простые решения.
«Поэтому многие из этих лёгких задач Эрдёша теперь скорее решатся чисто ИИ-методами, чем руками или в гибридном подходе», — добавил Тао.
Формализация ускоряет прогресс
Ещё один фактор — переход к формализации, которая упрощает проверку и развитие доказательств. Это трудоёмкий процесс, не требующий ИИ или компьютеров, но новые инструменты сильно его облегчают. Открытый «помощник по доказательствам» Lean, созданный в Microsoft Research в 2013 году, стал стандартом для формализации. А инструменты вроде Aristotle от Harmonic автоматизируют большую часть работы.
Для основателя Harmonic Тудора Акима всплеск решённых задач Эрдёша вторичен по сравнению с тем, что ведущие математики и компьютерщики начинают серьёзно использовать эти инструменты. «Мне важнее, что профессора математики и информатики применяют [ИИ-инструменты], — говорит Аким. — У них репутация на кону, так что когда они признают использование Aristotle или ChatGPT, это весомое доказательство».