Математик Теренс Тао отметил прорыв в использовании ИИ для решения математических задач. При этом он предостерегает от поспешных выводов.
Пол Эрдёш всю жизнь предлагал сотни открытых задач. По сложности они сильно различаются: есть среди них крайне трудные вопросы без ответа, а есть заметки, к которым никто не возвращался всерьез. Все они собраны на сайте erdosproblems.com.
GPT-5.2 Pro самостоятельно справился с задачей Эрдёша
Как рассказал Теренс Тао, ИИ-модели достигли нового уровня: задача №728 решена ChatGPT практически без посторонней помощи, после небольшой начальной подсказки, и строго по сути вопроса, без заимствований из готовых источников.
Это шаг вперед по сравнению с прошлыми заявлениями. Исследователи OpenAI раньше хвастались, что их GPT-модель "нашла" ответ на задачу Эрдёша. Формально верно, но ИИ просто откопал опубликованное решение через поиск. Нового доказательства он не построил.
4 января GPT-5.2 Pro, самая продвинутая модель OpenAI, сгенерировала доказательство для ужесточенной формулировки задачи. Другой инструмент под названием Aristotle преобразовал его в Lean — формальный язык для автоматической проверки математических доказательств. В сгенерированном тексте были мелкие неточности, но Aristotle их исправил сам.
Скорость важнее самого результата
Тао подчеркивает главное достижение: теперь можно быстро создавать черновики математических текстов и их править. Участники сообщества применили разные ИИ для перевода формального доказательства на обычный язык, устранения пробелов и связей с известными работами.
По словам Тао, текст вышел "немного корявым и с ИИ-отпечатком", но его идеи уловить легко. После нескольких правок он приблизился к стандартам научной статьи.
"Это сильно отличается от обычной практики, где даже один читаемый текст требует уймы времени", — пишет Тао. Ранее он говорил об ИИ, который поможет "индустриализовать" математику и ускорить научные открытия в целом.
Оценивать успехи ИИ нужно с учетом контекста
В то же время Тао не дает поводов для эйфории. В вики на GitHub, где фиксируют вклад ИИ в задачи Эрдёша, он перечисляет важные замечания.
Сложность задач Эрдёша разнится на несколько порядков, а легкие часто игнорировали. Если задача ждала решения 50 лет, это не значит, что люди ее безуспешно штурмовали полвека. Скорее всего, просто никто не взялся.
Еще одна засада — неполные обзоры литературы: ИИ уже не раз "решал" якобы открытые задачи, а потом находили публикацию. Плюс неудачи почти не фиксируют, так что о реальной доле успехов судить рано.
Сложным задачам без людей не обойтись
В следующем посте в Mastodon Тао замечает закономерность: чем автономнее ИИ, тем проще решение. Это отбор: независимые ИИ-процессы масштабируются, поэтому подходят для редких задач с очевидными ответами.
Для серьезных вопросов нужен тандем человека и ИИ. Модель берет на себя вычисления или фрагменты доказательств, а человек прокладывает общую схему. Тао считает, что лишь 1–2% открытых задач Эрдёша достаточно просты, чтобы современные ИИ справились с минимальной помощью.