Версия Gemini 2.5 Deep Think демонстрирует прорывные результаты на ведущем мировом соревновании по программированию, подчеркивая значительный прогресс в решении абстрактных задач.
Усовершенствованная модель Gemini 2.5 Deep Think получила уровень золотой медали на финале Международного студенческого конкурса по программированию (ICPC) 2025 года.
Это достижение опирается на недавнюю победу той же модели с золотой медалью на Международной математической олимпиаде (IMO), состоявшейся два месяца назад. Разработки из этих проектов будут внедрены в последующие итерации Gemini Deep Think, расширяя возможности передового ИИ для студентов и ученых.
Успешное выполнение заданий на таких мероприятиях предполагает глубокое абстрактное мышление, творческий подход, синтез оригинальных методов для ранее неизвестных вызовов и настоящую изобретательность.
Эти успехи в области соревновательного программирования и математического анализа иллюстрируют существенный скачок Gemini в решении абстрактных проблем, что является важным этапом на пути к искусственному общему интеллекту (AGI).
ICPC как мировой эталон качества
Международный студенческий конкурс по программированию (ICPC) считается старейшим, крупнейшим и наиболее авторитетным соревнованием по алгоритмическому программированию на уровне вузов. Это более высокий уровень по сравнению со школьными олимпиадами вроде IMO. Ежегодно в нем участвуют представители почти 3000 университетов из более чем 103 стран, решая практические задачи по кодированию.
Финал этого года прошел 4 сентября в Баку, Азербайджан, собрав лучшие команды из предварительных этапов. За пять часов каждая группа работала над набором сложных алгоритмических задач. Итоговые позиции определялись по строгим критериям: баллы начислялись только за идеальные решения, а каждая минута имела значение. Из 139 участвующих команд золотые медали получили лишь четыре лидера.
Gemini разрешила 10 из 12 задач, достигнув уровня золотой медали
Усовершенствованная версия Gemini 2.5 Deep Think участвовала в удаленной онлайн-среде в соответствии с правилами ICPC, под контролем организаторов. Модель начала работу на 10 минут позже человеческих участников и верно решила 10 из 12 задач, показав производительность на уровне золотой медали в пределах того же пятичасового лимита. Решения доступны здесь.
Gemini справилась с восемью задачами за 45 минут и с двумя дополнительными — за три часа, применяя разнообразные продвинутые структуры данных и алгоритмы. Общее время на 10 задач составило 677 минут, что позволило бы модели занять второе место среди университетских команд.
Доктор Билл Пoucher, исполнительный директор ICPC Global, отметил: «ICPC всегда устанавливал высшие стандарты в решении задач. Участие Gemini в этом соревновании и достижение уровня золота знаменует важный этап в определении ИИ-инструментов и академических норм для следующего поколения. Поздравляем Google DeepMind; эта работа способствует цифровому возрождению на благо всех».
Gemini успешно присоединилась к этому соревнованию и достигла результатов на уровне золота, что знаменует ключевой момент в определении ИИ-инструментов и академических стандартов, необходимых для следующего поколения.
Доктор Билл Пoucher, исполнительный директор ICPC Global
Gemini разрешила задачу, которую не решили университетские команды
В неповторимый момент модель эффективно решила Задачу C за первые полчаса — ни одна университетская команда не справилась с ней.
Задача C подразумевала распределение жидкости по сети соединенных трубопроводов к группе резервуаров с целью минимизации времени заполнения всех емкостей. Возможных конфигураций бесконечно много, поскольку каждая труба может быть открытой, закрытой или частично открытой, что затрудняет поиск оптимального варианта.
Gemini разработала действенный подход с остроумной идеей: она присвоила каждому резервуару «приоритетное значение», отражающее степень предпочтения по сравнению с остальными. Для заданных приоритетов оптимальная конфигурация трубопроводов определяется алгоритмом динамического программирования. Модель применила теорему мини-макс, преобразовав исходную проблему в поиск приоритетов, максимально ограничивающих поток. Используя связь между приоритетами и оптимальными потоками, Gemini применила вложенные тернарные поиски для быстрого нахождения идеальных значений в выпуклом пространстве решений, напоминающем чашу, и успешно разрешила Задачу C.
Производительность Gemini объединяет ряд инноваций
Это достижение сочетает прогресс в предобучении, постобучении, новых методах обучения с подкреплением, многошаговом рассуждении и параллельном мышлении. Эти нововведения позволили Gemini исследовать различные стратегии решения сложных задач, проверять ответы и итеративно улучшать их перед выдачей.
Например, в процессе обучения с подкреплением модель осваивала рассуждения и генерацию кода для самых трудных задач, получая обратную связь по результатам и эволюционируя подходы. Для атаки на проблему несколько агентов Gemini предлагают свои варианты, выполняют код и тесты в терминалах, затем корректируют решения на основе всех попыток.
Внутренние тесты показывают, что аналогичная версия Gemini 2.5 Deep Think способна достигать уровня золотой медали на финалах ICPC 2023 и 2024 годов, наравне с 20 лучшими программистами мира.
Потенциал Gemini как партнера в работе
Достижение уровня золотой медали на ICPC имеет прямые практические последствия для разработки ПО и подтверждает, что ИИ может служить надежным партнером в решении задач для разработчиков. Если объединить лучшие решения ИИ и людей из конкурса, все 12 задач были бы полностью и верно разрешены. Это подчеркивает способность ИИ вносить уникальные, новаторские вклады, дополняющие экспертизу человека.
Помимо математики и кодирования, успех иллюстрирует мощную новую функцию в абстрактном мышлении. Навыки, требуемые для ICPC — анализ сложной проблемы, создание многоэтапного логического плана и безупречная реализация — аналогичны тем, что нужны в науке и инженерии, например, при проектировании лекарств или микросхем. Это свидетельствует о переходе ИИ от обработки данных к помощи в решении глобальных трудных задач рассуждения, что может принести пользу человечеству.
Пользователи Gemini с подпиской Google AI Ultra уже имеют доступ к облегченной версии Gemini 2.5 Deep Think в приложении Gemini. В ближайшем будущем более интеллектуальные ИИ-ассистенты для кодирования помогут разработчикам справляться с растущей сложностью инженерных вызовов. От логистики и отладки до научных исследований решения самых сложных неразрешимых проблем могут стать достижимыми благодаря ИИ как инструменту сотрудничества.