ИИ меняет подход к программированию
Искусственный интеллект уже кардинально преобразует способы создания программного обеспечения. Роевые агенты и их подагенты берут на себя львиную долю рутинных задач в кодинге. Разработчики пробуют свежие интерфейсы и форматы взаимодействия человека с ИИ, и даже ведущим лабораториям порой трудно поспевать за этими изменениями.
Агентная разработка набирает обороты
Сегодня в моде агентная разработка ПО: ИИ-агенты самостоятельно справляются с задачами по написанию кода. Такие приложения, как Claude Code и Cowork, ярко иллюстрируют этот подход. Тем временем OpenAI шаг за шагом совершенствует свой инструмент Codex. Он стартовал как утилита командной строки в апреле, а через месяц обзавелся веб-интерфейсом.
Новое приложение для MacOS
OpenAI делает большой рывок, чтобы не отставать. В понедельник компания представила приложение для MacOS на базе Codex. Оно поддерживает параллельную работу нескольких агентов и включает навыки агентов вместе с передовыми рабочими процессами, которые стали хитом за последний год. Запуск случился меньше чем через два месяца после выхода GPT-5.2-Codex — самой мощной модели OpenAI для кодинга. Фирма рассчитывает, что это перетянет пользователей от Claude Code.
«Если нужно серьезно поработать над сложным проектом, 5.2 — явно самая сильная модель,» — заявил CEO OpenAI Сэм Альтман журналистам на пресс-конференции. «Но пользоваться ею было непросто, поэтому мы упаковали такую мощь в удобный интерфейс — это должно сильно изменить дело».
Что говорят бенчмарки
Уверенность Альтмана в GPT-5.2 понятна, но тесты по кодингу рисуют более нюансированную картину. Модель лидирует в TerminalBench — бенчмарке, проверяющем умение ИИ работать с задачами в командной строке, по крайней мере на момент написания. Агенты от Gemini 3 и Claude Opus показывают почти те же результаты — чуть ниже, но в пределах погрешности. Аналогичная ситуация в SWE-bench, где оценивается способность ИИ исправлять реальные баги в софте: явного превосходства GPT-5.2 нет. К тому же агентные сценарии сложно тестировать надежно, а опыт использования топ-моделей сильно разнится.
Свежие функции Codex
Приложение Codex обзавелось набором новинок, которые, по словам OpenAI, помогут ему сравняться с приложениями Claude или даже обогнать их. Пользователи могут настраивать автоматизации, запускающиеся в фоне по расписанию, — результаты складываются в очередь для проверки по возвращении. Есть выбор личностей для агента: от прагматичной до эмпатичной, в зависимости от стиля работы.
Скорость как главное преимущество
Для OpenAI ключевой плюс — невероятная скорость создания софта благодаря ИИ. «Можно стартовать с чистого листа и за пару часов собрать довольно сложную программу,» — отметил Альтман. «Единственный барьер — насколько быстро я успеваю вводить новые идеи».