OpenAI выпустила GPT-5.3-Codex — свежую модель для программирования. Она берет навыки кодирования у GPT-5.2-Codex и добавляет к ним логику с знаниями из GPT-5.2, при этом ускоряется на 25%. Главное достижение — на тесте Terminal-Bench 2.0 модель обгоняет свежий Opus 4.6 на 12 процентных пунктов, что немало для сегодняшних ИИ, и расходует меньше токенов, чем раньше. В бенчмарке OSWorld для агентов по работе с компьютером набирает 64,7%, в то время как GPT-5.2-Codex — только 38,2%. На GDPval — тесте OpenAI на задачи по 44 профессиям — результаты совпадают с GPT-5.2.
Команда OpenAI использовала ранние варианты модели для поиска ошибок во время обучения, контроля развертывания и проверки результатов. В компании отметили: команда "была поражена", насколько Codex ускорил создание себя самой.
GPT-5.3-Codex уже работает для платных пользователей ChatGPT — в приложении Codex, CLI, расширении IDE и браузере. API откроют скоро. Впервые модель получила оценку "High" по киберрискам, но OpenAI подчеркивает: это просто осторожность, без реальных оснований для такого уровня.