OpenAI представила две новые компактные модели — GPT-5.4 mini и nano. Они созданы для помощников по программированию, субагентов и задач по управлению компьютером. GPT-5.4 mini почти не уступает полной версии по возможностям, хотя обе новинки заметно подорожали по сравнению с прошлыми аналогами.
Разработчики подчеркивают: GPT-5.4 mini сильно обходит GPT-5 mini в задачах программирования, логического мышления, мультимодального анализа и работе с инструментами. При этом скорость работы выросла более чем вдвое. По ряду тестов модель приближается к масштабной GPT-5.4 — например, набирает 54,4% против 57,7% на SWE-Bench Pro для кодирования и 72,1% против 75,0% на OSWorld-Verified для оценки умений взаимодействия с компьютером.
| Benchmark | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| SWE-Bench Pro | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
GPT-5.4 nano — самая маленькая и доступная из новинок. Ее советуют применять для классификации данных, извлечения информации, ранжирования и субагентов по программированию, которые берут на себя базовые вспомогательные операции. По сравнению с GPT-5 nano прогресс тоже значителен.
Большой мозг планирует, малый берет рутину
В Codex OpenAI демонстрирует схему с субагентами, заслуживающую внимания: мощная GPT-5.4 отвечает за стратегию, координацию и итоговую проверку, распределяя параллельные подзадачи по субагентам на базе GPT-5.4 mini или nano.
Такие подзадачи охватывают поиск по кодовой базе, анализ объемных файлов или разбор вспомогательных материалов. GPT-5.4 mini расходует лишь 30% от квоты GPT-5.4 в Codex, что позволяет сократить расходы на легкие операции примерно до трети.
Mini-модель добилась прорыва в управлении компьютером — 72,1% на тесте OSWorld Verified, всего на шаг позади полной GPT-5.4 с ее 75,0%. Предыдущая GPT-5 mini показала здесь только 42,0%.
Программирование
| Benchmark | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| SWE-bench Pro (Public) | 57.7% | 54.4% | 52.4% | 45.7% |
| Terminal-Bench 2.0 | 75.1% | 60.0% | 46.3% | 38.2% |
Работа с инструментами
| Benchmark | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| MCP Atlas | 67.2% | 57.7% | 56.1% | 47.6% |
| Toolathlon | 54.6% | 42.9% | 35.5% | 26.9% |
| τ2-bench (telecom) | 98.9% | 93.4% | 92.5% | 74.1% |
Интеллект
| Benchmark | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| GPQA Diamond | 93.0% | 88.0% | 82.8% | 81.6% |
| HLE w/ tool | 52.1% | 41.5% | 37.7% | 31.6% |
| HLE w/o tools | 39.8% | 28.2% | 24.3% | 18.3% |
Мультимодальность / Зрение / Управление интерфейсом
| Benchmark | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| OSWorld-Verified | 75.0% | 72.1% | 39.0% | 42.0% |
| MMMUPro w/ Python | 81.5% | 78.0% | 69.5% | 74.1% |
| MMMUPro | 81.2% | 76.6% | 66.1% | 67.5% |
| OmniDocBench 1.5 (no tools, lower is better) | 0.109 | 0.1263 | 0.2419 | 0.1791 |
Длинный контекст
| Benchmark | GPT-5.4 | GPT-5.4 mini | GPT-5.4 nano | GPT-5 mini |
|---|---|---|---|---|
| OpenAI MRCR v2 8-needle 64K-128K | 86.0% | 47.7% | 44.2% | 35.1% |
| OpenAI MRCR v2 8-needle 128K-256K | 79.3% | 33.6% | 33.1% | 19.4% |
| Graphwalks BFS 0K-128K | 93.1% | 76.3% | 73.4% | 73.4% |
| Graphwalks parents 0-128K (accuracy) | 89.8% | 71.5% | 50.8% | 64.3% |
Повышенная мощь обошлась втрое-вчетверо дороже
GPT-5.4 mini уже доступна в API, Codex и ChatGPT по цене 0,75 доллара за миллион входных токенов и 4,50 доллара за миллион выходных. Nano работает только через API — 0,20 доллара за входные и 1,25 доллара за выходные на миллион токенов. Обе модели поддерживают окно контекста в 400 тысяч токенов.
Это серьезный рост цен по сравнению с GPT-5 mini и nano. Согласно странице ценообразования OpenAI, GPT-5 mini стоила 0,25 доллара за вход и 2,00 за выход на миллион. GPT-5 nano — 0,05 и 0,40 соответственно.
| Model | Input (per 1M tokens) | Output (per 1M tokens) | Input markup | Output markup |
|---|---|---|---|---|
| GPT-5.4 mini | $0.75 | $4.50 | 3.0x | 2.25x |
| GPT-5.4 nano | $0.20 | $1.25 | 4.0x | 3.125x |
| GPT-5 mini | $0.25 | $2.00 | - | - |
| GPT-5 nano | $0.05 | $0.40 | - | - |
OpenAI объясняет удорожание значительными приростами производительности, благодаря которым компактные версии теперь гораздо ближе по силам к полноразмерным, эксплуатация которых обходится дороже.