
Введение
Каждую неделю появляется новая ИИ-модель, которая обещает превзойти все существующие по результатам тестов. Благодаря работе удается быстро получить доступ к свежим моделям. Обычно нет смысла гнаться за хайпом — хватает той, что система предлагает по умолчанию.
Разработчики и знакомые часто ищут ИИ для создания готового к релизу софта. Они финансируют такие проекты сами, поэтому главное — найти вариант, где цена сочетается с надежностью.
После выхода GPT-5.2 провели тест, чтобы проверить, оправдывает ли модель ожидания и превосходит ли соперников. Выбрали топовые варианты от каждого поставщика: Claude Opus 4.5 (самая мощная модель Anthropic), GPT-5.2 Pro (новейшая от OpenAI с расширенным мышлением) и DeepSeek V3.2 (свежая открытая альтернатива).
Задача для моделей — создать рабочую игру Тетрис одним промтом.
Оценка шла по таким показателям:
| Критерий | Описание |
|---|---|
| Успех с первой попытки | Получился ли рабочий код сразу, без промтов на отладку? Многократные итерации повышают затраты, поэтому этот показатель ключевой. |
| Полнота функций | Реализованы ли все указанные в промте возможности, или что-то упущено? |
| Игровые ощущения | Кроме техники, приятна ли игра? Нет ли проблем, мешающих комфорту? |
| Эффективность по цене | Сколько стоил код, готовый к использованию? |
Промт для теста
Вот текст запроса, который отправили каждой модели:
Build a fully functional Tetris game as a single HTML file that I can open directly in my browser.
Requirements:
GAME MECHANICS:
- All 7 Tetris piece types
- Smooth piece rotation with wall kick collision detection
- Pieces should fall automatically, increase the speed gradually as the user's score increases
- Line clearing with visual animation
- "Next piece" preview box
- Game over detection when pieces reach the topCONTROLS:
- Arrow keys: Left/Right to move, Down to drop faster, Up to rotate
- Touch controls for mobile: Swipe left/right to move, swipe down to drop, tap to rotate
- Spacebar to pause/unpause
- Enter key to restart after game overVISUAL DESIGN:
- Gradient colors for each piece type
- Smooth animations when pieces move and lines clear
- Clean UI with rounded corners
- Update scores in real time
- Level indicator
- Game over screen with final score and restart buttonGAMEPLAY EXPERIENCE AND POLISH:
- Smooth 60fps gameplay
- Particle effects when lines are cleared (optional but impressive)
- Increase the score based on number of lines cleared simultaneously
- Grid background
- Responsive designMake it visually polished and feel satisfying to play. The code should be clean and well-organized.
Результаты
Claude Opus 4.5
Модель Opus 4.5 выдала именно то, что требовалось.
Интерфейс получился аккуратным, инструкции видны сразу. Управление отзывчивое, играть приятно.
Геймплей настолько плавный, что тест затянулся — захотелось поиграть подольше, вместо проверки других вариантов.
Весь процесс занял меньше двух минут, что поразило с первой попытки.

GPT-5.2 Pro
GPT-5.2 Pro — новинка OpenAI с продвинутым мышлением. У модели три уровня: Instant, Thinking и Pro. На момент теста Pro — самый умный вариант с глубоким анализом.
Стоит она в четыре раза дороже Opus 4.5.
Ожидания были высокие из-за шумихи вокруг релиза.
К сожалению, результат разочаровал.
Сначала вышла игра с ошибкой в верстке: нижние ряды поля скрыты за краем экрана, не видно, куда падают фигуры.

Такая проблема удивила, ведь на код ушло около шести минут.
Отправил уточняющий промт для исправления:
The game works, but there's a bug. The bottom rows of the Tetris board are cut off at the bottom of the screen. I can't see the pieces when they land and the canvas extends beyond the visible viewport.
Please fix this by:
1. Making sure the entire game board fits in the viewport
2. Adding proper centering so the full board is visibleThe game should fit on the screen with all rows visible.
После доработки модель дала рабочую версию:

Но ощущения хуже, чем у Opus 4.5.
При нажатии стрелки вниз следующая фигура иногда падала мгновенно, не давая времени на размышления о позиции.
Играть нормально только если ждать естественного падения — опыт далекий от идеала.
(Примечание: GPT-5.2 Standard тоже дала код с ошибками с первой попытки.)
DeepSeek V3.2
Первая версия от DeepSeek имела пару проблем:
- Фигуры исчезали при касании низа экрана.
- Стрелка вниз прокручивала всю страницу вместо ускорения падения.

После уточняющего промта управление заработало правильно.
Но фигуры по-прежнему пропадали до приземления. Даже после второй итерации играть невозможно.
Проблему можно устранить за 2–3 дополнительных промта. Учитывая низкую цену DeepSeek, даже 10+ итераций обойдутся дешевле одной удачной попытки Opus 4.5.
Итоги: GPT-5.2 против Opus 4.5 и DeepSeek V3.2
Расчет затрат
Сравнение цен на три модели:
| Модель | Ввод (за 1M токенов) | Вывод (за 1M токенов) |
|---|---|---|
| DeepSeek V3.2 | $0.27 | $1.10 |
| GPT-5.2 | $1.75 | $14.00 |
| Claude Opus 4.5 | $5.00 | $25.00 |
| GPT-5.2 Pro | $21.00 | $84.00 |
DeepSeek V3.2 — самый доступный вариант, веса модели можно скачать бесплатно и запустить самостоятельно.
GPT-5.2 в семь раз дороже DeepSeek V3.2, дальше идут Opus 4.5 и GPT-5.2 Pro.
На задачу ушло около 1000 токенов ввода и 3500 вывода.
Каждый лишний промт — плюс 1500 токенов. Общие затраты по моделям:
| Модель | Общая стоимость | Результат |
|---|---|---|
| DeepSeek V3.2 | ~$0.005 | Игра неиграбельна |
| GPT-5.2 | ~$0.07 | Играбельно, но плохой опыт |
| Claude Opus 4.5 | ~$0.09 | Играбельно и приятный опыт |
| GPT-5.2 Pro | ~$0.41 | Играбельно, но плохой опыт |
Выводы
По итогам теста для обычных задач по кодированию лучше всего подходит Opus 4.5.
GPT-5.2 дешевле Opus 4.5, но дополнительные итерации для равного результата сведут разницу на нет.
DeepSeek V3.2 сильно выгоднее по цене.
Если бюджет ограничен и есть время на правки, даже больше десятка попыток сэкономят деньги.
Неожиданно GPT-5.2 Pro не справился с первой попытки — шесть минут на размышления, а код с дефектами. Ведь это флагман OpenAI, а Тетрис — несложная задача.
GPT-5.2 Pro силен в математике и исследованиях, где не нужны шаблоны из обучения. Возможно, для простого кода она избыточна — лучше для сложных новаторских архитектур.
Главные уроки эксперимента:
- Opus 4.5 лидирует в повседневном программировании.
- DeepSeek V3.2 — бюджетный выбор с приемлемым качеством, но требует доработок.
- GPT-5.2 (Standard) уступает Opus 4.5, а GPT-5.2 (Pro) подходит для глубокого анализа, а не быстрых задач вроде этой.