Tokenmaxxing снижает продуктивность разработчиков

Разработчики хвастаются большими бюджетами токенов для ИИ-кодинга, но данные показывают высокий churn: 80–90% одобрения падает до 10–30% из-за правок. Компании вроде Waydev, GitClear, Faros AI и Jellyfish фиксируют рост объема кода, но не его качества — junior инженеры страдают сильнее.

В менеджменте есть старая истина: то, что измеряют, то и получают в избытке.

Разработчики программного обеспечения десятилетиями спорят о способах оценки продуктивности, начиная со строк кода. Но с появлением новых ИИ-агентов для кодинга, которые выдают больше кода, чем когда-либо, руководителям стало сложнее понять, что именно стоит отслеживать.

Гигантские бюджеты токенов — это объем вычислительных ресурсов ИИ, доступных разработчику, — превратились в символ престижа среди специалистов Кремниевой долины. Однако такая оценка продуктивности выглядит странно. Ведь логичнее фокусироваться на результате, а не на ресурсах, которые тратятся на процесс. Это могло бы подойти для продвижения ИИ-инструментов или продажи токенов, но не для настоящей эффективности.

Свежие данные от компаний, специализирующихся на анализе продуктивности разработчиков, рисуют другую картину. Инструменты вроде Claude Code, Cursor и Codex позволяют создавать гораздо больше одобренного кода, чем раньше. При этом инженеры вынуждены возвращаться к этому коду и править его гораздо чаще, что ставит под сомнение рост продуктивности.

Алекс Circei, основатель и CEO Waydev, развивает платформу для отслеживания подобных процессов. Его компания обслуживает 50 клиентов с более чем 10 000 инженеров.

Руководители отмечают уровень одобрения кода от ИИ на уровне 80–90% — это доля сгенерированного кода, которую разработчики оставляют. Однако они упускают из виду последующие правки, из-за которых реальный показатель падает до 10–30%.

Рост ИИ-инструментов для кодинга заставил Waydev, запущенную в 2017 году для аналитики разработчиков, полностью обновить платформу за последние полгода. Теперь фирма предлагает инструменты для анализа метаданных от ИИ-агентов. Они помогают оценивать качество и стоимость генерируемого кода, давая менеджерам данные об использовании и эффективности ИИ.

Хотя аналитические компании заинтересованы в подчеркивании проблем, тенденция ясна: крупные организации еще осваивают эффективное применение ИИ. Atlassian купила стартап DX по инженерной аналитике за 1 миллиард долларов, чтобы клиенты лучше понимали отдачу от кодинговых агентов.

Общие данные по отрасли подтверждают: код пишется в огромных объемах, но большая его часть не приживается.

GitClear, еще одна компания в этой нише, опубликовала отчет в январе. ИИ повышает продуктивность, но регулярные пользователи демонстрируют в 9,4 раза больше churn кода — удалений по сравнению с добавлениями, — что вдвое превышает прирост от инструментов.

Платформа инженерной аналитики Faros AI проанализировала два года данных клиентов в отчете марта 2026 года. Результат: при высокой доле ИИ churn кода вырос на 861%.

Данные Jellyfish: объем без ценности

Jellyfish, позиционирующая себя как платформу интеллекта для инженерии с ИИ, собрала данные по 7548 инженерам за первый квартал 2026 года. Анализ показал: разработчики с самыми большими бюджетами токенов создавали больше всего pull request — предложений изменений в общей кодовой базе. Но прирост продуктивности не масштабировался. Они достигали вдвое большей пропускной способности при десятикратных затратах на токены. Иными словами, инструменты дают объем, а не ценность.

Такие цифры подтверждаются разговорами с разработчиками: ревью кода и технический долг накапливаются, несмотря на восторг от свободы новых инструментов. Часто отмечают разницу между старшими и младшими инженерами: последние одобряют гораздо больше ИИ-кода и потом переписывают его в больших объемах.

Тем не менее разработчики не планируют отказываться от агентов.

«Это новая эра разработки ПО, к которой приходится адаптироваться компаниям. Цикл не пройдет сам по себе», — отметил Circei.

«Tokenmaxxing» делает разработчиков менее продуктивными

Данные Jellyfish: объем без ценности

Горячее

Как подключить локальные модели к Claude Code в 2026 году

Gemini-SQL2 от Google стала лидером BIRD с 80% точности

Anthropic открыла офис в Сеуле и новые партнерства в Корее

Личный ИИ-ассистент на Python: опыт создания с GPT-4o

Новый бенчмарк показал слабость ИИ в реальной интеллектуальной работе

Сейчас в тренде