В менеджменте есть старая истина: то, что измеряют, то и получают в избытке.
Разработчики программного обеспечения десятилетиями спорят о способах оценки продуктивности, начиная со строк кода. Но с появлением новых ИИ-агентов для кодинга, которые выдают больше кода, чем когда-либо, руководителям стало сложнее понять, что именно стоит отслеживать.
Гигантские бюджеты токенов — это объем вычислительных ресурсов ИИ, доступных разработчику, — превратились в символ престижа среди специалистов Кремниевой долины. Однако такая оценка продуктивности выглядит странно. Ведь логичнее фокусироваться на результате, а не на ресурсах, которые тратятся на процесс. Это могло бы подойти для продвижения ИИ-инструментов или продажи токенов, но не для настоящей эффективности.
Свежие данные от компаний, специализирующихся на анализе продуктивности разработчиков, рисуют другую картину. Инструменты вроде Claude Code, Cursor и Codex позволяют создавать гораздо больше одобренного кода, чем раньше. При этом инженеры вынуждены возвращаться к этому коду и править его гораздо чаще, что ставит под сомнение рост продуктивности.
Алекс Circei, основатель и CEO Waydev, развивает платформу для отслеживания подобных процессов. Его компания обслуживает 50 клиентов с более чем 10 000 инженеров.
Руководители отмечают уровень одобрения кода от ИИ на уровне 80–90% — это доля сгенерированного кода, которую разработчики оставляют. Однако они упускают из виду последующие правки, из-за которых реальный показатель падает до 10–30%.
Рост ИИ-инструментов для кодинга заставил Waydev, запущенную в 2017 году для аналитики разработчиков, полностью обновить платформу за последние полгода. Теперь фирма предлагает инструменты для анализа метаданных от ИИ-агентов. Они помогают оценивать качество и стоимость генерируемого кода, давая менеджерам данные об использовании и эффективности ИИ.
Хотя аналитические компании заинтересованы в подчеркивании проблем, тенденция ясна: крупные организации еще осваивают эффективное применение ИИ. Atlassian купила стартап DX по инженерной аналитике за 1 миллиард долларов, чтобы клиенты лучше понимали отдачу от кодинговых агентов.
Общие данные по отрасли подтверждают: код пишется в огромных объемах, но большая его часть не приживается.
GitClear, еще одна компания в этой нише, опубликовала отчет в январе. ИИ повышает продуктивность, но регулярные пользователи демонстрируют в 9,4 раза больше churn кода — удалений по сравнению с добавлениями, — что вдвое превышает прирост от инструментов.
Платформа инженерной аналитики Faros AI проанализировала два года данных клиентов в отчете марта 2026 года. Результат: при высокой доле ИИ churn кода вырос на 861%.
Данные Jellyfish: объем без ценности
Jellyfish, позиционирующая себя как платформу интеллекта для инженерии с ИИ, собрала данные по 7548 инженерам за первый квартал 2026 года. Анализ показал: разработчики с самыми большими бюджетами токенов создавали больше всего pull request — предложений изменений в общей кодовой базе. Но прирост продуктивности не масштабировался. Они достигали вдвое большей пропускной способности при десятикратных затратах на токены. Иными словами, инструменты дают объем, а не ценность.
Такие цифры подтверждаются разговорами с разработчиками: ревью кода и технический долг накапливаются, несмотря на восторг от свободы новых инструментов. Часто отмечают разницу между старшими и младшими инженерами: последние одобряют гораздо больше ИИ-кода и потом переписывают его в больших объемах.
Тем не менее разработчики не планируют отказываться от агентов.
«Это новая эра разработки ПО, к которой приходится адаптироваться компаниям. Цикл не пройдет сам по себе», — отметил Circei.