Распространённый нарратив гласит, что ИИ-агенты поглощают всё больше задач по программированию, а разработчики рискуют устареть. Однако свежая работа учёных из Chalmers University of Technology и Volvo Group убеждает: такая картина упускает суть.
Авторы предлагают иной взгляд: системы на базе ИИ-агентов дополняют инженерию ПО так называемыми «полуисполняемыми артефактами». Сюда входят промты, рабочие процессы, политики, правила эскалации и рутины принятия решений. Они определяют поведение системы не хуже кода, но для запуска требуют человеческой или вероятностной интерпретации.
Шесть колец вместо одного кода
В центре исследования — «Полуисполняемый стек», диагностическая модель из шести колец. В ядре — традиционный код как кольцо 1, за ним следуют промты и спецификации на естественном языке как кольцо 2, оркестрированные рабочие процессы агентов как кольцо 3. Кольцо 4 охватывает системы контроля вроде защитных барьеров и мониторинга. Кольцо 5 воплощает операционную логику организации, такую как рутины принятия решений. Кольцо 6 отвечает за социальное и институциональное соответствие, включая рамки вроде EU AI Act.

Создатели подчёркивают: инженерия ПО веками сосредотачивалась на кольцах 1 и 2. Сегодня кольца 2–5 выходят на передний план как ключевые объекты разработки, а кольцо 6 всё чаще определяет, что сработает на деле.
Самый заметный пробел, по мнению авторов, приходится на внешние кольца 5 и 6. Для кода методы существуют десятилетиями, а аналоги для рутин решений, управления и институционального соответствия пока отсутствуют. Большинство работ по-прежнему фокусируется на генерации кода, исправлении ошибок, тестировании и бенчмарках в кольцах 1–3.
Тезис подкрепляют три вывода: во-первых, ИИ меняет работу команд, если оказывается достаточно компетентным, без нужды соперничать с лучшими специалистами. Во-вторых, масштаб применения важнее пиковой производительности — множество повседневных ИИ-развёртываний приносят больше пользы, чем редкий доступ к эксперту. В-третьих, когда эксперты по доменам сами создают системы через естественный язык, спрос на строгие инженерные подходы только растёт.
Типичные возражения превращаются в инженерные задачи
Вместо игнорирования стандартных претензий к надёжности, хаосу в коде и прочему, авторы переосмысливают их как задачи для инженерии. Галлюцинации агентов усиливают нужду в тестировании и мониторинге. Ускоренная генерация кода ИИ повышает расходы на поддержку. Пример — «дрейф промта»: изменение запроса приводит к неожиданному поведению системы, и потом никто не понимает причины.
Когда компании сталкиваются с этими переменами, сам переход обретает черты инженерной проблемы. А сложность автоматизации тонких суждений как раз повышает их ценность: по мере удешевления и автоматизации базовых задач такие навыки становятся дефицитными, отмечают исследователи.
Для практиков доклад ясно даёт понять: дефицитный навык перемещается от ускорения создания к выбору, что строить или менять, какое кольцо затрагивать, как проверять изменения, управлять ими и обеспечивать долгосрочную поддержку.
Команды, видящие в ИИ лишь ускоритель для колец 1 и 2, добьются локальных приростов производительности, но упустят глобальный вопрос перестройки организации.
Работа сопровождает доклад Роберта Фельдта на воркшопе Agentic Engineering 2026 в Рио-де-Жанейро и опирается отчасти на промышленный опыт в автосекторе с партнёрами Volvo.