AWS re:Invent 2025: фронтир-агенты вместо чат-ботов

На AWS re:Invent 2025 фокус сместился от чат-ботов к пограничным ИИ-агентам, которые могут автономно работать днями и интегрируются в реальные бизнес-процессы. AWS продвигает для этого AgentCore, новые Trainium3 UltraServers и AI Factories, а также инструменты модернизации legacy-систем и механизмы безопасного управления агентами. Вопрос для бизнеса теперь в том, как обеспечить инфраструктуру и экономику таких решений, а не в том, способен ли ИИ в принципе приносить пользу.

AWS re:Invent 2025: эра чат-ботов заканчивается

На конференции AWS re:Invent 2025 в Лас-Вегасе прозвучал однозначный сигнал: эпоха генеративных чат-ботов подходит к концу. На смену простым диалоговым интерфейсам приходят пограничные (frontier) ИИ-агенты, которые не просто общаются с пользователем, а способны автономно выполнять работу на протяжении нескольких дней.

Фокус индустрии смещается от эффектных демонстраций к тяжелой инфраструктурной реальности: экономике вычислений, надежности и управляемости сложных систем. Эффект новизны от бота, который пишет стихи, уже исчез; теперь бизнесу приходится оплачивать реальные счета за масштабирование этих систем.

Как AWS решает "сантехнический" кризис инфраструктуры

От кустарных решений к платформе для ИИ-агентов

До недавнего времени создание пограничных ИИ-агентов, которые способны выполнять сложные, недетерминированные задачи, было болезненным и штучным инженерным процессом. Ранние пользователи тратили ресурсы на сборку разрозненных инструментов для управления контекстом, долговременной памятью и безопасностью.

AWS предлагает убрать эту сложность с помощью управляемого сервиса Amazon Bedrock AgentCore. По сути, это операционная система для ИИ-агентов, которая берет на себя задачи управления состоянием, хранение и восстановление контекста и другие фоново работающие механизмы. Стандартизация этого базового уровня дает заметный выигрыш по эффективности и сокращает время вывода решений в продакшн.

Примеры: MongoDB и PGA TOUR

Характерный пример — MongoDB. Отказавшись от собственной самодельной инфраструктуры в пользу AgentCore, компания смогла сократить число вспомогательных инструментов и выпустить в промышленную эксплуатацию приложение на базе агента всего за восемь недель. Ранее на оценку, интеграцию и обслуживание подобных решений уходили месяцы.

Еще более заметный эффект получил PGA TOUR. Организация использовала платформу для создания системы генерации контента. В результате скорость подготовки материалов выросла примерно в 10 раз (на 1 000 процентов), а затраты сократились на 95 процентов. Это показывает, как переход от экспериментальных чат-ботов к агентным системам меняет экономику контента и внутренних сервисов.

Фронтир-агенты для разработчиков и DevOps

На re:Invent 2025 AWS представила набор специализированных пограничных ИИ-агентов для инженерных команд: виртуального разработчика Kiro, Security Agent и DevOps Agent.

Kiro позиционируется не как очередной инструмент автодополнения кода, а как полноценный участник процесса разработки. Он интегрируется прямо в рабочие процессы и получает так называемые "способности" («powers») — целевые интеграции с инструментами вроде Datadog, Figma и Stripe. Благодаря этому агент действует с учетом бизнес-контекста и состояния систем, а не просто угадывает нужный синтаксис по тексту запроса к модели.

Цена автономных агентов: вычисления и железо

Агенты, которые могут автономно работать в течение нескольких дней, требуют колоссальных вычислительных ресурсов. Нагрузка на вычислительные мощности становится критичным фактором: если платить за такие сценарии по стандартным on-demand тарифам, экономическая эффективность решения быстро падает.

AWS понимает это и делает ставку на агрессивное развитие аппаратной платформы. В этом году компания представила новые Trainium3 UltraServers на базе 3-нм чипов. По заявлениям AWS, они обеспечивают прирост производительности обучения примерно в 4,4 раза по сравнению с предыдущим поколением. Для организаций, которые обучают крупные базовые модели, это сокращает сроки обучения с месяцев до недель, что напрямую влияет на стоимость и скорость экспериментов.

Где должны жить вычисления: AI Factories и суверенитет данных

Но важна не только мощность, но и место размещения вычислений. Вопрос суверенитета данных остаётся острой проблемой для глобального бизнеса: локальное регулирование и чувствительные данные часто препятствуют использованию публичного облака для критичных ИИ-нагрузок.

В ответ AWS предлагает концепцию «AI Factories» — по сути, это поставка стоек с Trainium и GPU от NVIDIA прямо в существующие дата-центры клиентов. Такой гибридный подход учитывает простую реальность: для части данных публичное облако действительно остается «слишком далёким» с точки зрения регуляций, задержек и рисков. AI Factories позволяют использовать ту же инфраструктуру и стек ИИ-инструментов AWS, но в периметре заказчика.

Работа с техническим долгом и модернизацией

Автоматизация борьбы с наследием

Инновации в области пограничных ИИ-агентов впечатляют, но у большинства ИТ-организаций значительную часть бюджета съедает обслуживание устаревших систем. Оценочно, команды тратят около 30 процентов своего времени только на поддержание текущей инфраструктуры в рабочем состоянии.

Во время re:Invent 2025 Amazon обновила сервис AWS Transform, чтобы направить агентный ИИ на решение именно этой проблемы. Сервис использует агентов для рутинной работы по обновлению и миграции старого кода. Теперь платформа способна выполнять полноценную модернизацию стека Windows: от обновления .NET-приложений до работы с базами данных на SQL Server.

Кейс Air Canada: ускоренная миграция Lambda

Air Canada уже применила обновленный AWS Transform для модернизации тысяч функций AWS Lambda. Проект завершили за считанные дни. По оценке компании, ручная миграция обошлась бы примерно в пять раз дороже и заняла бы недели интенсивной работы команд разработки и эксплуатации.

Новые инструменты для разработчиков: Strands Agents SDK

Для инженеров, которые хотят продолжать писать и развивать собственный код, экосистема вокруг ИИ-агентов тоже расширяется. Strands Agents SDK, который ранее был доступен только для Python, теперь поддерживает и TypeScript. С учетом того, что TypeScript де-факто стал основным языком для веб-разработки, это важный шаг.

Поддержка строгой типизации помогает приручить хаотичный вывод больших языковых моделей. Авторы решений получают возможность формализовать структуру данных, которые возвращают агенты, и уменьшить количество ошибок интеграции, что делает разработку на базе LLM более предсказуемой и промышленной.

Грамотное управление и безопасность в эпоху ИИ-агентов

Риски автономии: от утечек до поломок

У подхода, при котором ИИ-агенты могут работать автономно «днями без вмешательства человека», есть обратная сторона. Такой агент способен не только приносить пользу, но и, например, незаметно повредить важную базу данных или допустить утечку персональных данных, если его действия недостаточно ограничены и не отслеживаются.

AgentCore Policy и Evaluations: рамки и контроль

AWS пытается снизить эти риски с помощью механизма AgentCore Policy. Этот инструмент позволяет задавать ограничения для агентов на естественном языке — по сути, определять, что им разрешено делать, а что запрещено. Это упрощает настройку политики поведения для команд, которым сложно быстро формализовать ограничения в виде сложных конфигураций и кода.

В дополнение к этому AWS предлагает систему Evaluations, которая использует готовые наборы метрик и проверок для мониторинга эффективности и корректности работы агентов. В связке эти инструменты формируют необходимый «страховочный каркас», который делает внедрение пограничных ИИ-агентов более управляемым для крупных организаций.

Усиление кибербезопасности: Security Hub и GuardDuty

Команды безопасности тоже получают новые возможности. Обновленный AWS Security Hub теперь умеет агрегировать сигналы от GuardDuty, Inspector и Macie в единые события. Вместо того чтобы заваливать специалистов десятками разрозненных алертов, система группирует связанные сигналы в одно комплексное происшествие, упрощая реагирование.

Сам GuardDuty также развивается: сервис расширяет использование машинного обучения для выявления сложных шаблонов угроз в кластерах EC2 и ECS. Это помогает обнаруживать более изощренные атаки и аномальное поведение в распределенных облачных средах, где традиционные сигнатурные методы уже не справляются.

Переход от экспериментов к промышленной эксплуатации

Судя по анонсам AWS re:Invent 2025, индустрия генеративного ИИ заметно отошла от стадии пилотных проектов и демонстраций. От специализированного кремния до управляемых фреймворков для пограничных ИИ-агентов — новые инструменты явно ориентированы на эксплуатацию в продакшне.

Для руководителей крупных компаний вопрос уже звучит по-другому. Речь идет не о том, на что способен ИИ в принципе, а о том, сможет ли организация позволить себе инфраструктуру и управление, необходимые для того, чтобы эти системы полноценно выполняли свою работу и приносили измеримую пользу.

AWS re:Invent 2025: агенты сменяют чат-ботов