OpenAI усилила Agents SDK sandbox для контроля рисков

OpenAI обновила Agents SDK, добавив model-native harness и sandbox execution для безопасного развертывания агентов в продакшене. Это решает проблемы архитектуры, надежности и безопасности, как показала практика Oscar Health с обработкой медицинских записей. Функции доступны всем по стандартным тарифам, с планами на расширение.

OpenAI запускает sandbox execution, чтобы корпоративные команды могли развертывать автоматизированные процессы с минимальными рисками.

При переходе систем из этапа прототипа в боевую эксплуатацию разработчики часто шли на архитектурные компромиссы, определяя место выполнения задач. Фреймворки, не привязанные к конкретным моделям, обеспечивали базовую гибкость, но не раскрывали весь потенциал передовых моделей. SDK от поставщиков моделей работали ближе к самим моделям, однако им не хватало прозрачности в системе контроля.

Управляемые API для агентов упрощали запуск, но жестко ограничивали локации выполнения и доступ к конфиденциальным корпоративным данным. OpenAI решает эти проблемы, добавляя в Agents SDK новые функции: унифицированную инфраструктуру с harness, ориентированным на модель, и встроенным sandbox execution.

Обновленная инфраструктура следует естественному стилю работы базовых моделей, повышая стабильность при координации разнородных систем. Компания Oscar Health демонстрирует это на примере обработки неструктурированных данных.

Медицинский провайдер проверил новую инфраструктуру на автоматизации обработки клинических записей — задачи, которую предыдущие методы выполняли ненадежно. Инженеры хотели, чтобы система точно извлекала метаданные и определяла границы визитов пациентов в объемных медицинских файлах. Автоматизация ускорила анализ историй болезней, упростила координацию ухода и повысила удовлетворенность клиентов.

Рэчел Бернс, ведущий инженер и техлид по ИИ в Oscar Health: «Обновленный Agents SDK позволил нам запустить в продакшен критически важный процесс обработки клинических записей, который раньше не справлялись другие подходы.
Разница не только в извлечении метаданных, но и в точном определении границ каждого визита в длинных сложных записях. Теперь мы быстрее понимаем ситуацию с каждым пациентом на визите, лучше помогаем с уходом и улучшаем опыт взаимодействия».

OpenAI оптимизирует ИИ-процессы с помощью harness, ориентированного на модель

Для запуска таких систем инженерам приходится синхронизировать векторные базы данных, снижать риски галлюцинаций и оптимизировать затратные вычислительные циклы. Без готовых фреймворков команды строят хрупкие самодельные коннекторы.

Новый harness, заточенный под модель, снимает эти проблемы за счет настраиваемой памяти, оркестрации с учетом sandbox и инструментов для файловой системы в стиле Codex. Разработчики подключают стандартные примитивы: использование инструментов через MCP, кастомные инструкции через AGENTS.md, правки файлов с помощью apply patch tool.

Пошаговое раскрытие навыков и выполнение кода через shell tool позволяют решать сложные задачи последовательно. Стандартизация освобождает инженеров от доработки базовой инфраструктуры, позволяя сосредоточиться на бизнес-логике.

Интеграция автономных программ в старые техстэки требует точной маршрутизации. При работе с неструктурированными данными агент сильно зависит от систем поиска релевантного контекста.

Чтобы объединить разные архитектуры и ограничить область работы, SDK вводит абстракцию Manifest. Она стандартизирует описание рабочего пространства: монтирование локальных файлов, задание директорий для выходных данных.

Команды напрямую подключают эти пространства к крупным хранилищам: AWS S3, Azure Blob Storage, Google Cloud Storage и Cloudflare R2. Предсказуемость дает модели четкие параметры для поиска входов, записи выходов и поддержания порядка в длительных сессиях.

Это исключает запросы к неочищенным озерам данных, ограничивая контекст проверенными окнами. Команды по данным теперь точнее отслеживают происхождение каждого автоматизированного решения — от локальных тестов до продакшена.

Повышение безопасности встроенным sandbox execution

SDK из коробки поддерживает sandbox execution: программы запускаются в изолированных средах с нужными файлами и зависимостями. Инженерам больше не нужно собирать этот слой вручную. Можно использовать свои sandbox или встроенную интеграцию с Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop и Vercel.

Главный риск при развертывании автономного кода в компаниях — атаки вроде prompt-injection и попытки выноса данных. Безопасность предполагает, что любая система, читающая внешние данные или выполняющая генерируемый код, подвержена угрозам.

OpenAI решает это разделением harness контроля и слоя вычислений. Учетные данные изолированы от сред, где выполняется код от модели. Изоляция предотвращает доступ вредоносных команд к центральному плану контроля или кражу ключей API, блокируя боковое распространение по сети.

Разделение также решает проблему затрат на сбои. Долгие задачи часто прерываются таймаутами, крашами контейнеров или лимитами API. Если агент на 20 шагов собирает финансовый отчет и падает на 19-м, перезапуск сжигает ресурсы.

При краше sandbox в новой схеме весь процесс не теряется. Состояние хранится снаружи, SDK использует снапшоты и восстановление. Инфраструктура перезапускает чистый контейнер и продолжает с последнего чекпоинта, если среда истекла или упала. Это экономит на облачных вычислениях для долгих задач.

Для масштабирования нужна динамическая аллокация ресурсов. Разделенная архитектура позволяет вызывать один или несколько sandbox по нагрузке, изолировать субагентов и параллелить задачи в контейнерах для ускорения.

Новые функции доступны всем клиентам через API по стандартным тарифам на токены и инструменты, без специальных контрактов. Harness и sandbox сначала для Python, TypeScript — позже.

OpenAI добавит code mode и subagents в библиотеки для Python и TypeScript. Планируется расширение экосистемы: больше провайдеров sandbox и способы интеграции SDK в внутренние системы.

OpenAI Agents SDK усиливает контроль песочницей

OpenAI оптимизирует ИИ-процессы с помощью harness, ориентированного на модель

Повышение безопасности встроенным sandbox execution

Горячее

Seedance 2.5 от ByteDance: ИИ-видео до 30 секунд без склеек

Adobe добавила ИИ-агентов в Photoshop Premiere

Subquadratic утверждает, что решила ключевую проблему больших языковых моделей

Всё больше людей узнают новости от ИИ-чатботов, но доверие остаётся низким

General Intuition привлекла $320 млн на ИИ-агентов из видеоигр

Сейчас в тренде