Обновлённый Agents SDK помогает разработчикам создавать агентов, которые могут работать с файлами, выполнять команды, редактировать код и решать длинные многошаговые задачи в контролируемых sandbox-окружениях.
OpenAI добавила в Agents SDK новые возможности, которые дают разработчикам более стандартную и более нативную для моделей OpenAI инфраструктуру. Речь идёт о двух ключевых вещах: model-native harness, который позволяет агенту работать с файлами и инструментами на компьютере, и нативном sandbox-исполнении, чтобы запускать такую работу безопасно.
По сути, OpenAI говорит о старой проблеме агентных систем: одних только сильных моделей недостаточно. Чтобы агент был реально полезным, ему нужны механизмы для работы с файлами, запуска команд, написания кода и устойчивого выполнения длинных цепочек действий. Существующие подходы имеют компромиссы: независимые от модели фреймворки гибкие, но не всегда хорошо используют возможности передовых моделей; SDK от провайдера модели ближе к самой модели, но могут быть слишком закрытыми; managed agent API упрощают развёртывание, но ограничивают среду выполнения и доступ к чувствительным данным.
Более мощный harness для агентного цикла
С этим релизом harness в Agents SDK стал заметно функциональнее для агентов, которые работают с документами, файлами и внешними системами. Теперь он поддерживает настраиваемую память, оркестрацию с учётом sandbox, инструменты файловой системы в стиле Codex и стандартизированные интеграции с примитивами, которые становятся нормой для современных агентных систем.
Среди таких примитивов OpenAI отдельно упоминает:
- использование инструментов через MCP,
- progressive disclosure через skills,
- пользовательские инструкции через AGENTS.md,
- выполнение кода через shell tool,
- редактирование файлов через apply patch.
Логика здесь простая: OpenAI хочет, чтобы разработчики меньше тратили времени на сборку базовой агентной инфраструктуры и больше занимались прикладной логикой своего продукта. Компания также подчёркивает, что harness будет и дальше впитывать новые агентные паттерны и примитивы.
Ещё один важный тезис статьи: если execution-модель ближе к тому, как frontier-модели «естественно» работают, агент становится надёжнее и эффективнее на сложных задачах. Особенно это важно для длинных запусков и сценариев, где задействовано много разных инструментов и систем.
Нативное выполнение в sandbox
Обновлённый Agents SDK теперь нативно поддерживает запуск в sandbox. Это значит, что агент может работать в контролируемой компьютерной среде, где у него есть нужные файлы, инструменты и зависимости для конкретной задачи.
OpenAI прямо указывает, что многим полезным агентам нужна рабочая среда, в которой они могут:
- читать и записывать файлы,
- устанавливать зависимости,
- запускать код,
- безопасно использовать инструменты.
Раньше разработчикам часто приходилось собирать этот слой вручную. Теперь sandbox-поддержка встроена в SDK. При этом можно либо использовать собственный sandbox, либо подключать готовые варианты. На момент публикации поддерживаются Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop и Vercel.
Чтобы такие окружения были переносимыми между провайдерами, в SDK введена абстракция Manifest. Она описывает рабочее пространство агента: какие локальные файлы монтировать, куда писать результаты, какие данные подтягивать из внешних хранилищ. Среди поддерживаемых источников данных названы AWS S3, Google Cloud Storage, Azure Blob Storage и Cloudflare R2.
Идея здесь здравая: и разработчик, и модель получают предсказуемую структуру окружения. Понятно, где лежат входные данные, куда писать выходные результаты и как организовывать долгую многошаговую работу.
Разделение harness и compute
Это, вероятно, самый важный архитектурный кусок статьи.
OpenAI пишет, что агентные системы нужно проектировать так, будто prompt injection и попытки утечки данных неизбежны. Поэтому разделение harness и compute помогает держать учётные данные и чувствительные секреты вне тех окружений, где выполняется код, сгенерированный моделью.
Кроме безопасности, это даёт и устойчивость. Если состояние агента вынесено наружу, потеря sandbox-контейнера не означает потерю всего запуска. Благодаря snapshotting и rehydration Agents SDK может восстановить состояние агента в новом контейнере и продолжить выполнение с последней контрольной точки, если исходная среда сломалась или истекла.
Третье преимущество — масштабирование. Один запуск агента может использовать один sandbox или несколько, вызывать sandbox только по необходимости, отправлять сабагентов в изолированные окружения и распараллеливать работу по контейнерам для ускорения выполнения.
Это уже не «игрушечный агент с тулзами», а заготовка под реально промышленную архитектуру.
Цена и доступность
Новые возможности Agents SDK доступны всем клиентам через API и используют стандартную модель тарификации API: оплата зависит от токенов и использования инструментов.
Что дальше
Новые harness- и sandbox-возможности сначала запускаются в Python. Поддержка TypeScript запланирована позже. Также OpenAI работает над тем, чтобы принести дополнительные агентные возможности, включая code mode и subagents, и в Python, и в TypeScript.
Отдельно OpenAI пишет, что хочет постепенно объединять более широкий агентный экосистемный слой: добавлять новых sandbox-провайдеров, новые интеграции и больше способов встроить SDK в уже существующие инструменты и системы разработчиков.
Суть статьи в одном выводе
Если убрать маркетинговую оболочку, смысл такой: OpenAI пытается превратить Agents SDK из набора удобных обвязок в полноценный стандартный runtime для production-агентов. Акцент сделан не на «агент умеет вызвать tool», а на более серьёзных вещах: файловая работа, код, длительное выполнение, изоляция среды, переносимость между sandbox-провайдерами и восстановление после сбоев. Это уже ближе к платформе для реальных агентных систем, а не к демо-обвязке вокруг модели.
Источник - https://openai.com/index/the-next-evolution-of-the-agents-sdk/