Следующая эволюция Agents SDK от OpenAI

15.04.2026 · 5 минут на чтение

Обновлённый Agents SDK помогает разработчикам создавать агентов, которые могут работать с файлами, выполнять команды, редактировать код и решать длинные многошаговые задачи в контролируемых sandbox-окружениях.

OpenAI добавила в Agents SDK новые возможности, которые дают разработчикам более стандартную и более нативную для моделей OpenAI инфраструктуру. Речь идёт о двух ключевых вещах: model-native harness, который позволяет агенту работать с файлами и инструментами на компьютере, и нативном sandbox-исполнении, чтобы запускать такую работу безопасно.

По сути, OpenAI говорит о старой проблеме агентных систем: одних только сильных моделей недостаточно. Чтобы агент был реально полезным, ему нужны механизмы для работы с файлами, запуска команд, написания кода и устойчивого выполнения длинных цепочек действий. Существующие подходы имеют компромиссы: независимые от модели фреймворки гибкие, но не всегда хорошо используют возможности передовых моделей; SDK от провайдера модели ближе к самой модели, но могут быть слишком закрытыми; managed agent API упрощают развёртывание, но ограничивают среду выполнения и доступ к чувствительным данным.

Более мощный harness для агентного цикла

С этим релизом harness в Agents SDK стал заметно функциональнее для агентов, которые работают с документами, файлами и внешними системами. Теперь он поддерживает настраиваемую память, оркестрацию с учётом sandbox, инструменты файловой системы в стиле Codex и стандартизированные интеграции с примитивами, которые становятся нормой для современных агентных систем.

Среди таких примитивов OpenAI отдельно упоминает:

использование инструментов через MCP,
progressive disclosure через skills,
пользовательские инструкции через AGENTS.md,
выполнение кода через shell tool,
редактирование файлов через apply patch.

Логика здесь простая: OpenAI хочет, чтобы разработчики меньше тратили времени на сборку базовой агентной инфраструктуры и больше занимались прикладной логикой своего продукта. Компания также подчёркивает, что harness будет и дальше впитывать новые агентные паттерны и примитивы.

Ещё один важный тезис статьи: если execution-модель ближе к тому, как frontier-модели «естественно» работают, агент становится надёжнее и эффективнее на сложных задачах. Особенно это важно для длинных запусков и сценариев, где задействовано много разных инструментов и систем.

Нативное выполнение в sandbox

Обновлённый Agents SDK теперь нативно поддерживает запуск в sandbox. Это значит, что агент может работать в контролируемой компьютерной среде, где у него есть нужные файлы, инструменты и зависимости для конкретной задачи.

OpenAI прямо указывает, что многим полезным агентам нужна рабочая среда, в которой они могут:

читать и записывать файлы,
устанавливать зависимости,
запускать код,
безопасно использовать инструменты.

Раньше разработчикам часто приходилось собирать этот слой вручную. Теперь sandbox-поддержка встроена в SDK. При этом можно либо использовать собственный sandbox, либо подключать готовые варианты. На момент публикации поддерживаются Blaxel, Cloudflare, Daytona, E2B, Modal, Runloop и Vercel.

Чтобы такие окружения были переносимыми между провайдерами, в SDK введена абстракция Manifest. Она описывает рабочее пространство агента: какие локальные файлы монтировать, куда писать результаты, какие данные подтягивать из внешних хранилищ. Среди поддерживаемых источников данных названы AWS S3, Google Cloud Storage, Azure Blob Storage и Cloudflare R2.

Идея здесь здравая: и разработчик, и модель получают предсказуемую структуру окружения. Понятно, где лежат входные данные, куда писать выходные результаты и как организовывать долгую многошаговую работу.

Разделение harness и compute

Это, вероятно, самый важный архитектурный кусок статьи.

OpenAI пишет, что агентные системы нужно проектировать так, будто prompt injection и попытки утечки данных неизбежны. Поэтому разделение harness и compute помогает держать учётные данные и чувствительные секреты вне тех окружений, где выполняется код, сгенерированный моделью.

Кроме безопасности, это даёт и устойчивость. Если состояние агента вынесено наружу, потеря sandbox-контейнера не означает потерю всего запуска. Благодаря snapshotting и rehydration Agents SDK может восстановить состояние агента в новом контейнере и продолжить выполнение с последней контрольной точки, если исходная среда сломалась или истекла.

Третье преимущество — масштабирование. Один запуск агента может использовать один sandbox или несколько, вызывать sandbox только по необходимости, отправлять сабагентов в изолированные окружения и распараллеливать работу по контейнерам для ускорения выполнения.

Это уже не «игрушечный агент с тулзами», а заготовка под реально промышленную архитектуру.

Цена и доступность

Новые возможности Agents SDK доступны всем клиентам через API и используют стандартную модель тарификации API: оплата зависит от токенов и использования инструментов.

Что дальше

Новые harness- и sandbox-возможности сначала запускаются в Python. Поддержка TypeScript запланирована позже. Также OpenAI работает над тем, чтобы принести дополнительные агентные возможности, включая code mode и subagents, и в Python, и в TypeScript.

Отдельно OpenAI пишет, что хочет постепенно объединять более широкий агентный экосистемный слой: добавлять новых sandbox-провайдеров, новые интеграции и больше способов встроить SDK в уже существующие инструменты и системы разработчиков.

Суть статьи в одном выводе

Если убрать маркетинговую оболочку, смысл такой: OpenAI пытается превратить Agents SDK из набора удобных обвязок в полноценный стандартный runtime для production-агентов. Акцент сделан не на «агент умеет вызвать tool», а на более серьёзных вещах: файловая работа, код, длительное выполнение, изоляция среды, переносимость между sandbox-провайдерами и восстановление после сбоев. Это уже ближе к платформе для реальных агентных систем, а не к демо-обвязке вокруг модели.

Источник - https://openai.com/index/the-next-evolution-of-the-agents-sdk/

Был ли материал полезен?

0 0