游乐游手机版
首页/AI热点日报/热点详情

OpenAI Agents SDK开发指南:构建智能体应用的核心框架

类型:热点整理2026-05-18
先看几个关键数据:Stripe内部的AI智能体每周能产出超过1000个代码PR;Ramp公司一半的PR由部署在Modal平台上的智能体独立完成;而Tomoro AI在同等能力下,代码量减少了六倍。这些不是概念演示,而是OpenAI在其Agents SDK更新中披露的真实生产案例。 时间来到2026年

先看几个关键数据:Stripe内部的AI智能体每周能产出超过1000个代码PR;Ramp公司一半的PR由部署在Modal平台上的智能体独立完成;而Tomoro AI在同等能力下,代码量减少了六倍。这些不是概念演示,而是OpenAI在其Agents SDK更新中披露的真实生产案例。

时间来到2026年4月,OpenAI对Agents SDK进行了一次彻底的架构重写。这次更新标志着其早期实验性的多智能体框架“Swarm”正式升级为生产级SDK,并原生整合了七大沙箱厂商,推出了“Harness”与“Compute”分离的核心架构。从模型层到基础设施层,一个为智能体时代打造的“底层操作系统”正在浮出水面。

Swarm项目曾是OpenAI探索多智能体协作的试验田,验证了智能体间任务移交(Handoff)与协作编排的可行性。但它始终未面向生产环境,缺乏追踪、会话持久化、安全防护等企业级必需功能。如今,Swarm的核心设计理念被完整注入新的Agents SDK,完成了从实验室到生产线的关键一跃。

三大核心原语:极简到零学习成本

新版Agents SDK的设计哲学是极简,它只保留了三个基本组件,没有任何多余的抽象层:智能体(Agent)、任务移交(Handoff)和安全护栏(Guardrails)。

除此之外,SDK开箱即用地集成了会话记忆持久化(支持SQLAlchemy、SQLite及加密存储)、人在回路的干预机制、工作流追踪与可视化工具,并能与OpenAI的评估、微调、蒸馏工具套件无缝对接。它还内置了MCP服务工具集成,支持使用gpt-realtime-1.5等模型。

Harness与Compute分离:架构安全的核心解法

让智能体在无人监管的环境中运行代码、读写文件、安装依赖,这既是企业的刚需,也构成了最大的安全风险。OpenAI给出的解决方案是:将智能体的运行拆分为两个独立且隔离的层级。

Harness层负责控制流、模型调用、工具路由以及任务的暂停与恢复。最关键的是,所有敏感凭证和API密钥都只驻留在此层,永远不会流入执行环境。

Compute层则是一个独立的隔离环境,专门处理文件读写、命令执行和依赖安装等操作,且只能访问被明确授权的资源和工具。

这种分离带来了直接收益:沙箱容器的崩溃不会波及主控系统;即便沙箱被完全攻破,敏感凭证也不会泄露;同时,同一个Harness可以无缝切换不同的沙箱供应商,避免了企业被单一厂商锁定的风险。

七大沙箱厂商原生接入

通过统一的Manifest抽象层,OpenAI一次性接入了Blaxel、Cloudflare、Daytona、E2B、Modal、Runloop、Vercel这七家头部沙箱厂商。开发者只需更改配置,就能让智能体在不同沙箱间迁移,无需重写代码。

SDK还支持沙箱快照与状态恢复,这意味着长时间运行的智能体在遇到容器中断后,可以从检查点继续执行,不再因意外崩溃而丢失进度。多沙箱并行和子智能体隔离功能也已就绪,智能体得以“分身作战”。在存储层面,SDK直接支持AWS S3、Google Cloud Storage、Azure Blob Storage和Cloudflare R2这四大主流云存储服务。

冲击波:第三方框架的护城河正在被填平

此前,LangChain、CrewAI、LangGraph等第三方框架占据的阵地——如工作流编排、记忆管理、工具调用和安全防护——正逐渐被OpenAI的原生能力接管。这并非简单的功能对标。SDK与GPT模型之间达成的协议级深度整合,是任何第三方框架都无法复制的优势。当最新、最完整的解决方案变得开箱即用且免费时,开发者的迁移动力将非常直接。

沙箱厂商的角色同样面临重新定义:被纳入SDK生态后,它们从独立的执行平台转变为OpenAI生态内的“标准化组件供应商”。好处是能获得稳定的流量和统一的接口,代价则是在议价能力和产品差异化空间上受到限制。

不过,OpenAI也留了一道口子:SDK与Responses API并非互斥关系。官方文档明确建议采用混合架构,即顶层使用SDK管理工作流,底层则直接调用Responses API。这为第三方框架通过提供差异化功能,切入特定垂直场景留下了空间。

三方棋局:OpenAI、Anthropic与谷歌

智能体基础设施正在成为大模型厂商角逐的下一个主战场。目前,三条差异化路线正在成形:

OpenAI走的是“框架+沙箱+生态”的路线,试图构建智能体的“操作系统”。

Anthropic则专注于“模型原生智能体”,通过Computer Use和MCP(模型上下文协议)将能力深度内嵌于模型的推理过程之中。

谷歌的路径更偏向研究驱动的基础设施化,其Deep Research Max等项目主要面向金融、生命科学等专业领域。

对开发者而言,巨头竞赛带来的红利是明确的——框架的使用门槛正在快速降低,企业级智能体的落地路径,已经从“一切从头自研”转变为“选择一个框架,配置一个沙箱,然后立刻开始创造价值”。

留给开发者的窗口期

需要警惕的是,Agents SDK目前仍处于0.Y.Z版本,仅支持Python,TypeScript版本已在计划中。这意味着其API仍有调整的可能,而现在就介入的早期采用者,将能直接影响其最终形态。对于正在评估智能体基础设施的技术团队而言,采取“再等等看”的策略,反而可能是机会成本最高的一种选择。

OpenAI正在从一家纯粹的模型公司,转型为一家基础设施公司。当智能体框架、沙箱生态和模型能力三者收敛到一个统一的体系之下,开发者所做的选择就不再仅仅是“使用哪个模型”,而是“接入哪个生态”。

这个选择,其影响正在变得愈发深远和不可逆。

来源:https://www.51cto.com/article/841437.html

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。