这套套件覆盖了智能体开发的关键环节:感知(搜索)、记忆(文件检索)、行动(电脑操控),再辅以新的API和SDK进行粘合调度。对于想要上手智能体开发的开发者而言,现在正是动手的好时机。OpenAI发布AI智能体构建套件 Agent开发者必备
OpenAI发布AI智能体构建套件,包含WebSearch、FileSearch和ComputerUse三大工具,分别实现实时联网搜索、元数据筛选直连向量数据库的知识检索及电脑自动化操控。配套推出支持多工具调用的ResponsesAPI与多智能体协作的AgentsSDK,覆盖感知、记忆与行动关键环节,助力智能体从对话进化到执行实际任务。
OpenAI近期重磅推出了一套AI智能体构建套件,为正在开发智能体的技术团队提供了近乎完整的工具箱。该套件涵盖搜索、知识检索与电脑操控三大核心场景,包含三项关键工具,目标清晰:助力智能体从“能聊几句”向“能办正事”迈进。
首先来看 **Web Search 工具**。顾名思义,它赋予AI智能体实时联网搜索的能力。过去许多模型生成的内容常被指“过时”或“凭空编造”,而借助这一工具,智能体可直接获取最新信息,显著提升回答的准确性与时效性。本质上,这相当于为智能体配备了“实时信息源”,使其不再依赖训练数据中的陈旧内容。
第二个是 **File Search 工具**。此次升级的一大亮点是支持元数据筛选,并能直接连接向量数据库。这意味着什么?以往进行知识检索(即RAG)时,开发者往往需要自行搭建一套复杂的检索流程;而现在,通过这一工具便能轻松完成——直接从企业或个人私有的文档库中高效定位信息,准确率也更有保障。对于构建知识库问答系统或内部文档助手等应用的开发者来说,该工具节省的远不止几行代码。
第三个值得重点介绍:**Computer Use 工具**。它可以操控电脑自动化执行任务——即使是那些缺乏API的陈旧软件,也能通过模拟操作来完成。举例来说,假如你有一个几十年前的行业系统,没有接口、没有文档,却需要自动化录入数据。以前只能人工点击,现在智能体可以自行“看”屏幕、点击按钮、填写表单。复杂任务一键自动化,背后释放的生产力相当可观。
介绍完工具,再来看底层基础设施。OpenAI此次推出了 **Responses API**,支持多轮对话,并能同时调用多个工具。以前要实现“先搜索、再检索、最后生成报告”的流程,需要串联多个API调用;而现在一个Response API即可完成,流程简化,效率自然提升。值得注意的是,该API将逐步取代旧的Assistant API,后者计划于2026年停止服务——建议开发者尽早迁移。
与此同时,开源阵营也在持续演进。原本的智能体编排框架 **Swarm** 升级为 **Agents SDK**,更贴近生产环境。它支持智能体间的协作与任务交接,并内置了流程监控与追踪功能。如同搭积木一般,用几行代码就能搭建起一个多智能体系统。对于希望快速验证原型或需要复杂任务分工的团队来说,这个SDK的实用价值相当突出。
最后是开发者关心的价格。Responses API的费用主要取决于所选模型的输入和输出tokens数量;代码解释器(Code Interpreter)按会话计费,每次0.03美元;文件搜索存储每天每GB 0.10美元,每天有1GB免费额度;文件搜索调用按每1000次2.50美元计(仅适用于Responses API);网络搜索调用则根据模型和搜索上下文大小浮动。整体来看,价格体系清晰透明,对开发者而言成本可控。
这套套件覆盖了智能体开发的关键环节:感知(搜索)、记忆(文件检索)、行动(电脑操控),再辅以新的API和SDK进行粘合调度。对于想要上手智能体开发的开发者而言,现在正是动手的好时机。
这套套件覆盖了智能体开发的关键环节:感知(搜索)、记忆(文件检索)、行动(电脑操控),再辅以新的API和SDK进行粘合调度。对于想要上手智能体开发的开发者而言,现在正是动手的好时机。来源:https://www.53ai.com/news/LargeLanguageModel/2025031407624.html
相关热点
继续查看同栏目近期热点。
延伸阅读
补充最近整理过的热点入口。
