首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
Anthropic官方Harnerss正式发布功能详解与获取指南

Anthropic官方Harnerss正式发布功能详解与获取指南

热心网友
14
转载
2026-05-28

还记得年初OpenAI与Anthropic相继发布关于“Harness”工程理念的技术文章吗?当时LangChain工程师Viv曾用一个精辟公式概括其核心:Agent = Model + Harness。模型提供智能,而Harness则负责让这份智能稳定、可控地投入实际应用。然而,构建一套生产级的Harness系统——涵盖沙箱执行、状态管理、权限控制与端到端追踪——往往需要团队投入数月时间进行繁重的基础设施开发。

如今,Anthropic将这一理念直接产品化。他们正式推出Claude Managed Agents,一套用于构建与部署云端托管智能体的可组合API套件。这本质上是一项完整的托管服务:开发者只需定义智能体的任务、工具与安全护栏,Anthropic的基础设施负责运行,内置的Harness系统则处理所有复杂的编排逻辑。效果立竿见影:例如Vibecode团队借助其将开发效率提升10倍;Sentry的一个集成项目从构思到上线仅耗时数周。

官方Harness正式登场:Claude Managed Agents详解

构建一个可实际投产的智能体,远不止简单调用API。它需要沙箱化的代码执行环境、检查点机制、凭证安全管理、精细的作用域权限控制以及完整的执行追踪日志……这些往往成为长达数月的基础设施“苦力活”,且最终用户难以直接感知其价值。

Claude Managed Agents的核心价值,正是将这些复杂性全面接管。开发者只需聚焦于定义智能体的“大脑”(任务目标)与“手脚”(可用工具),Anthropic的托管环境则提供安全的“工作间”与“调度中心”。内置的智能编排Harness会自动决策何时调用工具、如何管理上下文、以及如何从错误中优雅恢复。

具体而言,该产品提供四大核心能力:

生产级智能体基础设施:安全沙箱、身份验证、工具执行均由平台托管处理。开发者无需从零搭建这些底层系统。

长时运行会话支持:智能体可持续自主工作数小时甚至更久,进度与输出持久化保存。这意味着它能承担真正复杂的长期任务,远超传统短对话请求的范畴。

多智能体协同工作:智能体可生成并指挥其他智能体,实现复杂任务的并行化处理。主智能体可派生子智能体分工处理子任务,最终汇总结果,极大提升处理效率。

可信治理与安全管控:当智能体需接入真实业务系统时,平台已内置作用域权限、身份管理与执行追踪。这为企业最关切的安全问题——例如智能体越权访问敏感数据——提供了系统性解决方案。

Claude Managed Agents 的整体架构

根据Anthropic内部测试,在结构化文件生成等任务中,Managed Agents相比标准提示循环方法,任务成功率最高可提升10个百分点。且在越复杂、越困难的任务上,其性能提升往往越显著。

从理念到产品:Agent = Model + Harness 的实践

Claude Managed Agents的底层设计哲学,正源于Harness Engineering理念。其核心是解决三个关键问题:AI在何处工作?使用什么工具工作?以及如何验证工作成果?Harness体系包含了系统提示词、工具集、文件系统、沙箱环境、编排逻辑与各类检查机制。

在设计Managed Agents时,Anthropic遵循了三大关键模式,这些模式直接塑造了产品架构:

模式一:复用Claude已掌握的工具

与其为每个特定任务设计专用工具,不如提供Claude已精通的通用工具,由其自主组合出解决方案。典型例证是:Claude在2024年末的SWE-bench Verified基准测试中达到49%的优异成绩(当时业界领先),而它仅使用了两个工具:bash工具与文本编辑器工具。Anthropic发现,Claude能够灵活组合这些通用工具,构建出“编程式工具调用”、“技能库”与“内存工具”等高级能力。

Claude 在 SWE-bench Verified 基准测试上的成绩演进

模式二:赋予Claude自主决策权

随着模型能力演进,那些关于“Claude不能独立完成什么”的传统假设需要重新审视。例如,以往认为每个工具调用的结果都必须经模型上下文窗口决策下一步,但这既消耗Token又影响速度。Managed Agents允许Claude通过编写代码(如bash脚本)来表达一系列工具调用及逻辑,仅将最终需处理的结果送入上下文窗口。由此,编排决策权从固定Harness转移给了更灵活的模型自身。

另一案例是系统提示词。传统做法是手工编写所有任务指令并预加载,但这难以扩展。Managed Agents通过“技能”机制,让Claude仅在需要时,才通过调用工具逐步展开完整技能说明,实现了上下文的渐进式加载。

模式三:审慎设定安全与体验边界

Harness需在Claude周围提供必要结构,以强制执行安全、成本或用户体验边界。对于需强安全边界或特殊用户体验的操作,可将其设计为“专用工具”。例如,难以逆转的操作(如调用外部API)可通过专用工具要求用户确认;写入工具可内置过期检查,防止覆盖已变更文件。这些专用工具为Harness提供了明确钩子,以便进行拦截、控制或审计。

实际应用案例:开发效率实现数量级提升

目前,已有多个团队使用Managed Agents交付生产级应用,覆盖代码生成、生产力提升、文档处理等多个场景。

Notion将Claude深度集成至其工作空间,允许团队直接委托任务给Claude。工程师用它交付代码,知识工作者用它生成网站与演示文稿。其产品经理指出,Managed Agents处理长会话、管理内存并持续交付高质量输出的能力,使Notion成为团队与智能体协同工作的理想平台。

Sentry将其调试智能体与Claude驱动的补丁编写智能体配对,实现了从标记Bug到生成可审查修复的自动化流程。其工程总监表示,Managed Agents提供的安全、全托管运行时,让团队能专注于打造无缝的开发者体验,该集成在数周内便告完成。

Asana构建了“AI团队成员”,这些协作智能体在项目中与人类并肩工作。其CTO认为,Managed Agents显著加速了开发进程,让团队更专注于创建企业级的多用户协同体验。

Vibecode的案例尤为突出。其联合创始人表示,在采用Managed Agents前,用户需手动设置沙箱、管理生命周期、配置工具并监督执行,此过程可能耗时数周甚至数月。而现在,仅需几行代码,用户便能以至少快10倍的速度启动同等基础设施。

总结:一个值得关注的行业范式转变

Claude Managed Agents的推出,悄然改变了Anthropic的商业定位。他们不再仅是提供模型API的厂商,而是开始提供完整的智能体运行环境——从沙箱、会话管理到权限控制,全部实现托管。这更接近云服务商的角色:提供计算资源与运行环境,只不过其上运行的是智能体。

从定价模式亦可窥见这一转变:除了按Token计费,Managed Agents新增了按会话活跃时间计费(每小时0.08美元),这更接近云主机按运行时长的计费方式,标志其向基础设施服务的靠拢。

从技术视角看,Anthropic在Harness设计上保持了充分灵活性,未强制使用单一编排逻辑,而是提供了一个可容纳不同控制器的开放系统。这种设计使产品能随模型能力进化而演进,无需推倒重来。

对广大开发者而言,该产品的最大价值在于填平了从AI原型到生产部署之间的巨大鸿沟。当繁琐、耗时的基础设施建设不再是瓶颈,团队才能真正聚焦于核心问题:设计智能体能做什么、如何执行、以及其边界何在。这无疑是整个AI应用开发领域值得密切关注的重要方向。

来源:https://www.53ai.com/news/LargeLanguageModel/2026041021546.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Excel数据分类汇总技巧详解高效办公必备指南
AI教程
Excel数据分类汇总技巧详解高效办公必备指南

Excel数据分类汇总全攻略:三种核心方法提升分析效率 面对庞杂的业务数据,如何快速将其转化为清晰的统计信息,是职场人士的必备技能。Excel内置的多种分类汇总工具,正是解决这一痛点的关键。掌握这些技巧,不仅能大幅提升数据处理速度,更能让业务洞察一目了然。本文将系统讲解三种最实用的Excel分类汇总

热心网友
05.28
大模型技术发展现状与未来趋势分析
AI资讯
大模型技术发展现状与未来趋势分析

百度发布文心大模型X1 1,通过混合强化学习与框架优化,显著提升了事实准确性、指令遵循等核心能力,有效缓解大模型的“幻觉”问题,推动其实用化发展。

热心网友
05.28
AI生成PPT软件使用技巧:轻松打造高吸引力演示文稿
AI教程
AI生成PPT软件使用技巧:轻松打造高吸引力演示文稿

AI生成PPT软件:从入门到精通的完整指南 在当今职场与学术领域,制作一份引人入胜的PPT已成为一项核心技能。面对时间紧迫、任务繁重的挑战,传统手动设计往往耗时费力。此时,AI生成PPT软件应运而生,它如同一位高效的全能设计助手,能够将您的创意迅速转化为专业级演示文稿。无论是准备课堂展示、工作汇报还

热心网友
05.28
Claude Code视频剪辑教程:免费开源工具自动去口癖加字幕调色
AI资讯
Claude Code视频剪辑教程:免费开源工具自动去口癖加字幕调色

开源工具video-use通过自然对话驱动视频剪辑,自动完成去口癖、加字幕、调色等核心环节。其创新在于将视频信息转化为结构化文本供大语言模型处理,大幅提升效率。工具采用音频驱动、视觉辅助的设计原则,并引入自评机制确保输出质量,为创作者提供高效免费的智能剪辑方案。

热心网友
05.28
员工年度总结高效撰写指南 AI工具提升制度管理效率
AI教程
员工年度总结高效撰写指南 AI工具提升制度管理效率

适合需求: 员工制度管理的年度总结 又到一年复盘时。对于任何一家公司而言,员工制度管理都是保障组织顺畅运转的基石。过去这一年,围绕制度的制定、落地与维护,管理团队投入了大量精力,目标很明确:打造一个更有序、更高效的工作环境。 范文 Demo: 员工制度管理的年度总结 制度是组织的“操作系统”,过去一

热心网友
05.28

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

止盈与止损哪个更重要 交易心理学中的关键决策指南
web3.0
止盈与止损哪个更重要 交易心理学中的关键决策指南

止损是保障交易账户生存的刚性底线,必须在开仓前设定并严格执行;止盈则是实现收益的手段,可采用阶梯式或动态策略管理。人性对损失的厌恶使止损执行更为困难,需借助系统工具和复盘纪律来克服。确保生存优先,再追求盈利,是交易中的核心原则。

热心网友
05.28
小米除螨仪2 Pro国补价198元 上市429元现历史新低
科技数码
小米除螨仪2 Pro国补价198元 上市429元现历史新低

小米米家除螨仪2Pro近期价格创新低,叠加优惠后入手价约198元。产品采用双尘杯设计,吸力达16kPa,支持高频拍打与智能尘螨感应,宣称除螨除菌率较高。促销期间性价比凸显,适合有需求的消费者关注。

热心网友
05.28
荣耀平板20正式开售 限时赠送李昀锐定制礼包
科技数码
荣耀平板20正式开售 限时赠送李昀锐定制礼包

荣耀平板20于5月27日全渠道开售,主打学生市场。其配备12 1英寸3K类纸护眼屏,支持类纸书写体验与七大护眼技术。内置AI备考助手YOYO,可辅助课堂笔记与知识梳理。首销期间国补后起售价1614 15元,并有限时赠李昀锐定制周边礼包等优惠。

热心网友
05.28
具身智能机器人记忆系统RoboMemArena深度评测
AI资讯
具身智能机器人记忆系统RoboMemArena深度评测

具身智能执行长时程任务时,记忆能力是关键瓶颈。为系统评估机器人记忆,多所高校联合推出RoboMemArena基准,涵盖物体转移、遮挡、计数与顺序执行四类场景,包含26项长任务及真机测评。配套基线模型PrediMem通过显式管理记忆缓冲区,在仿真与真实任务中均显著优于传统方法,验证了记忆对机器人长程可靠执。

热心网友
05.28
华宝基金重仓中科星图浮亏80万 股价下跌3.01%引关注
AI资讯
华宝基金重仓中科星图浮亏80万 股价下跌3.01%引关注

5月27日,中科星图股价下跌3 01%,收于51 28元。华宝基金旗下华宝上证科创板人工智能ETF重仓该股,一季度末持有50 32万股,为第八大重仓股。按当日跌幅计算,该基金持仓单日浮亏约80 01万元。该基金今年以来收益率27 82%,表现良好。

热心网友
05.28