7月1日,Anthropic 正式发布了其最新AI模型 Claude Sonnet 5,被誉为Sonnet系列中智能体能力最强的版本。简而言之,该模型能够自主制定计划、调用浏览器和终端等工具,并直接执行任务——它不再局限于回答提问,而是真正具备执行操作的能力。

在费用与接入方面,该模型现已上线,并集成至 Claude Code 和 Claude Platform。开发者在调用API时,只需指定“claude-sonnet-5”即可直接使用。

就技能而言,Claude Sonnet 5是Anthropic目前最具智能体能力的Sonnet模型。它能规划执行步骤,操控浏览器和终端,并以自主方式运行——换句话说,只需提供目标,它便能独立完成整个流程,无需逐步催促。

性能提升是衡量模型实力的关键指标。在智能体搜索评测BrowseComp、计算机使用评测OSWorld-Verified等项目中,Sonnet 5.0相比Sonnet 4.6取得了显著进步,甚至在某些任务上已接近Opus 4.8的水平。这充分表明,两者之间的差距正在快速缩小,Sonnet系列正稳步向旗舰级性能迈进。
在安全性方面,Anthropic提供了积极的数据:Sonnet 5的整体不良行为发生率低于Sonnet 4.6,在恶意请求拒绝、提示注入攻击抵抗、幻觉率和迎合性等维度上均有改善。简而言之,该模型更加安全、不易被误导,并且极少产生虚构内容。
