7月1日,Anthropic 正式发布了 Claude Sonnet 5,官方称这是 Sonnet 系列中智能体能力最强的模型——能自己制定计划、调用浏览器和终端工具,还能自主运行。说白了,它不再只是回答问题,而是能主动“干活”了。

费用方面,模型已经上线,接入了 Claude Code 和 Claude Platform。开发者调用 API 时指定“claude-sonnet-5”即可。价格分两个阶段:
优惠期(至 2026 年 8 月 31 日)
- 每 100 万 Tokens 输入费用:2 美元(约合 13.6 元软妹币)
- 每 100 万 Tokens 输出费用:10 美元(约合 68 元软妹币)
优惠期后(2026 年 8 月 31 日后)
- 每 100 万 Tokens 输入费用:3 美元(约合 20.4 元软妹币)
- 每 100 万 Tokens 输出费用:15 美元(约合 102.1 元软妹币)
技能上,Claude Sonnet 5 被定位为“迄今最具智能体能力的 Sonnet 模型”。它能自主规划、调用浏览器和终端工具,并以无人干预的方式运行。这意味着开发者可以把复杂任务交给它,让它自己一步步完成。
性能表现是这次发布的最大亮点。官方数据显示,在智能体搜索评测 BrowseComp、计算机使用评测 OSWorld-Verified 等项目中,Sonnet 5.0 相比 Sonnet 4.6 有明显提升,部分任务甚至逼近了 Opus 4.8 的水准——要知道 Opus 是更高阶的系列,这种跨级的性能追赶值得关注。
安全方面,Anthropic 指出 Sonnet 5 整体不良行为发生率低于 Sonnet 4.6,在恶意请求拒绝、提示注入攻击抵抗、幻觉率和迎合性方面均有改善。这意味着它更“听话”也更“聪明”,不容易被带偏,也不容易编造内容。
