Anthropic发布Claude Sonnet 5:中端AI模型迎来全面升级
首先带来一个重要消息:Anthropic于今日正式推出Claude Sonnet 5,这是一款在编程、推理与安全性能方面均有大幅增强的中端大语言模型。

该模型将作为Claude聊天服务消费版套餐的默认选择,覆盖免费用户与Pro订阅用户。
先来梳理产品线背景。目前Anthropic的商用大语言模型划分为三个系列:入门级Haiku、中端Sonnet,以及高端Opus。不过今年4月,公司低调推出了两款性能更强的模型——Mythos 5和Fable 5,其能力甚至超越了Opus系列。但这两款模型尚未向大众开放,原因将在后文说明。
再聚焦Sonnet 5。在编程这一关键维度上,Anthropic通过SWE-Bench Pro与Terminal-Bench 2.1两项基准测试进行评估。结果显示:相比前代产品,得分分别提升了5.1%和13.4%。当然,OpenAI的同级别竞品GPT-5.6 Terra在Terminal-Bench 2.1上仍领先Sonnet 5约4%——竞争格局依然激烈。
在其他任务领域,Sonnet 5的表现同样惊艳。在覆盖44个职业知识工作任务的GDPval-AA v2测试中,它取得了1618分,而上一代Sonnet 4.5仅为1395分。这233分的差距绝非小修小补所能解释。
那么提升的核心在哪里?答案在于自主性。据参与发布前测试的用户反馈,该模型有时会在未收到指令的情况下,主动对输出结果进行二次核查。换言之,它学会了“自我检查”。此外,Sonnet 5还能处理前代模型无法完成的复杂任务——这意味着它在逻辑链条更长、场景更复杂的任务中实现了质的飞跃。
不过,自主性的增强也带来了新的考量。在网络安全领域,大语言模型的自发行为可能被用于恶意目的。好在此次Anthropic表示,Sonnet 5在拦截恶意请求与提示词注入攻击方面,表现明显优于Sonnet 4.6。提示词注入攻击是什么?简单来说,就是藏在大语言模型所分析数据中的恶意指令——相当于给模型“设陷阱”。而Sonnet 5内置了专门的防护机制,能有效阻止黑客利用它发起网络攻击。更重要的是,由于该模型无法生成可实际运行的漏洞利用代码,其带来的网络安全风险已被控制在相当低的水平。
在可用性方面,Sonnet 5目前已成为Claude免费版与Pro套餐的默认模型,后续还将向Max、Team及企业版用户开放。开发者可通过Anthropic的API直接调用。定价方面,自9月起,每百万输入Token收费3美元,每百万输出Token收费15美元。与OpenAI的中端竞品Terra相比,定价略高,但考虑到性能提升,这一差价能否被市场接受,仍有待观察。
最后,关于Mythos 5与Fable 5的最新进展。本月早些时候,Anthropic发布了这两款旗舰模型,其中Fable 5配备了更严格的安全防护机制,能够屏蔽潜在风险提示词。发布数日后,美国政府突然对其实施出口管制,Anthropic随即暂停了相关推广。不过,公司今天宣布管制已解除,访问权限将于周三逐步恢复。Anthropic计划将Fable 5向大众广泛开放,而Mythos 5仅面向有限数量的受信任机构。这一“开放旗舰、限制超旗舰”的策略,背后显然蕴含着更深的安全考量。
Q&A
Q1:Claude Sonnet 5的编程能力提升了多少?
A:根据Anthropic的测试,Sonnet 5在SWE-Bench Pro基准测试上比前代提升了5.1%,在Terminal-Bench 2.1上提升了13.4%。不过,OpenAI的同级别竞品GPT-5.6 Terra在Terminal-Bench 2.1上仍领先约4%。
Q2:Claude Sonnet 5在安全防护方面有哪些改进?
A:Sonnet 5在安全性上进步显著,能够更有效地拦截恶意请求与提示词注入攻击。模型内置防护机制,防止黑客利用它发起网络攻击,且由于无法生成可实际运行的漏洞利用代码,整体网络安全风险已控制在较低水平。
Q3:Claude Sonnet 5的定价是多少?如何获取访问权限?
A:自9月起,Sonnet 5定价为每百万输入Token 3美元、每百万输出Token 15美元。该模型目前已成为Claude免费版与Pro套餐的默认模型,后续也将向Max、Team和企业版开放。开发者可通过Anthropic的API直接调用。
