首页 游戏 软件 资讯 排行榜 专题
首页
AI
Claude Sonnet新版发布:Opus级智能体验,性价比超Opus,OpenClaw API开放

Claude Sonnet新版发布:Opus级智能体验,性价比超Opus,OpenClaw API开放

热心网友
69
转载
2026-02-18

Jay 发自 凹非寺
量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

春节才是真正的大模型战场,全世界参与的那种。

大年初二,Anthropic史上最强Sonnet——Claude Sonnet 4.6发布。

计算机操作是这次更新的主打卖点。

Anthropic表示,对填写复杂Excel、网页清单等任务,Sonnet 4.6已经接近人类水平。

其他方面也是全方位升级:编码、长上下文推理、Agent规划、知识型工作、设计……Beta阶段还支持1M上下文。

重点来了!定价依然跟Sonnet 4.5一样,免费用户也能用。

性价比简直高到离谱。

创业者Alex Finn体验后表示「难以置信」:

在大多数Agent任务上,Sonnet 4.6的表现跟Opus系列差不多好,速度还更快,价格只要1/5。



还不只一个人这么说。

Anthropic表示,内测用户对Sonnet 4.6的喜爱程度,已经超过了超大杯Opus 4.5。

史上最强Sonnet

计算机操作能力,可以说是这次Sonnet 4.6最亮眼的部分了,Anthropic也在这部分花了不少笔墨。

虽然跟最熟练的人类工作者比还有差距,但进步速度真的恐怖。

看下面这张图——

四个月一次的高频率更新下,性能曲线依然保持着不错的上升势头。



当然,计算机操作能力提升,也意味着如果模型被prompt injection,风险会更大。

Anthropic也想到了这一点,专门给用户们塞了颗定心丸:

Sonnet 4.6的安全等级相比前代Sonnet 4.5有显著改进,表现跟Opus 4.6差不多。



事实上,计算机操作只是冰山一角,Claude Sonnet 4.6在各类Benchmark上都有提升。

具体细节都在下面这张表,一个大杯模型,智能却直逼超大杯Opus系列。

从Benchmark上还可以看到Claude这边出现了「倒反天罡」的情况。

在金融分析和办公室任务这两项测试中,Sonnet 4.6用一骑绝尘的数值,拿下了SOTA,力压历代Opus。



用户的反馈更能说明问题。

在Claude Code的早期内测中,Anthropic发现,在59%的场景下,用户更倾向于选择Sonnet 4.6(而不是Opus 4.5)。

大家评价说,Sonnet 4.6明显更少出现过度设计和「偷懒」,指令遵循方面表现更好。

同时,虚假成功声明更少,幻觉更少,多步骤任务的执行也更加稳定。

对了,这次Sonnet 4.6还提供100万token的上下文,能装下几十篇研究论文。最重要的是,在这么大规模的上下文中,Sonnet 4.6依然保持了相当领先的推理水平。

这一点在Vending-Bench Arena上特别明显。

这是个测试模型在长时间跨度内模拟运营一家企业能力的Benchmark,引入了竞争机制,不同模型需要相互对抗,争取更高利润。

在这个测试中,Sonnet 4.6采用了一种新策略:前10个模拟月份大幅投入产能建设,支出明显高于竞争对手,但在后期迅速开始想办法盈利。

这种转向时机的把握,帮助它在最终成绩上明显领先。



除此之外,用户还反馈称前端代码生成能力有提升。

Sonnet 4.6生成的视觉输出更加精致,布局、动画和设计感都比之前的模型好,达到可用于生产环境的质量所需的迭代轮次也减少了。

OpenClaw又发力了

实在是奇怪,一款大杯模型,内测中居然比超大杯旗舰款还招人喜欢。

但目前看来,也有许多网友并不买账,甚至说Anthropic是没活硬整。



主要是不太理解:

既然Opus仍然是最强,为啥要用Sonnet 4.6?



对此,有人出来解释称:这其实是定价策略和目标用户不一样。

对于本就不差钱的用户来说,这事儿影响不大。毕竟Max订阅套餐里本来就有大量补贴后的Opus 4.6额度,随便用。

但这是C端的思考方式。

在B端,企业客户可没这么大方的token补贴,调用量却高出好几倍。

与此同时,很多场景根本用不着那么强的智能。如果只是让AI帮你居中一个div这种简单活儿,Opus未免有些太奢侈。

从这个角度看,Anthropic的战略路线其实已经很清晰:

Opus用来争夺王座,维持C端品牌认知;Sonnet用来占领市场,用更低的成本将智能下放。



不过,这个「市场」其实也不光是企业客户。

计算机操作能力大幅提升,Opus级智能,Sonnet级定价……

这不就是为OpenClaw量身定做的API嘛!

果然,Anthropic这款高性价比模型的消息一出来,「龙虾大军」立马就涌进来了:

立即升级您的OpenClaw至Sonnet 4.6!

网友直接放话:这是有史以来最棒的OpenClaw模型,大家赶紧给自己的龙虾安排上。



实在是有些drama,Anthropic真得好好谢谢OpenClaw作者。

人家项目名字都被整没了,自己也加入了OpenAI,结果……OpenClaw至今还在帮Anthropic带货。

参考链接:
[1]https://www.anthropic.com/news/claude-sonnet-4-6
[2]https://x.com/AlexFinn/status/2024828886287708303

来源:https://www.163.com/dy/article/KM2H99S40511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Netflix四月23部新作炸场,流媒体时间争夺战升级
娱乐
Netflix四月23部新作炸场,流媒体时间争夺战升级

4月流媒体市场的内容投放量,相当于把过去半年的弹药一次性打光。Netflix、Prime Video、HBO Max三大平台合计上线23部头部作品,这个数字背后是平台对用户注意力的极限争夺。用户每天

热心网友
04.01
《冬去春来》三配角风头正劲:这才是好剧的黄金标准
娱乐
《冬去春来》三配角风头正劲:这才是好剧的黄金标准

刚刚追完《冬去春来》最新几集,说实话,主角的故事线我已经有点记不清楚了!但我的脑子里却牢牢刻着三个人的脸——他们不是主角,戏份也不算多,可每一次出场,都像一把钝刀子,慢慢地、狠狠地割进心里,让你疼得

热心网友
03.29
一口气发布三大王炸模型!昆仑万维公布2026年AGI战略蓝图
AI
一口气发布三大王炸模型!昆仑万维公布2026年AGI战略蓝图

编辑|杜伟就在 27 日下午,在火热进行中的 2026 中关村论坛上,一家国产头部 AI 厂商引爆了全场!昆仑万维,这家 2024 年便已「All in AGI 与 AIGC」的实力玩家,亮出了其实

热心网友
03.28
华为亮出AI芯片王炸,性能超H20近三倍打破垄断
科技数码
华为亮出AI芯片王炸,性能超H20近三倍打破垄断

说出来你可能不信,曾经在国内AI芯片市场横着走的英伟达,如今算是彻底栽了个大跟头。放在以前,咱们搞AI、做大数据,几乎离不开英伟达的芯片,它一家就占了95%的市场,说白了就是垄断,你不用也得用,哪怕

热心网友
03.25
慕思AWE首秀:把床变成鸿蒙智能家居新入口
AI
慕思AWE首秀:把床变成鸿蒙智能家居新入口

3月15日,是中国家电及消费电子博览会AWE的最后一个展览日。这个在上海举办的科技盛会,与CES 、柏林国际电子消费品展览会并称为世界三大家电与消费电子展,含金量可想而知。智东西小队在深度逛下来后发

热心网友
03.15

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化
游戏资讯
《全面战争:中世纪3》:只怀旧做不成好游戏经典需要现代化

《全面战争:中世纪3》:经典延续,如何平衡怀旧与创新? 近期,《全面战争:中世纪3》的项目负责人帕维尔·沃伊斯坦然指出,要打造一款真正优秀的续作,绝不能仅仅依赖对前作模式的简单复刻。这一观点引人深思——尽管《中世纪2:全面战争》至今仍在策略游戏爱好者心中占据着经典地位,但开发团队此次显然决心跳出“照

热心网友
04.02
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀
科技数码
雷鸟创新AWE斩获艾普兰创新奖 蝙蝠侠限定款国内首秀

雷鸟X3 Pro斩获AWE艾普兰创新大奖,开启全民AR生活新篇章 在上海新国际博览中心隆重揭幕的2026年中国家电及消费电子博览会(AWE)上,前沿AI科技与未来生活愿景激情碰撞。全球消费级AR领导品牌雷鸟创新,以其里程碑式的表现,定义了行业发展的新方向。 通过“顶尖硬件科技+顶级文化IP”的双轨战

热心网友
04.02
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验
科技数码
AWE探展MOVA:31款创新产品集中亮相 重新定义智慧生活新体验

借力AWE2026“一展双区”,MOVA双区协同、震撼登场 备受瞩目的科技盛会——2026年中国家电及消费电子博览会(AWE),于3月12日至15日在上海盛大举办。本届AWE展会首次创新采用“一展双区”的展览模式,主会场位于上海新国际博览中心,分会场则设于上海东方枢纽国际商务合作区,两大展区高效联动

热心网友
04.02
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情
游戏攻略
DNF2026冰结技能数据是怎样的-2026DNF冰结技能数据详情

冰结师技能全解析 踏入2026年,《地下城与勇士》中的冰结师职业,其技能体系已构建得更为成熟与强大。无论是在副本中高效清理海量怪物,还是在决斗场与高手玩家周旋,这个职业都能凭借其独特的冰霜艺术掌控战局。刷图时,酷寒的范围法术可瞬间清屏;而在PVP竞技中,一套将冻结控制与瞬间爆发完美衔接的连招,往往让

热心网友
04.02
iPhone 18 Pro设计挤牙膏了 继续用前代模具
科技数码
iPhone 18 Pro设计挤牙膏了 继续用前代模具

iPhone 18 Pro系列模具不变,屏幕形态将与iPhone 17 Pro保持一致 备受期待的屏下Face ID组件小型化设计与灵动岛区域缩窄方案,预计将被推迟至后续迭代机型中正式应用。 近期,关于iPhone 18 Pro系列的技术传闻持续引发行业关注,尤其在显示与解锁设计领域传言甚多。多方消

热心网友
04.02