游乐游手机版
首页/科技数码/文章详情

Claude Opus 4.7 发布:更费token了,用户评价两极

时间:2026-04-17 17:37
Claude Opus 4 7全面上线:编程能力飞跃,但“升级”代价几何? 4月17日,Anthropic正式宣布其最新旗舰模型Claude Opus 4 7全面开放使用。与上一代的Opus 4 6相比,这次更新在高级软件工程领域带来了显著进步,同时多模态视觉能力也大幅增强,能够产出更高质量的界面设

Claude Opus 4.7全面上线:编程能力飞跃,但“升级”代价几何?

4月17日,Anthropic正式宣布其最新旗舰模型Claude Opus 4.7全面开放使用。与上一代的Opus 4.6相比,这次更新在高级软件工程领域带来了显著进步,同时多模态视觉能力也大幅增强,能够产出更高质量的界面设计、演示文稿等内容。

价格方面,Opus 4.7维持了与4.6相同的定价策略:每百万输入token收费5美元,每百万输出token收费25美元。然而,事情并非表面看起来那么简单。

Anthropic在官方公告中明确指出了一个关键变化:新的分词器会导致相同文本内容的token数量变为原来的1.0到1.35倍。在API单价不变的前提下,这意味着实际使用成本隐性地上涨了10%至35%。这无疑给开发者们的预算规划提了个醒。

消息一出,不少用户连夜进行了测试。从社交平台上的反馈来看,社区对Opus 4.7的评价呈现出明显的两极分化。

大部分用户认可其在编程能力上的提升,但在文案撰写、日常对话沟通等方面,吐槽的声音则相当集中。

Claude Opus 4.7主要能力提升

根据官方发布的数据,在编码与复杂推理方面,Opus 4.7的表现更为严谨和一致。它能够自行验证输出结果,这让处理那些长期运行、多步骤的复杂任务变得更为可靠。有用户反馈称,过去需要密切监督的复杂编码工作,现在可以更放心地交给Opus 4.7去执行。模型能够精确遵循指令,并在最终汇报前主动进行自我检查。

视觉能力是另一大亮点。Opus 4.7支持更高分辨率的图像输入,其长边最大可达2,576像素(约375万像素),这是前代模型的3倍以上。这一提升使得模型能够处理依赖精细视觉细节的任务,例如读取密集的屏幕截图、从复杂图表中提取数据,或者进行像素级的参考比对。

需要特别注意的一点是,Opus 4.7开始严格按字面意思理解并执行指令。这意味着,为旧模型编写的提示词可能会产生意想不到的结果——因为旧模型往往会进行宽松解释或自动跳过部分内容。用户需要据此重新审视和调整自己的提示词与工具链。

内部测试表明,Opus 4.7在专业领域表现更出色。它像是一位更高效的金融分析师,能够生成严谨的分析模型和更专业的演示文稿,并实现更紧密的任务整合。在第三方评估基准GDPval-AA(涵盖金融、法律等领域的经济价值知识工作)上,Opus 4.7也达到了业界最先进的水平。

此外,模型在利用基于文件系统的记忆方面变得更聪明了。它能够在多轮、长时间的工作中记住重要笔记,并在后续的新任务中直接调用这些记忆,从而减少了前期需要输入的上下文信息量。

安全性方面,Opus 4.7配备了自动检测和拦截功能,旨在阻止涉及禁止或高风险网络安全用途的请求。Anthropic同时表示,安全专业人士若需将模型用于合法的网络安全目的,如漏洞研究、渗透测试等,可以申请加入新推出的“网络验证计划”。

总体而言,Opus 4.7在安全性上与4.6版本相似:在欺骗、谄媚、协助滥用等令人担忧的行为上发生率较低。在诚实性和抵御恶意“提示注入”攻击方面,新模型优于旧版;但在某些特定方面,例如对受管制物质给出过于详细的减害建议,则表现略有退步。

新增xhigh级别选择,更费token了

根据Anthropic的官方博客,Opus 4.7还同步更新了一系列新功能:

首先,在原有的“high”(高)和“max”(最大)努力级别之间,新增了一个“xhigh”(极高)级别。这为用户在处理困难问题时,提供了更精细的权衡选项,以在推理质量和响应延迟之间做出选择。

在Claude Code中,所有计划的默认努力级别已提升为“xhigh”。对于编码和智能体用例,官方建议从“high”或“xhigh”级别开始测试。

除了支持更高分辨率图像外,Anthropic还公开测试了“任务预算”功能。开发者可以通过设定预算,来引导Claude在较长的运行过程中合理分配token开销。

Claude Code新增了/ultrareview命令,该命令会启动一个专门的代码审查会话,通读代码变更并标记出那些需要细心审查才能发现的bug和设计问题。Pro和Max用户目前可以免费试用3次。

此外,“自动模式”已向Max用户开放。在该模式下,Claude可以代为做出一些权限决定,从而以更少的中断运行更长的任务,同时控制相关风险。

值得注意的是,Opus 4.7虽然是4.6的直接升级版,但有两点变化会显著影响token使用量,必须提前规划:

第一,新的分词器改进了文本处理方式,但同样的输入内容可能会被映射为更多的token,比例大约在1.0到1.35倍之间,具体取决于内容类型。

第二,在更高的努力级别下,模型的思考量会增加,尤其是在智能体场景的后续交互轮次中,Opus 4.7会产生更多的输出token。

用户可以通过调整努力级别参数、设置任务预算,或者在提示词中要求模型回答更简洁来控制token消耗。Anthropic的内部测试显示,在其内部的编码评估中,所有努力级别的token使用效率均有所提升。

用户评价两极

对于Opus 4.7的编程能力,多数实际体验过的用户都给出了肯定评价,承认其能力确实更为强大。

然而,让不少用户感到措手不及的,是token消耗的激增。有用户直言,官方通篇强调视觉提升,却只字不提这玩意儿消耗token的速度堪比喝水。用同一张设计稿进行测试,Opus 4.7的输入token数量直接飙升至Opus 4.6的3倍多。

更令人关注的是,Opus 4.7在某些能力上出现了不升反降的情况。

在长上下文信息检索方面,Opus 4.6的评分能达到78.3%,而Opus 4.7直接掉到了32.2%。Anthropic对此的解释是,新模型在遇到信息缺失时会直接报错,而不再像以前那样进行“脑补”。但用户实际测试下来发现,即便信息明明白白地存在于上下文中,它也可能遗漏。这对于依赖长文档工作的法律、金融等领域用户而言,需要格外谨慎。

Opus 4.7的联网搜索和智能体能力也出现了轻微下降。其智能搜索评测BrowseComp的分数从Opus 4.6的83.7%降至79.3%,与GPT-5.4(89.3%)的差距被进一步拉大。

被吐槽最多的,莫过于Claude Opus 4.7文风的突变。

许多文字工作者反映,Opus 4.7现在满嘴都是“稳稳接住”、“压实闭环”这类互联网大厂黑话,破折号使用混乱,续写的内容也显得干巴巴。用户无奈吐槽:“以前是用它来改文案,现在光是修改它生成的文案就要花两倍时间。”

最后,模型的思考过程被隐藏了。Opus 4.7默认不再输出推理摘要,用户若想了解其内在逻辑,必须手动添加命令。对于复杂任务,一旦出错,你根本无从知晓它是在哪一步思考上出现了偏差,导致排查问题的成本翻倍。有人认为这是官方为防止技术被“蒸馏”而采取的措施,但此举无疑牺牲了开发者的调试体验。

总而言之,Opus 4.7并非一次无痛的平滑升级。如果你的核心应用场景并非硬核编程,那么不妨先观望一下。

来源:https://www.techweb.com.cn/it/2026-04-17/2974391.shtml
上一篇三星电子芯片代工业务部门一关键高管被挖走 将在下月加入英特尔 下一篇arpanet的建立时间 入门:从基础认知到上手使用
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
LiblibAI云端WebUI降低AI绘画部署门槛
科技数码 · 2026-07-02

LiblibAI云端WebUI降低AI绘画部署门槛

LiblibAI在线WebUI的核心优势在于——只需通过浏览器即可流畅运行Stable Diffusion,无需自行搭建本地环境。云端直接处理运算,模型即选即试,大幅降低了AI绘画的创作门槛。对于轻量创作和模型快速测试来说,体验相当顺畅,但用户仍需重视数据隐私保护和版权合规等问题。 过去使用Stab

微软因用户不安叫停Edge浏览器AI历史搜索功能
科技数码 · 2026-07-02

微软因用户不安叫停Edge浏览器AI历史搜索功能

微软紧急暂停Edge浏览器AI历史搜索功能,该功能因被用户吐槽“令人不安”而暂缓部署。尽管微软强调所有AI处理在设备端完成且数据不上传云端,但用户仍不信任。此举与WindowsK2计划减少功能堆砌的理念一致。

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场
科技数码 · 2026-07-02

红魔游戏平板5 Pro发布 4999元起售将登陆全球市场

【CNMO科技消息】近日,红魔游戏平板5 Pro正式发布。这款平板从定位上就明确瞄准“极致游戏”体验,外观方面带来了一个重磅亮点——首次引入RGB水冷散热系统,背部那条可视化的水路通道,配合纯平透明背板设计,核心配置信息一览无余,科技感十足。 图源网络 屏幕方面同样表现突出。一块9 06英寸OLED

杭州全国首所机器人学校首批30台机器人入学
科技数码 · 2026-07-02

杭州全国首所机器人学校首批30台机器人入学

30台机器人整齐列队,有的刚从生产线卸下,机械零件还带着崭新的“工业气息”;有的已搭载运动控制模块,能稳健地小跑、跳跃几下。它们来自不同制造工厂,外形与功能各有千秋,但此刻都拥有了同一个身份——杭州机器人学校的第一批入学新生。 6月30日,杭州经信正式发布:由浙江大学机器人研究院、浙江省质量科学研究

美国计划发射航天器托举天文卫星
科技数码 · 2026-07-02

美国计划发射航天器托举天文卫星

就在最近,NASA公布了一项非常果断的干预计划——他们定于6月30日实施一次“卫星维修任务”,派遣一台名为“连接”号的机器人服务卫星,为一颗超期服役的天文卫星延长运行寿命。这颗卫星是“尼尔·格雷尔斯·斯威夫特天文台”,其轨道高度正在不断衰减,如果不进行干预,今年年底前很可能会坠入地球大气层并烧毁。