今天,Anthropic 在官方 X 账号正式发布了 Claude Opus 4.7 的更新公告。此次版本迭代并非颠覆性重构,而是精准聚焦于“长时任务可靠性”及“实际编码场景”的深度优化。以下内容基于官方帖文及其链接的详尽说明,我们客观梳理本次的核心变化,以便您判断是否值得立即上手体验。
1. 核心能力提升:更适合“放手”交给 AI 执行的长任务
据官方描述,Opus 4.7 在处理长时间、复杂任务时,展现出了更强的“严谨性”。具体来说,主要体现在以下几个方面:对于指令的理解与执行更为精确;能够主动设计方法验证自身输出结果,再向用户汇报;同时,显著减少了开发者在过程中需要逐步监督的频次。
对于使用 AI 辅助编程的用户而言,这意味着在构建完整功能、进行跨文件重构或执行长时间智能体任务时,模型的自主能力可能会有实质性的增强。官方提到,在内部研究用的智能体基准测试中,该模型取得了当前最优的多步工作效率;而在 93 项编码任务的子集上,相比 4.6 版本实现了 13% 的提升。值得关注的是,它成功解决了此前两个版本都未能完成的 4 项任务。
2. 视觉能力显著升级
Opus 4.7 的图像分辨率提升至长边 2576 像素(约 3.75 百万像素),这是此前 Claude 模型的三倍以上。这一提升带来的直接好处包括:能够更清晰地处理密集的截图、复杂的图表及 UI 设计稿,同时生成的界面、幻灯片与文档质量也更高。
对于前端开发者,或是经常需要产出设计文档、从截图中提取代码逻辑的用户而言,这可能是最直观可感知的变化。官方也强调,这是模型层级的视觉能力升级,并非仅靠优化提示词就能达成的效果。
3. Claude Code 专属新功能
这部分更新与编程者关系最为直接,主要包含两项:
第一,/ultrareview 命令。输入后,它会启动一个专用审查会话,系统性阅读您的代码改动,标记出“细心的代码审查员才会注意到的 bug 与设计问题”。Pro 及 Max 用户目前可免费试用 3 次。
第二,Auto Mode 扩展至 Max 用户。这意味着更长的任务可交由 Claude 自主决策,过程中被打断的次数显著减少,适合完整运行一个功能特性。此外,所有计划的默认 effort level 已提升至 xhigh,官方建议在编码及智能体场景中优先使用 high 或 xhigh。
4. API 端实用调整
API 方面也有数项调整值得关注:新增了 xhigh 这一 effort level,介于 high 与 max 之间,提供更细粒度的推理深度与延迟控制选项;Task budgets(测试版)功能,可帮助在长任务中提前规划 token 消耗与管理成本。定价方面,与 4.6 保持一致(输入 15 美元,输出 25 美元/M tokens),但 tokenizer 更新后,相同的输入可能消耗稍多一些 token,官方也提供了 migration guide 供用户进行调优。
5. 实际使用建议
官方数据确实亮眼,但正如每一次模型迭代一样,最终效果仍需在您自己的代码库与实际工作流程中验证。这里提供几点建议:
提示词可能需要轻微调整,因为新模型会更严格按字面理解指令;如果您此前主要使用 4.6 处理长任务,不妨先用相同的 prompt 进行一次简单的 A/B 测试;视觉相关任务,如 UI 生成、图表解读,大概率能立即感受到提升;对于 Claude Code 用户而言,/ultrareview 与 Auto Mode 无疑是最值得优先尝试的功能。
Opus 4.7 已于今日在 claude.ai、Claude Platform 以及 Amazon Bedrock、Google Vertex AI、Microsoft Foundry 等主流云平台上架。
总体而言,这次更新更像是 Anthropic 在“让模型真正能承担更复杂、更长的编程工作”这一方向上,一次务实的推进,并非革命性跳跃。但对于那些每日将 Claude 当作编程伙伴的用户而言,花上 10 到 15 分钟,在几个项目上实际跑一跑、看看效果,绝对值得尝试。
您已经在使用 Claude Code 了吗?4.7 上线后最想先试哪个新特性?欢迎在评论区分享您的初步体验,一起客观探讨实际表现。
