Anthropic发布Claude Sonnet 4.5: 重新定义AI开发效能
今日,Anthropic重磅推出Claude Sonnet 4.5版本,该模型被官方定位为"全球顶尖的代码开发助手""智能体构建首选平台"和"最高效的数字化工具使用者"。新版本不仅在推理与数学能力上实现了突破性进展,更同步推出一系列开发者工具升级方案。
30小时连续工作:突破性的持久执行能力
最引人注目的改进在于系统的持续工作能力。经过实测,Sonnet 4.5可以在复杂多步骤任务中保持30小时以上的专注执行,相较4.0版本的7小时续航时间实现了质的飞跃。以下是其在权威基准测试中的表现:
SWE-bench代码评估:标准条件下准确率77.2%,极端环境下可达82.0%
OSWorld数字化工具使用:得分61.4%,远超4.0版本的42.2%
数学推理:在AIME和MMMLU等评估体系中均创下新高

赋能开发者:全方位的工具链升级
本次更新不仅是模型升级,更是开发体验的革命性提升:
• Claude Code新增原生VS Code插件,支持代码异动可视化对比
• 终端2.0版本加入历史检索与临时保存点(Checkpoints)功能
• 推出Claude Agent SDK,企业可构建定制化AI助手
• 上下文管理与记忆系统使复杂检索效率提升39%
安全与定价策略
新版本采用ASL-3级安全防护,强化了风险内容过滤机制。价格维持不变:
API调用:3美元/百万token(输入),15美元/百万token(输出)
开发者实战体验
测试用例显示,Sonnet 4.5能够独立完成从前后端开发到数据库调试的全流程工作。许多开发者形容其为"不知疲倦的数字员工",与更高规格的Opus模型形成完美互补。
值得注意的是,尽管AI生成代码能力显著提升,专业工程师的审核把关仍然不可或缺。Anthropic此次突破性的30小时持续工作能力,正在重新定义人机协作的边界。
