Anthropic发布Claude4.5：AI能力直逼人类工程师

就在刚刚，Anthropic宣布推出Claude Sonnet 4 5。最新将其定位为“全球最强的代码模型”“构建复杂智能体的最强模型”以及“最会用电脑的模型”，并称其在推理与数学上也有显著提升。新

今日，Anthropic重磅推出Claude Sonnet 4.5版本，该模型被官方定位为"全球顶尖的代码开发助手""智能体构建首选平台"和"最高效的数字化工具使用者"。新版本不仅在推理与数学能力上实现了突破性进展，更同步推出一系列开发者工具升级方案。

最引人注目的改进在于系统的持续工作能力。经过实测，Sonnet 4.5可以在复杂多步骤任务中保持30小时以上的专注执行，相较4.0版本的7小时续航时间实现了质的飞跃。以下是其在权威基准测试中的表现：

SWE-bench代码评估：标准条件下准确率77.2%，极端环境下可达82.0%

OSWorld数字化工具使用：得分61.4%，远超4.0版本的42.2%

数学推理：在AIME和MMMLU等评估体系中均创下新高

本次更新不仅是模型升级，更是开发体验的革命性提升：

• Claude Code新增原生VS Code插件，支持代码异动可视化对比

• 终端2.0版本加入历史检索与临时保存点(Checkpoints)功能

• 推出Claude Agent SDK，企业可构建定制化AI助手

• 上下文管理与记忆系统使复杂检索效率提升39%

新版本采用ASL-3级安全防护，强化了风险内容过滤机制。价格维持不变：

API调用：3美元/百万token（输入），15美元/百万token（输出）

测试用例显示，Sonnet 4.5能够独立完成从前后端开发到数据库调试的全流程工作。许多开发者形容其为"不知疲倦的数字员工"，与更高规格的Opus模型形成完美互补。

值得注意的是，尽管AI生成代码能力显著提升，专业工程师的审核把关仍然不可或缺。Anthropic此次突破性的30小时持续工作能力，正在重新定义人机协作的边界。