Anthropic发布Claude4.5:AI能力直逼人类工程师
Anthropic发布Claude Sonnet 4.5: 重新定义AI开发效能
今日,Anthropic重磅推出Claude Sonnet 4.5版本,该模型被官方定位为"全球顶尖的代码开发助手""智能体构建首选平台"和"最高效的数字化工具使用者"。新版本不仅在推理与数学能力上实现了突破性进展,更同步推出一系列开发者工具升级方案。
30小时连续工作:突破性的持久执行能力
最引人注目的改进在于系统的持续工作能力。经过实测,Sonnet 4.5可以在复杂多步骤任务中保持30小时以上的专注执行,相较4.0版本的7小时续航时间实现了质的飞跃。以下是其在权威基准测试中的表现:
SWE-bench代码评估:标准条件下准确率77.2%,极端环境下可达82.0%
OSWorld数字化工具使用:得分61.4%,远超4.0版本的42.2%
数学推理:在AIME和MMMLU等评估体系中均创下新高

赋能开发者:全方位的工具链升级
本次更新不仅是模型升级,更是开发体验的革命性提升:
• Claude Code新增原生VS Code插件,支持代码异动可视化对比
• 终端2.0版本加入历史检索与临时保存点(Checkpoints)功能
• 推出Claude Agent SDK,企业可构建定制化AI助手
• 上下文管理与记忆系统使复杂检索效率提升39%
安全与定价策略
新版本采用ASL-3级安全防护,强化了风险内容过滤机制。价格维持不变:
API调用:3美元/百万token(输入),15美元/百万token(输出)
开发者实战体验
测试用例显示,Sonnet 4.5能够独立完成从前后端开发到数据库调试的全流程工作。许多开发者形容其为"不知疲倦的数字员工",与更高规格的Opus模型形成完美互补。
值得注意的是,尽管AI生成代码能力显著提升,专业工程师的审核把关仍然不可或缺。Anthropic此次突破性的30小时持续工作能力,正在重新定义人机协作的边界。
相关攻略

暴晒+沥青+锡板=世界上第一张照片?听起来有些像是化学实验,但这正是被学界普遍认可的世界上第一张照片——《勒格哈的窗外景色》的诞生方式,尽管具体年份仍有争议,但也即将度过200岁的生日。照片的作者尼

今年7月发生了件挺魔幻的事。Cloudflare宣布默认阻止所有AI爬虫,超过100万 主动开启了这个功能。理由很简单,AI训练爬虫吸走内容后,直接在自己的应用里回答用户问题,几乎不会给原 带来任何

北京时间9月19日凌晨,英伟达创始人黄仁勋与英特尔首席执行官陈立武共同召开了一场线上发布会。会上,黄仁勋宣布了一个爆炸性的消息:英伟达将向老对手英特尔注资50亿美元,并与其携手开发革命性的“Inte

从模型到App:Sora2的全新亮相今日AI圈无人放假。OpenAI在预告了一段之后,正式推出新一代视频生成模型Sora 2,而这一次的主角不再是模型本身。它首次将其以独立iOS应用的形式发布。与一

不久前,全球领先的支付公司Stripe的联合创始人帕特里克·科里森提出了一个令人困惑的问题。他发了一张图表,上面是苹果、微软和谷歌三家公司的市值增长曲线,从2010年到2025年,三条线几乎完美地平
热门专题


热门推荐

10月4日消息,德国知名硬件 PC Games Hardware(PCGH)迎来了25周年纪念,为了庆祝这一时刻,PCGH选择了一种独特的方式——对180款显卡进行大规模评测,涵盖了从2009年到2

截至2025年10月2日14时16分,全国电影票房(含预售)突破425 022亿元,正式超越2024年全年票房总额。根据专业数据平台显示,今年国内上映影片已超过300部,题材覆盖历史、喜剧、动画、奇

《咒术回战》第262话图透已流出,本期只有7页内容,整体节奏紧凑但略显混乱。乙骨忧太操控五条悟与宿傩在领域层面上展开激烈对抗。在战斗中,宿傩突然施展了「领域展延」,一举突破了乙骨设置的下限防御,这让

由Sucker Punch开发并由索尼发行的动作冒险游戏羊蹄山之魂已于今日正式上线。游戏中,玩家将扮演女主角“笃”,踏上一段充满复仇与救赎的旅程。十六年前,笃的家人惨遭“羊蹄六人组”杀害,她本人虽幸
根据中国信息通信研究院最新发布的测算数据,2024年我国人工智能产业迎来显著增长,产业规模突破9000亿元大关,较上一年度实现24%的同比增速。这一数据反映出我国人工智能领域持续保持的高质量发展态势