Claude Sonnet 4.5发布：自主运行30小时的最强编程模型

时间：2025-12-02 16:48

9月30日消息，人工智能（AI）公司Anthropic于周一发布了其最新模型Claude Sonnet 4 5。这家获亚马逊投资、估值达1830亿美元的初创企业表示，Claude Sonnet 4

9月30日消息，人工智能（AI）公司Anthropic于周一发布了其最新模型Claude Sonnet 4.5。这家获亚马逊投资、估值达1830亿美元的初创企业表示，Claude Sonnet 4.5在编程、计算机操作以及满足实际业务需求方面性能优异，且在网络安全、金融和研究等专业领域表现突出。该模型现已向所有用户开放。

Anthropic称，根据衡量AI系统软件编程能力的SWE-bench Verified等行业基准测试，Claude Sonnet 4.5是“全球最强的编程模型”。

Anthropic联合创始人兼首席科学官贾里德·卡普兰（Jared Kaplan）在接受CNBC采访时表示：“用户发现这款模型更智能、更像一位得力的同事。在协同解决问题时能给用户带来愉悦的体验。”

公司表示，新模型能够生成质量更高的代码，更擅长发现代码的改进空间，并且遵循指令的可靠性显著提升。

在此之前，Anthropic已于今年5月发布了Claude Sonnet 4，并于8月发布了Claude Opus 4.1。此次更新再次彰显了人工智能行业日新月异的发展速度。

Anthropic由前OpenAI研究人员于2024年创立，两家公司自此形成激烈的竞争格局。

2024年，OpenAI发布聊天机器人ChatGPT，引爆生成式人工智能热潮。今年8月份，这家估值已飙升至5000亿美元的初创公司发布了其最新模型GPT-5，但发布过程一波三折，部分用户抱怨无法再使用OpenAI的旧版模型。

Anthropic首席产品官迈克·克里格（Mike Krieger）则表示，Claude Sonnet 4.5将成为用户的默认模型，公司推荐的这款模型适用“几乎所有使用场景”。

他还补充说，付费订阅用户仍然可以选用Opus模型，而那些有特定工作流、尚未准备立即迁移的用户也可以继续沿用旧版Sonnet模型。

克里格补充道，Claude Sonnet 4.5的模型体量比Claude Opus 4.1更小，但“几乎所有方面”都更智能。

克里格说：“我们自己和客户都发现，这个模型在实际工作中极具实用价值。”

据Anthropic介绍，Claude Sonnet 4.5可持续自主运行长达30小时，期间能持续专注于处理复杂的多步骤任务。相比之下，今年5月份发布的Claude Opus 4只能自主运行7小时。

Anthropic还表示，他们通过大量的安全训练成功改善了模型的行为表现，有效减少了“欺骗行为”、“寻求控制权”以及“阿谀奉承”等不良倾向。

Claude Sonnet 4.5对“提示词注入攻击”也具备更强的防御能力，可有效避免被诱导执行泄露敏感数据等恶意操作。

卡普兰说：“这可能是过去一年到一年半以来，我们在安全性方面取得的最大突破。”

Anthropic还将发布更多新模型。卡普兰透露，更先进的模型即将问世，其中“很可能包括新版Opus”。

他表示：“虽然目前不会做出承诺，但我认为在今年年底前，我们很可能还会发布一到两款新模型。”

各方观点与市场解读

《彭博社》在报道中特意提到，最近数周的多项研究表明，AI并未给竞相采用它的公司带来显著效益。但Anthropic强调，Sonnet 4.5在网络安全和金融服务等领域的任务中表现尤其出色。公司首席产品官克里格认为，企业要充分实现AI的价值，“必须要有几个大前提”，其中包括AI模型自身的进步以及“人们适应并改变现有的工作流程”。他还补充说，“前沿实验室与这些企业之间也需要建立更深层次的合作关系”。

路透社则认为，Anthropic发布Claude Sonnet 4.5标志着公司正向企业级AI市场纵深发展。该报道提到了Anthropic与微软的集成计划。后者于上周宣布，将为Microsoft 365 Copilot新增Anthropic模型驱动的一系列功能，其中包括Excel和Word中的“智能体模式”（Agent Mode）、Copilot聊天中的“Office智能体”（Office Agent）等等。随后还将在PowerPoint中上线相关功能。

《The Verge》也提到，Claude Sonnet 4.5是Anthropic在AI智能体和AI编码领域抢占市场主导地位的竞争中迈出的重要一步。该报道表示，Anthropic、OpenAI、谷歌等公司一直在不断发布增量更新和新功能，让AI助手为消费者、企业和开发者提供更多服务。这场争夺用户关注度和依存度的竞赛几乎每月甚至每周都在升温。Anthropic的产品管理负责人Dianne Penn在接受《The Verge》采访时提到，新模型的运作水平达到了“参谋长级别”，能够查询多人日程找出空闲时间并安排会议，查看数据仪表盘整合不同见解，还能根据与下属的一对一会议内容撰写工作状态更新等。

《商业内幕》（Business Insider）认为，此次升级距离前代产品Sonnet 4的发布仅四个月，凸显出Anthropic在生成式AI的激烈竞争中快速迭代产品的能力。该报道指出，新模型在模仿人类使用计算机的能力上取得了巨大飞跃。公司开发者关系主管亚历克斯·艾尔伯特（ Alex Albert）在接受《商业内幕》采访时表示：“这些进步证实，通过扩展计算能力等输入，AI模型的性能将持续提升。”该报道提到，Anthropic大力宣传新模型可以自主使用计算机、加强网络安全、开发实用应用程序和AI智能体，从而创造出实际的商业成果。文中援引艾尔伯特的话称，“编码和智能体能力的提升正在转化为实实在在的生产力增长。”

《商业内幕》的报道还提到了Anthropic在完善开发者生态方面的一系列动作。公司面向开发者推出原生VS Code扩展、增强的终端工作流等新功能，并允许工程师在AI项目偏离轨道时通过检查点功能即时回滚代码。此外，Anthropic还在Claude开发者平台上推出了一个Claude智能体软件开发工具包，为开发者提供精细化的工具，用于开发定制化、具备上下文感知能力的AI智能体。（辰辰）

来源：https://www.163.com/tech/article/KAMKTH1N00097U7T.html

人工智能智能体 claude 编程工作流

上一篇英伟达与OpenAI激战AI基建：巨头为何疯狂投入万亿赛道 下一篇iPhone Air评测：苹果的单品策略，为何非理性选择居多？

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

业界动态 · 2026-07-01

诺基亚TA-1619入网：1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息，一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可，不过证件照目前还没公布。从入网信息来看，这是一款TD-LTE数字移动电话机，支持TD-LTE网络，属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持，终端款式为直板。核心配置方面，电池额定容

业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片，采用直接变频架构，覆盖10MHz至7250MHz频段，支持最大450MHz带宽及JESD204B高速接口，性能对标国际，满足5G基站与卫星通信等高端需求，突破海外技术壁垒。

业界动态 · 2026-07-01

月起私人充电桩可卖电每度净赚5毛

近期有一则重大利好消息，值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起，湖北武汉的新能源车主，可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言，就是借助峰谷电价差，实现低买高卖，每度电净收益约5毛钱。过去，车网互动（V2G）基本只局限于特定的公共充电站，受试点规模限制，

业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息：谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息，Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发，实际上它的技术代号是Gemini 3 1 Flash Lite Image，属于Gemini 3 1家族。最大的卖点就两个：快，便

业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行，来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴，以主板、显示器等专业硬件保障比赛稳定流畅，并通过赛事反哺研发的闭环模式支持电竞发展。