首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
Claude Sonnet 4.5发布:自主运行30小时的最强编程模型

Claude Sonnet 4.5发布:自主运行30小时的最强编程模型

热心网友
99
转载
2025-12-02

9月30日消息,人工智能(AI)公司Anthropic于周一发布了其最新模型Claude Sonnet 4.5。这家获亚马逊投资、估值达1830亿美元的初创企业表示,Claude Sonnet 4.5在编程、计算机操作以及满足实际业务需求方面性能优异,且在网络安全、金融和研究等专业领域表现突出。该模型现已向所有用户开放。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

Anthropic称,根据衡量AI系统软件编程能力的SWE-bench Verified等行业基准测试,Claude Sonnet 4.5是“全球最强的编程模型”。

Anthropic联合创始人兼首席科学官贾里德·卡普兰(Jared Kaplan)在接受CNBC采访时表示:“用户发现这款模型更智能、更像一位得力的同事。在协同解决问题时能给用户带来愉悦的体验。”


公司表示,新模型能够生成质量更高的代码,更擅长发现代码的改进空间,并且遵循指令的可靠性显著提升。

在此之前,Anthropic已于今年5月发布了Claude Sonnet 4,并于8月发布了Claude Opus 4.1。此次更新再次彰显了人工智能行业日新月异的发展速度。

Anthropic由前OpenAI研究人员于2024年创立,两家公司自此形成激烈的竞争格局。

2024年,OpenAI发布聊天机器人ChatGPT,引爆生成式人工智能热潮。今年8月份,这家估值已飙升至5000亿美元的初创公司发布了其最新模型GPT-5,但发布过程一波三折,部分用户抱怨无法再使用OpenAI的旧版模型。

Anthropic首席产品官迈克·克里格(Mike Krieger)则表示,Claude Sonnet 4.5将成为用户的默认模型,公司推荐的这款模型适用“几乎所有使用场景”。

他还补充说,付费订阅用户仍然可以选用Opus模型,而那些有特定工作流、尚未准备立即迁移的用户也可以继续沿用旧版Sonnet模型。

克里格补充道,Claude Sonnet 4.5的模型体量比Claude Opus 4.1更小,但“几乎所有方面”都更智能。

克里格说:“我们自己和客户都发现,这个模型在实际工作中极具实用价值。”

据Anthropic介绍,Claude Sonnet 4.5可持续自主运行长达30小时,期间能持续专注于处理复杂的多步骤任务。相比之下,今年5月份发布的Claude Opus 4只能自主运行7小时。

Anthropic还表示,他们通过大量的安全训练成功改善了模型的行为表现,有效减少了“欺骗行为”、“寻求控制权”以及“阿谀奉承”等不良倾向。

Claude Sonnet 4.5对“提示词注入攻击”也具备更强的防御能力,可有效避免被诱导执行泄露敏感数据等恶意操作。

卡普兰说:“这可能是过去一年到一年半以来,我们在安全性方面取得的最大突破。”

Anthropic还将发布更多新模型。卡普兰透露,更先进的模型即将问世,其中“很可能包括新版Opus”。

他表示:“虽然目前不会做出承诺,但我认为在今年年底前,我们很可能还会发布一到两款新模型。”

各方观点与市场解读

《彭博社》在报道中特意提到,最近数周的多项研究表明,AI并未给竞相采用它的公司带来显著效益。但Anthropic强调,Sonnet 4.5在网络安全和金融服务等领域的任务中表现尤其出色。公司首席产品官克里格认为,企业要充分实现AI的价值,“必须要有几个大前提”,其中包括AI模型自身的进步以及“人们适应并改变现有的工作流程”。他还补充说,“前沿实验室与这些企业之间也需要建立更深层次的合作关系”。

路透社则认为,Anthropic发布Claude Sonnet 4.5标志着公司正向企业级AI市场纵深发展。该报道提到了Anthropic与微软的集成计划。后者于上周宣布,将为Microsoft 365 Copilot新增Anthropic模型驱动的一系列功能,其中包括Excel和Word中的“智能体模式”(Agent Mode)、Copilot聊天中的“Office智能体”(Office Agent)等等。随后还将在PowerPoint中上线相关功能。

《The Verge》也提到,Claude Sonnet 4.5是Anthropic在AI智能体和AI编码领域抢占市场主导地位的竞争中迈出的重要一步。该报道表示,Anthropic、OpenAI、谷歌等公司一直在不断发布增量更新和新功能,让AI助手为消费者、企业和开发者提供更多服务。这场争夺用户关注度和依存度的竞赛几乎每月甚至每周都在升温。Anthropic的产品管理负责人Dianne Penn在接受《The Verge》采访时提到,新模型的运作水平达到了“参谋长级别”,能够查询多人日程找出空闲时间并安排会议,查看数据仪表盘整合不同见解,还能根据与下属的一对一会议内容撰写工作状态更新等。

《商业内幕》(Business Insider)认为,此次升级距离前代产品Sonnet 4的发布仅四个月,凸显出Anthropic在生成式AI的激烈竞争中快速迭代产品的能力。该报道指出,新模型在模仿人类使用计算机的能力上取得了巨大飞跃。公司开发者关系主管亚历克斯·艾尔伯特( Alex Albert)在接受《商业内幕》采访时表示:“这些进步证实,通过扩展计算能力等输入,AI模型的性能将持续提升。”该报道提到,Anthropic大力宣传新模型可以自主使用计算机、加强网络安全、开发实用应用程序和AI智能体,从而创造出实际的商业成果。文中援引艾尔伯特的话称,“编码和智能体能力的提升正在转化为实实在在的生产力增长。”

《商业内幕》的报道还提到了Anthropic在完善开发者生态方面的一系列动作。公司面向开发者推出原生VS Code扩展、增强的终端工作流等新功能,并允许工程师在AI项目偏离轨道时通过检查点功能即时回滚代码。此外,Anthropic还在Claude开发者平台上推出了一个Claude智能体软件开发工具包,为开发者提供精细化的工具,用于开发定制化、具备上下文感知能力的AI智能体。(辰辰)

来源:https://www.163.com/tech/article/KAMKTH1N00097U7T.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

别只盯着“上门装龙虾赚26万”!看懂OpenClaw背后的“意图入口”大战
AI
别只盯着“上门装龙虾赚26万”!看懂OpenClaw背后的“意图入口”大战

别再只关注“上门装龙虾赚26万”!深度解读OpenClaw背后的“意图入口”新战争 最近科技行业的热潮,充满了戏剧性的现实色彩。一只“红色龙虾”AI智能体搅动了整个市场:有人通过提供安装服务,收取每次五百元,短短几天就赚取二十六万元收入;腾讯大厦前甚至排起长队,大家竞相领取免费的安装体验权限。这场全

热心网友
04.02
OpenClaw安装
AI
OpenClaw安装

OpenClaw 从零到一:完整安装教程与常见问题解决 想要快速上手 OpenClaw 智能体开发平台?本文将为你提供一份详尽的安装使用指南,涵盖从系统环境准备、核心安装步骤、关键配置到实战应用的完整流程。我们将重点解析安装过程中的常见“坑点”与解决方案,助你高效部署,顺利开启 AI 智能体开发之旅

热心网友
04.02
OpenClaw本地安装
AI
OpenClaw本地安装

OpenClaw本地安装指南:Windows WSL环境详细部署教程 若您已在Windows系统中配置好WSL(Windows Subsystem for Linux)环境,那么安装OpenClaw将变得十分便捷。本教程将详细指导您完成整个本地部署流程,帮助您快速搭建属于自己的AI助手。 第一步:运

热心网友
04.02
openclaw自己误该配置导致openclaw gate 启动错误
AI
openclaw自己误该配置导致openclaw gate 启动错误

OpenClaw Gate 服务启动失败排查与解决方案 本次故障是一次典型的因配置操作不当引发的服务异常案例。用户在调整 OpenClaw Gate 服务配置时,错误地添加了不支持的启动参数,从而导致 gateway 服务无法启动。以下记录是基于完整会话日志(路径: openclaw agents

热心网友
04.02
OpenClaw是什么?OpenClaw怎么样?OpenClaw 2026年最新部署方法整理
AI
OpenClaw是什么?OpenClaw怎么样?OpenClaw 2026年最新部署方法整理

OpenClaw是什么?2026年最新一键部署方法与实战指南 如果您正在寻找一款功能强大、完全开源的AI智能体框架,那么OpenClaw(曾用名Clawdbot或Moltbot)无疑是当前的优选。它凭借卓越的任务自动化能力与丰富的工具集成生态,已成为个人开发者与企业构建智能助理的首选平台。然而,对于

热心网友
04.02

最新APP

火柴人传奇
火柴人传奇
动作冒险 04-01
街球艺术
街球艺术
体育竞技 04-01
飞行员模拟
飞行员模拟
休闲益智 04-01
史莱姆农场
史莱姆农场
休闲益智 04-01
绝区零
绝区零
角色扮演 04-01

热门推荐

金亨泰称三上真司03年作品《P.N.03》是《剑星》的灵感来源之一
游戏资讯
金亨泰称三上真司03年作品《P.N.03》是《剑星》的灵感来源之一

金亨泰亲证:《剑星》核心灵感源自三上真司经典动作游戏《P N 03》 近日,游戏界迎来一则令动作游戏爱好者振奋的重磅消息。Shift Up创始人金亨泰通过官方视频,正式宣布与传奇制作人三上真司旗下工作室展开深度合作。他特别强调,此次联手并非简单的资源整合,而是要让玩家亲眼见证,当三上真司深厚的动作游

热心网友
04.02
《红色沙漠》属性限制突破方法介绍
游戏攻略
《红色沙漠》属性限制突破方法介绍

红色沙漠属性限制怎么突破 在《红色沙漠》游戏进程中,很多玩家会发现,当角色属性提升至10级后便会遭遇等级上限的封锁,无法继续升级。这并非设计缺陷,而恰恰是游戏深度成长系统的起点——只有成功突破这层限制,角色真正的潜力才能被彻底释放。 那么,突破属性限制的具体方法是什么?关键在于寻访分布在游戏世界各地

热心网友
04.02
Kraken旗下代币化美股平台xStocks宣布将推出xPoints!积分计划细节引起发币猜想
web3.0
Kraken旗下代币化美股平台xStocks宣布将推出xPoints!积分计划细节引起发币猜想

Kraken旗下代币化美股平台xStocks宣布将推出xPoints!积分计划细节引出发币猜想 随着真实世界资产(RWA)赛道持续升温,代币化股票已然成为加密市场里增长最为迅猛的领域之一。最新消息显示,知名交易所Kraken旗下的代币化美股平台xStocks即将推出名为“xPoints”的奖励计划,

热心网友
04.02
流放之路2双修闪打德鲁伊怎么搭配BD思路-流放之路2双修闪打德鲁伊BD思路如何搭配
游戏资讯
流放之路2双修闪打德鲁伊怎么搭配BD思路-流放之路2双修闪打德鲁伊BD思路如何搭配

一、BD核心构建思路 想要打造一个能抗能打、生存与输出兼备的近战角色吗?双修闪打德鲁伊无疑是你的理想选择。这套玩法的核心理念非常清晰:召唤强大的熊灵作为你的“不朽壁垒”,在前排承担主要伤害并稳固仇恨;与此同时,你自身则化身为“风暴裁决者”,依靠风暴打击实现高频位移与持续输出。一守一攻,默契配合,使得

热心网友
04.02
虚拟币网格交易超出区间会强行卖出吗?网格交易模式有哪些?
web3.0
虚拟币网格交易超出区间会强行卖出吗?网格交易模式有哪些?

虚拟币网格交易超出区间会强行卖出吗? 聊起网格交易,很多朋友第一印象就是“自动化低买高卖”。作为一种经典的量化策略,它确实试图在市场波动中捕捉利润。但问题来了:一旦币价飘出了预设的“网格”,系统会不会来个“清仓大甩卖”呢?通常来说,答案是否定的,强行卖出并非标准动作。不过,具体会发生什么,还真得看您

热心网友
04.02