首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
Claude 4.5深夜发布:30小时持续工作堪比真人同事

Claude 4.5深夜发布:30小时持续工作堪比真人同事

热心网友
90
转载
2025-09-30

昨夜凌晨,人工智能企业 Anthropic 正式推出新一代模型 Claude Sonnet 4.5,最新直言其为 “世界上最好的编码模型、构建复杂代理的最强大工具、使用计算机的最佳模型”。伴随模型发布的还有 Claude Agent SDK 开发工具包及系列产品升级,标志着 AI 已具备独立完成生产级开发任务的能力。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

Anthropic 联合创始人兼首席科学官贾里德·卡普兰 (Jared Kaplan) 在接受 CNBC 采访时表示:“人们注意到了这种模型,因为它更智能,更像同事,遇到问题并解决问题时与它一起工作很有趣。”

该公司表示,该模型可以生成更高质量的代码,更好地识别代码改进,并且可以更可靠地遵循指令。

性能跑分登顶:从 “写代码” 到 “交付产品” 的跨越

Claude Sonnet 4.5 的核心突破体现在工程落地能力上。在衡量真实软件编码能力的 SWE-bench Verified 基准测试中,该模型以 77.2% 的准确率名列前茅,较前代提升近 20 个百分点。更值得关注的是其长周期任务处理能力 —— 在实测中,它能自主运行 30 小时,生成 1.1 万行代码,完整开发出类似钉钉的企业聊天应用,涵盖数据库配置、域名注册、合规审计等全流程,成为首个实现 “生产级交付” 的 AI 模型。

在计算机操作领域,其 OSWorld 基准测试得分从四个月前的 42.2% 跃升至 61.4%,领先行业同类产品。金融、法律等专业领域测试显示,其推理能力较上一代 Opus 4.1 提升 30% 以上,数学问题解决精度显著优化。“用户会发现它更像同事,合作解决问题时非常高效。”Anthropic 研究员 Jared Kaplan 表示。

该模型还显示出在推理和数学等广泛评估方面的改进能力:

金融、法律、医学和 STEM 领域的专家发现,与包括 Opus 4.1 在内的旧模型相比,Sonnet 4.5 表现出了更出色的领域特定知识和推理能力。

产品生态升级:代码开发全流程体验重构

针对开发者核心需求,Anthropic 同步推出多项产品功能更新:

Claude Code 2.0:新增呼声极高的 “检查点” 功能,支持代码进度保存与即时回滚,配合刷新的终端界面与原生 VS Code 扩展,大幅提升开发效率;

API 能力强化:新增上下文编辑与记忆工具,使 AI 代理的持续运行时间从 7 小时延长至 30 小时,可处理更复杂的多步骤任务;

交互体验革新:Claude 应用内直接集成代码执行与文件创建功能,支持在对话中生成电子表格、幻灯片等文档;

浏览器拓展落地:面向上月加入候补名单的 Max 订阅用户,开放 Claude for Chrome 扩展程序下载使用。

开放 Agent SDK:赋能开发者构建专属智能助手

此次发布的重磅工具 Claude Agent SDK,将 Anthropic 内部开发 Claude Code 的核心基础设施对外开放。该工具包解决了 AI 代理开发中的三大痛点:长期任务记忆管理、自主性与用户控制的平衡、多代理协同调度。开发者可基于此快速搭建定制化 AI 助手,覆盖项目管理、数据处理、客户服务等场景。

“我们把支撑前沿产品的构建模块共享出来,让开发者无需从零搭建基础设施。”Anthropic 首席产品官 Mike Krieger 介绍,该 SDK 已在 Canva 等企业的工程团队中得到验证,能显著提升代码库管理与产品研究效率。

误报率较初代模型降低 90%

据介绍,Claude Sonnet 4.5 不仅是 Anthropic 功能最强大的模型,也是 Anthropic 迄今为止最符合前沿技术的模型。Claude 的改进功能以及广泛的安全培训使 Anthropic 能够显著改善该模型的行为,减少诸如谄媚、欺骗、权力追求以及鼓励妄想思维倾向等令人担忧的行为。对于该模型的代理和计算机使用功能,Anthropic 在防御即时注入攻击方面也取得了显著进展,而即时注入攻击是这些功能用户面临的最严重风险之一。

Claude Sonnet 4.5 通过 AI 安全等级 3(ASL-3)认证,配备化学、生物等危险内容分类检测器,误报率较初代降低 90%,同时大幅减少欺骗性回答、权力寻求等风险行为。

在商业策略上,Anthropic 保持价格亲民,API 调用费用与 Claude Sonnet 4 完全一致,为每百万代币输入 3 美元、输出 15 美元。开发者即日起可通过 “claude-sonnet-4-5” 接口直接调用该模型。

Anthropic 首席产品官 Mike Krieger 表示,Claude Sonnet 4.5 将成为用户的默认选择,并且 Anthropic 推荐该模型用于“基本上所有用例”。

即便如此,用户仍然有选择。付费用户仍然可以选择使用 Opus,而拥有特定工作流程的用户如果还没准备好在一夜之间迁移,可以选择老一代的 Sonnet,他说道。

Krieger 补充道,Claude Sonnet 4.5 比 Claude Opus 4.1 小,但“几乎在各个方面”都比它更智能。

行业分析师指出,Claude Sonnet 4.5 的发布标志着 AI 从 “辅助工具” 向 “独立生产力” 的跨越,而开放 SDK 的举措或将加速 AI 代理技术在各行业的落地应用。

Kaplan 说:“我认为这是我们在过去一年或一年半中看到的最大安全飞跃。”

Anthropic 即将推出更多型号。Kaplan 表示,更好的型号即将推出,其中“很可能包括 Opus”。

“不敢保证,”他说,“但我想我们年底前可能会再推出一两部作品。”

参考链接:

https://www.cnbc.com/2025/09/29/anthropic-claude-ai-sonnet-4-5.html

来源:https://36kr.com/p/3488568735226758
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Vue3 编译器如何处理插槽?优化 Block Tree 结构的 Slot 渲染指南
前端开发
Vue3 编译器如何处理插槽?优化 Block Tree 结构的 Slot 渲染指南

Vue3 插槽编译机制解析:从模板到函数参数的转换原理与优化实践 Vue3 编译器如何将插槽转换为函数参数 在 Vue3 的编译过程中,核心编译器(@vue compiler-core)会对模板进行深度解析。当遇到 标签时,会将其识别为一个特殊的“作用域插槽调用点”,而不是普通的 DOM 元素节点。

热心网友
04.18
方舟生存进化手游狮鹫驯化方法方舟生存进化手游狮鹫饲料配方与驯服技巧
游戏攻略
方舟生存进化手游狮鹫驯化方法方舟生存进化手游狮鹫饲料配方与驯服技巧

《方舟:生存进化》手游狮鹫驯服指南:从寻找到驯化的完整流程 在《方舟:生存进化》手游的广阔世界中,生存挑战无处不在。从最初的徒手求生到建立稳固的基地,每一步都需要精心的规划。进入游戏中期,一只强力的飞行坐骑能极大拓展你的生存边界——狮鹫,正是这样一位能够主宰天空、改变战局的顶级伙伴。然而,想要成功驯

热心网友
04.18
Deeto 通过AI放大真实客户声音,助力企业高效收集和利用客户反馈,实现可持续增长
AI
Deeto 通过AI放大真实客户声音,助力企业高效收集和利用客户反馈,实现可持续增长

Deeto产品介绍 在当今市场,客户的声音往往是最响亮却也最容易被浪费的资产。如何系统性地收集、管理并激活这些宝贵反馈,是摆在许多增长团队面前的一道难题。Deeto作为一款专注于放大客户声音价值的AI平台,提供了一套完整的解决方案,旨在帮助企业将零散的客户反馈转化为可驱动的业务增长引擎。 Deeto

热心网友
04.18
MySQL删除表时触发器如何处理_DROP TABLE触发逻辑说明
数据库
MySQL删除表时触发器如何处理_DROP TABLE触发逻辑说明

MySQL删除表时触发器如何处理_DROP TABLE触发逻辑说明 删除表时触发器自动级联删除,无需手动处理 在MySQL数据库中执行DROP TABLE语句时,数据库引擎会自动执行级联删除操作——不仅目标表被移除,所有关联在该表上的触发器也会被一并清理。这是MySQL内置的强制行为机制,而非可选功

热心网友
04.18
《红色沙漠》森林行者泰尔巴斯打法技巧-核心弱点与攻击策略解析
游戏攻略
《红色沙漠》森林行者泰尔巴斯打法技巧-核心弱点与攻击策略解析

《红色沙漠》森林行者泰尔巴斯全面攻略:高效打法与核心弱点解析 在开放世界冒险游戏《红色沙漠》中,森林行者泰尔巴斯是一位极具压迫感的特殊人型BOSS。其攻击模式大开大合,气势凶猛,但掌握正确策略后,玩家完全可以实现高效击杀。本文将为你详细解析泰尔巴斯的打法技巧与核心机制。 红色沙漠泰尔巴斯打法教学:弱

热心网友
04.18