游乐游手机版
首页/科技数码/文章详情

Anthropic最强模型Claude 3发布,全面超越Opus实现代际跃迁

时间:2026-03-27 16:58
Anthropic一次内部配置失误,意外将其最机密的技术底牌公之于众。据《财富》杂志26日独家报道,一款名为 "Claude Mythos "、内部代号 "Capybara "的全新旗舰模型已完成训练并进入

Anthropic一次内部配置失误,意外将其最机密的技术底牌公之于众。

据《财富》杂志26日独家报道,一款名为"Claude Mythos"、内部代号"Capybara"的全新旗舰模型已完成训练并进入早期测试阶段,Anthropic最新将其性能提升描述为"代际跃迁",在编程、学术推理和网络安全等核心测试中全面超越现有最强版本Claude Opus 4.6。


报道称,由于Anthropic内容管理系统(CMS)的人为配置失误,近3000份未发布的内部文件暴露在公开可检索的数据缓存中,泄露文件揭示,公司计划引入一个名为"Capybara"的全新模型层级,其定位高于现有旗舰Opus系列,运行成本也将更为高昂。

然而,超强性能伴随着前所未有的安全隐忧。泄露的内部草稿显示,Anthropic将新模型定性为网络安全领域的重大风险来源,认为其网络攻击能力"远超目前任何其他AI模型",一旦被黑客利用,将可能催生大规模网络攻击,且破坏力将远超防御者的应对能力——这也是公司迟迟不敢公开发布的核心原因。

超越Opus:全新层级"Capybara"打破现有格局

泄露的博客草稿显示,Claude Mythos代表着Anthropic产品线的一次结构性重组。

目前,Anthropic的模型矩阵分为三个层级:能力最强的Opus、速度与成本均衡的Sonnet,以及最小最快的Haiku。而泄露文件表明,Anthropic正在引入一个全新的"Capybara"层级,其定位在Opus之上——体量更大、智能程度更高,但运行成本也更为昂贵。

在具体性能方面,草稿博客称,"与此前最强版本Claude Opus 4.6相比,Capybara在软件编程、学术推理及网络安全等测试中的得分均大幅提升。"文件将Claude Mythos描述为"迄今为止我们开发过的最强大AI模型,远超以往任何版本"。

Anthropic发言人在回应《财富》询问时证实了上述方向,表示公司"正在开发一款在推理、编程和网络安全方面取得重大进展的通用模型",并强调"鉴于其能力的强大,我们正在审慎地推进发布方式"。

前所未有的网络安全风险:Anthropic自身也感到警惕

伴随强大能力而来的,是泄露文件中措辞罕见强烈的安全警告。

泄露草稿博客直言,新模型"目前在网络攻击能力方面远超任何其他AI模型",并预示着"一波即将到来的模型浪潮,其漏洞利用速度将远远超出防御者的应对能力"。

正是出于这一顾虑,Anthropic在发布策略上将网络安全防御机构列为优先受益方。草稿写道:"我们将率先向相关机构开放早期访问权限,让它们能够在即将到来的AI驱动漏洞利用浪潮中抢占先机,提前加固自身代码库的稳健性。"

这一担忧并非孤例。今年2月,OpenAI发布GPT-5.3-Codex时,将其列为首个在网络安全任务中达到"高能力"评级的模型,也是首个被直接训练用于识别软件漏洞的模型。同期,Anthropic发布的Claude Opus 4.6也展现出识别生产代码库中未知漏洞的能力,公司承认这属于攻守两用的"双刃剑"特性。

配置失误:3000份内部文件意外公开

此次泄露事件的技术根源,在于一个看似低级的操作失误。

LayerX Security资深AI安全研究员Roy Paz与剑桥大学网络安全研究员Alexandre Pauwels发现,Anthropic用于发布最新博客的外部CMS工具存在配置缺陷:该系统默认将上传的数字资产设置为公开状态并赋予可访问的URL,除非用户手动将其设为私密。这一默认设置导致近3000个未发布资产——包括图片、PDF文件及音频文件——暴露在公开可检索的数据缓存中。

Anthropic在声明中将此次事件归因于"人为错误",表示"外部CMS工具的一个问题导致草稿内容被公开访问",并将泄露材料定性为"考虑发布的内容早期草稿"。

X平台炸锅:震撼与质疑并存

消息一经曝光,X平台迅速掀起讨论浪潮,舆论焦点集中在技术震撼与安全信任两个维度。

账号TFTC发文直指事件的讽刺意味:"Anthropic不慎证明了AI安全论。一个CMS配置错误导致3000份未发布文件暴露在公开可搜索的缓存中——其中就包括关于'Claude Mythos'(代号Capybara)的详情,而Anthropic内部文件将其称为'迄今为止最强大的AI'。"这一评论在科技圈广泛传播,不少用户对一家以AI安全为核心价值观的公司,竟因基础配置失误而自露底牌深感错愕。


另有用户fardeen则将视角转向Claude最新的能力,评论道:"Claude现在真的可以像你一样使用电脑——打开应用、点击按钮、填写表单。Anthropic正在逐步将人类从操作流程中移除。"


用户Oliwier Makowski Trusz则认为Capybara的发布改变了格局。根据泄露信息,参数量达到10万亿。Claude 与其他所有模型之间的差距刚刚被大幅拉开。


来源:https://www.163.com/dy/article/KP1NH2QA05198NMR.html
上一篇北京市2026年起无人航空器飞行与销售运输新规解读 下一篇上汽率先实现人形机器人量产线应用,开创汽车智造新范式
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。