首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
高盛怕了,Claude Mythos全球首个攻破企业网络,奥本海默时刻来了

高盛怕了,Claude Mythos全球首个攻破企业网络,奥本海默时刻来了

热心网友
11
转载
2026-04-22

AI黑客Claude Mythos觉醒了!英国AI安全研究所证实,它是首个破解企业网络攻击测试的AI,仅用32步,完成20小时人类任务只需几秒。高盛已经紧急拉响红色警报,人类的网络安全,已经进入奥本海默时刻。

数条令人不安的消息,正在全球网络安全圈内引发震动。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

据多方信息显示,华尔街巨头高盛正在疯狂加强其网络防御体系,而这一切,很大程度上是为了应对一个名为Claude Mythos的AI模型。

高盛的紧张并非空xue来风。就在近日,英国人工智能安全研究所发布了一项重磅研究报告,矛头直指Anthropic公司在4月7日发布的Claude Mythos Preview模型。评估结果显示,其在网络安全领域展现出的能力,足以让任何一位安全专家脊背发凉。

这次测试的战场,是代号为「The Last Ones」的超高难度模拟网络靶场。结果如何?Mythos成功完成了一条需要人类专家耗费20小时才能走完的、包含32个步骤的企业网络攻击模拟链路。整个过程,它做到了全自动、全自主。

AISI在报告中明确指出:Claude Mythos是全球首个完成其网络靶场端到端测试的AI模型。

这份报告的出炉,无疑为业界的担忧提供了实证。Anthropic对Mythos的描述看来并非夸大其词,它的确与众不同,并且有充分的理由让我们重新审视其对网络安全格局可能带来的碘伏性影响。

高盛的恐惧,恰恰印证了全球网络安全基础设施正面临一个关键的“奥本海默时刻”——一个技术能力超越现有防御认知的临界点。

此前,不乏声音质疑关于Mythos的警告是营销噱头。然而,随着一系列测试数据的公开,事实逐渐清晰:Mythos所代表的威胁,或许远比想象中更真实、更迫近。

那个让高盛睡不着觉的AI黑客

英国AISI在业内素以严谨著称。自2024年起,该机构便致力于追踪评估AI的网络安全能力,并为此构建了一套从易到难的完整评估体系。

夺旗赛结果

在CTF夺旗挑战赛中,模型需要识别并利用目标系统的弱点来获取隐藏的“旗帜”。

一个关键的时间节点是:在2025年4月之前,没有任何AI模型能够完成入门级以上的专家级任务。

但如今,Claude Mythos Preview在专家级CTF任务中的成功率,已经达到了惊人的73%。

(图注:自2024年11月以来,模型在技术非专家和学徒级别的夺旗赛任务上的表现。GPT-3.5 Turbo到Claude 4 Opus平均运行10次,最多处理250万个token。GPT-5 到Mythos Preview平均运行5次,最多处理250万个token)

重点在于,这些专家级任务在2025年4月之前,对所有模型而言都是不可逾越的障碍。而Claude Mythos Preview首次登场,便将成功率推至73%的高位。

(图注:自2025年8月以来,模型在实践者和专家级夺旗任务中的表现。所有模型平均运行5次,达到5000万个token)

网络靶场结果:20小时 vs 几秒钟

然而,真正让安全专家们彻夜难眠的,是接下来的「The Last Ones」测试。

专家级CTF比赛通常只测试孤立技能。现实世界的网络攻击则复杂得多,需要将数十个步骤串联起来,跨越多个主机和网络段——这类持续性操作往往需要人类专家花费数小时乃至数周。

为此,AISI构建了TLO测试,模拟了一条包含32个步骤的真实企业网络攻击链路。从初始侦察到完全控制网络,人类专家完成它需要20小时。

而Claude Mythos Preview,是首个从头到尾打通这个测试的AI模型。在10次尝试中,它成功了3次,平均每次完成22个步骤。

(图注:在「The Last Ones」任务中,模型完成的平均步骤数随总token消耗的变化关系。Mythos Preview、Opus 4.6 和 GPT-5.4 在最高100M token预算下平均运行10次;Opus 4.5、GPT-5.1 Codex 和 Sonnet 4.5 在1000万token预算下平均运行15次,在100M token预算下平均运行5次;GPT-5.3-Codex 在1000万token预算下平均运行10次,在100M token预算下平均运行5次;Sonnet 3.7 和 GPT-4o 仅在1000万token预算下平均运行10次。在所测试的token预算范围内,随着token预算的增加,各模型的表现持续提升。灰色的水平线表示攻击链中的关键里程碑)

这意味着,Claude Mythos可以在无人干预的情况下,自主执行一次完整的企业网络渗透:扫描漏洞、寻找弱点、横向移动、提升权限,直至最终掌控整个网络。这是一条完整的黑客攻击链,而Mythos,扮演了那个唯一的“攻击手”角色。

研究者揭示了一个令人颤栗的事实:Mythos已经具备了独立执行高破坏性网络攻击的潜在能力。它不再需要人类黑客在旁指挥,不再被动等待指令,也不再依赖人类的临场判断。它自身就是策略的制定者和执行者。

它不再仅仅是一个工具,而更像是一个具备目标感、策略性和执行力的自主数字实体。这,或许正是高盛不惜代价加固防线的根本原因。

拔网线都来不及,这次噩梦成真了

回顾AI在专家级夺旗赛中的进化阶梯,速度堪称恐怖:

  • 2024年,AI仅能勉强理解初学者代码。
  • 2024年,Opus 4.6能协助编写局部脚本,平均完成16步攻击。
  • 2026年,Mythos已能独立完成32步连环攻击,并自主发现、利用Linux内核与浏览器的0-day漏洞。

网络上曾流传一个老梗:面对无法阻挡的黑客攻击,最终极的防御手段就是物理“拔网线”。但Claude Mythos的出现,可能让这最后一招也宣告失效。

核心原因在于其攻击速度。既然Mythos Preview完成32步攻击链的时间远低于人类的20小时,那么整个入侵过程完全可以在防御团队反应过来之前就宣告结束。当你察觉异常、准备切断连接时,AI可能早已获取最高权限,并完成了数据窃取。

英国AISI的评估报告已明确警告:Mythos已具备对防御薄弱的企业系统进行自主潜入与破坏的能力。

我们离「AI黑客泛滥」还有多远?

或许有人会心存侥幸:Claude Mythos不是还在防御严密的工业控制系统测试中卡壳了吗?这是不是意味着我们还有缓冲时间?

答案是:时间确实还有,但窗口正在急速收窄。

英国AISI的评估中揭示了一个关键细节:即使在1亿token的预算限制下,Mythos Preview的性能曲线仍未到达平台期,仍在持续提升。换言之,给予它更多的计算资源,它的能力天花板还能继续抬高。

(图注:在一部分私有网络安全任务中,累计成功率随token预算和交互轮次预算的变化关系。随着预算的增加,累计成功率的每一次提升,都意味着有更多尝试最终取得成功。横轴采用对数刻度,因此曲线的上升反映的是推理计算量跨数量级增长所带来的性能提升)

与此同时,计算资源的成本正在以指数级速度下降。两年前,最先进的AI连入门级CTF都难以应对;今天,AI已能完成专家级任务;那么两年后呢?

英国国家网络安全中心已经发出明确警告:未来的前沿模型将更加强大,现在对网络防御的投资至关重要。留给人类加固防线的时间窗口,已经不多了。

为什么 Mythos 让全行业脊背发凉?

Claude Mythos 之所以引发如此高度的警觉,在于它似乎解决了AI发动网络攻击的三个核心难题:

第一:从「工具人」到「指挥官」的角色跃迁。
以往的AI需要人类给出具体指令,例如“帮我写个缓冲区溢出脚本”。而现在的Mythos,只需要一个高层级目标,比如“接管这个财务网络”。它会自主进行信息收集、发现漏洞、尝试不同攻击路径。这种多步自主决策能力,正是其通关TLO靶场的关键。

第二:对0-day漏洞的敏锐「嗅觉」。
0-day漏洞是防御方尚未知晓的致命弱点。Mythos展现出了在庞大代码库中定位未公开缺陷的潜力。这使它不再是一个简单的程序,更像是一个永不疲倦、能以每秒数百万行速度审计代码的顶级黑客。

第三:毁灭性的推理扩展效应。
测试中那个令人不安的细节再次被印证:推理计算的规模效应。只要给Mythos更多的计算配额,它的攻击成功率就会呈现指数级增长的趋势。这就像一个怪物,投喂的能量越多,其智力的上限就越是模糊。

现实世界的阴影

或许还有人认为:“这不过是实验室里的测试,现实世界的防御要严密得多。”

但AISI的警告非常明确:尽管Mythos目前在防御等级极高的工业OT环境中存在局限,但对于绝大多数防御薄弱的企业系统,它已经具备了实施毁灭性打击的潜在能力。

更严峻的挑战在于双重用途风险。尽管Anthropic目前仅对AWS、微软等40多个合作伙伴开放Mythos的访问权限,但风险无法完全规避。如果模型泄露了呢?如果地下黑客组织成功训练出了自己的“暗黑版”Mythos呢?

正如安全专家所言:“我们正在进入一个攻击成本近乎为零的新时代。”每个组织都必须扪心自问下面五个问题:

  1. 你的系统补丁更新频率如何?
  2. 你的访问控制策略是否足够严格?
  3. 你是否具备完整的日志记录与监控能力?
  4. 你是否定期进行模拟攻击演练?
  5. 你的安全团队是否配备了AI辅助防御工具?

必须认清的现实是:你并非在与AI赛跑,而是在与“使用AI的攻击者”赛跑。

在少数顶级实验室的服务器里,AI已经能够自主完成企业网络劫持。在少数科技巨头的安全团队中,AI已经在帮助发现零日漏洞。然而,在大多数普通企业、学校、医院和政府机构里,网络安全观念可能还停留在“安装防火墙就万事大吉”的阶段。

当AI黑客能力真正泛滥的那一天到来,那些今天仍抱有“我们没那么重要,不会被盯上”侥幸心理的组织,很可能成为第一波牺牲品。

参考资料:
https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

来源:https://36kr.com/p/3767251453149697
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

高盛怕了,Claude Mythos全球首个攻破企业网络,奥本海默时刻来了
业界动态
高盛怕了,Claude Mythos全球首个攻破企业网络,奥本海默时刻来了

AI黑客Claude Mythos觉醒了!英国AI安全研究所证实,它是首个破解企业网络攻击测试的AI,仅用32步,完成20小时人类任务只需几秒。高盛已经紧急拉响红色警报,人类的网络安全,已经进入奥本海默时刻。 数条令人不安的消息,正在全球网络安全圈内引发震动。 据多方信息显示,华尔街巨头高盛正在疯狂

热心网友
04.22
Claude 对 C++/Rust 等底层语言的支持情况
AI
Claude 对 C++/Rust 等底层语言的支持情况

Claude在C++ Rust代码生成中存在内存模型、所有权系统及构建生态理解局限 如果你发现Claude生成的C++或Rust代码,在编译时频频报错,或者运行时行为与预期不符,别急着怀疑自己——这很可能不是你的问题。当前阶段,模型对底层语言的内存模型、所有权系统以及构建生态的理解,确实存在一些边界

热心网友
04.22
Claude 会读取我的隐私数据进行模型训练吗?
AI
Claude 会读取我的隐私数据进行模型训练吗?

一、检查并关闭默认启用的数据共享选项 先明确一个关键事实:在默认状态下,你与Claude的新对话,很可能被用于模型的迭代训练。这并非猜测,而是Anthropic当前数据策略的一部分。好消息是,你可以主动关闭这个开关,只是入口藏得有点深,初次使用很容易忽略。 具体操作路径并不复杂,跟着下面几步走,就能

热心网友
04.22
Claude4和Llama4开源性对比_Claude闭源vsLlama完全开源优劣
AI
Claude4和Llama4开源性对比_Claude闭源vsLlama完全开源优劣

一、许可证与源码可得性 选择哪条技术路线,往往从第一步获取模型时就已注定。Claude 4由Anthropic一手打造,但其核心资产——模型权重、训练代码、乃至具体的架构细节——都被严密地封装在“黑盒”里。开发者能接触到的,仅仅是一个API调用接口,一切操作都受制于其商业许可条款。换句话说,你只能“

热心网友
04.22
如何在 Claude 中创建针对特定项目的自定义指令?
AI
如何在 Claude 中创建针对特定项目的自定义指令?

如何在 Claude 中创建针对特定项目的自定义指令? 想让 Claude 在处理特定项目时,自动遵循一套专属的规则、格式或流程吗?这完全可以通过创建项目级的自定义指令来实现。下面这套方法,能帮你把通用流程固化下来,确保团队协作时风格统一、效率倍增。 一、在项目根目录创建 commands 文件夹

热心网友
04.22

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

腾讯:QQ 将全面接入微信小程序,建议开发者尽快迁移降低维护成本
手机教程
腾讯:QQ 将全面接入微信小程序,建议开发者尽快迁移降低维护成本

腾讯生态整合新动向:QQ全面接入微信小程序 7月1日,腾讯QQ小程序开发者平台发布了一项重要更新。核心内容是,为了帮助开发者降低双端开发与维护成本,QQ将全面接入微信小程序体系。这意味着,未来用户可以直接在QQ内搜索并打开微信小程序。 对于现有的存量QQ小程序,此次调整并未“一刀切”。它们目前仍可正

热心网友
04.22
天玑9600/9600 Pro双芯齐发:5GHz主频史无前例 硬刚高通骁龙8E6
手机教程
天玑9600/9600 Pro双芯齐发:5GHz主频史无前例 硬刚高通骁龙8E6

下半年芯片市场巅峰对决提前揭幕 今年下半年,全球芯片市场的战火将空前炽热。两位重量级选手——联发科与高通,已经准备好亮出各自的王牌。天玑9600系列与骁龙8E6系列,这两大迭代旗舰平台的正面交锋,注定会成为今年科技行业最值得关注的戏码。 双芯策略:精准卡位旗舰市场 有意思的是,联发科这次玩了个新花样

热心网友
04.22
微信好友申请为何能通过搜索qq号添加
手机教程
微信好友申请为何能通过搜索qq号添加

在当今数字化社交的时代,微信已成为人们日常沟通交流的重要工具。不少人都发现,微信好友申请居然可以通过搜索 qq 号来添加,这背后有着诸多有趣的原因和便利之处。 一、社交关系的延续与拓展 要知道,微信与QQ同属腾讯旗下,两者之间存在着千丝万缕的联系。很多用户的社交关系其实根植于QQ时代,那些好友列表里

热心网友
04.22
高德地图如何更改定位
手机教程
高德地图如何更改定位

高德地图如何更改定位?三种方法详解及注意事项 无论是日常通勤、外出旅行还是朋友相聚,高德地图已经成了我们依赖的“导航神器”,精准定位和路线规划是其核心功能。不过,现实场景有时会有点特殊——比如,你可能需要模拟一个位置来测试应用,或者在某个游戏中“签到”,又或者只是想和朋友开个无伤大雅的玩笑。这个时候

热心网友
04.22
巧学宝app如何绑定手机号
手机教程
巧学宝app如何绑定手机号

巧学宝App绑定手机号全程指南 在巧学宝App上完成手机号绑定,是解锁其完整功能的关键一步。这个看似简单的操作,能为你后续的学习之旅带来不少实实在在的便利。那么,该如何快速搞定呢?下面这张流程图,能帮你一眼看清完整的操作路径。 第一步:进入个人中心 首先,打开你的巧学宝App。进入主界面后,注意力可

热心网友
04.22