高盛怕了，Claude Mythos全球首个攻破企业网络，奥本海默时刻来了

时间：2026-04-22 16:06

AI黑客Claude Mythos觉醒了！英国AI安全研究所证实，它是首个破解企业网络攻击测试的AI，仅用32步，完成20小时人类任务只需几秒。高盛已经紧急拉响红色警报，人类的网络安全，已经进入奥本海默时刻。数条令人不安的消息，正在全球网络安全圈内引发震动。据多方信息显示，华尔街巨头高盛正在疯狂

AI黑客Claude Mythos觉醒了！英国AI安全研究所证实，它是首个破解企业网络攻击测试的AI，仅用32步，完成20小时人类任务只需几秒。高盛已经紧急拉响红色警报，人类的网络安全，已经进入奥本海默时刻。

数条令人不安的消息，正在全球网络安全圈内引发震动。

据多方信息显示，华尔街巨头高盛正在疯狂加强其网络防御体系，而这一切，很大程度上是为了应对一个名为Claude Mythos的AI模型。

高盛的紧张并非空xue来风。就在近日，英国人工智能安全研究所发布了一项重磅研究报告，矛头直指Anthropic公司在4月7日发布的Claude Mythos Preview模型。评估结果显示，其在网络安全领域展现出的能力，足以让任何一位安全专家脊背发凉。

这次测试的战场，是代号为「The Last Ones」的超高难度模拟网络靶场。结果如何？Mythos成功完成了一条需要人类专家耗费20小时才能走完的、包含32个步骤的企业网络攻击模拟链路。整个过程，它做到了全自动、全自主。

AISI在报告中明确指出：Claude Mythos是全球首个完成其网络靶场端到端测试的AI模型。

这份报告的出炉，无疑为业界的担忧提供了实证。Anthropic对Mythos的描述看来并非夸大其词，它的确与众不同，并且有充分的理由让我们重新审视其对网络安全格局可能带来的碘伏性影响。

高盛的恐惧，恰恰印证了全球网络安全基础设施正面临一个关键的“奥本海默时刻”——一个技术能力超越现有防御认知的临界点。

此前，不乏声音质疑关于Mythos的警告是营销噱头。然而，随着一系列测试数据的公开，事实逐渐清晰：Mythos所代表的威胁，或许远比想象中更真实、更迫近。

那个让高盛睡不着觉的AI黑客

英国AISI在业内素以严谨著称。自2024年起，该机构便致力于追踪评估AI的网络安全能力，并为此构建了一套从易到难的完整评估体系。

夺旗赛结果

在CTF夺旗挑战赛中，模型需要识别并利用目标系统的弱点来获取隐藏的“旗帜”。

一个关键的时间节点是：在2025年4月之前，没有任何AI模型能够完成入门级以上的专家级任务。

但如今，Claude Mythos Preview在专家级CTF任务中的成功率，已经达到了惊人的73%。

（图注：自2024年11月以来，模型在技术非专家和学徒级别的夺旗赛任务上的表现。GPT-3.5 Turbo到Claude 4 Opus平均运行10次，最多处理250万个token。GPT-5 到Mythos Preview平均运行5次，最多处理250万个token）

重点在于，这些专家级任务在2025年4月之前，对所有模型而言都是不可逾越的障碍。而Claude Mythos Preview首次登场，便将成功率推至73%的高位。

（图注：自2025年8月以来，模型在实践者和专家级夺旗任务中的表现。所有模型平均运行5次，达到5000万个token）

网络靶场结果：20小时 vs 几秒钟

然而，真正让安全专家们彻夜难眠的，是接下来的「The Last Ones」测试。

专家级CTF比赛通常只测试孤立技能。现实世界的网络攻击则复杂得多，需要将数十个步骤串联起来，跨越多个主机和网络段——这类持续性操作往往需要人类专家花费数小时乃至数周。

为此，AISI构建了TLO测试，模拟了一条包含32个步骤的真实企业网络攻击链路。从初始侦察到完全控制网络，人类专家完成它需要20小时。

而Claude Mythos Preview，是首个从头到尾打通这个测试的AI模型。在10次尝试中，它成功了3次，平均每次完成22个步骤。

（图注：在「The Last Ones」任务中，模型完成的平均步骤数随总token消耗的变化关系。Mythos Preview、Opus 4.6 和 GPT-5.4 在最高100M token预算下平均运行10次；Opus 4.5、GPT-5.1 Codex 和 Sonnet 4.5 在1000万token预算下平均运行15次，在100M token预算下平均运行5次；GPT-5.3-Codex 在1000万token预算下平均运行10次，在100M token预算下平均运行5次；Sonnet 3.7 和 GPT-4o 仅在1000万token预算下平均运行10次。在所测试的token预算范围内，随着token预算的增加，各模型的表现持续提升。灰色的水平线表示攻击链中的关键里程碑）

这意味着，Claude Mythos可以在无人干预的情况下，自主执行一次完整的企业网络渗透：扫描漏洞、寻找弱点、横向移动、提升权限，直至最终掌控整个网络。这是一条完整的黑客攻击链，而Mythos，扮演了那个唯一的“攻击手”角色。

研究者揭示了一个令人颤栗的事实：Mythos已经具备了独立执行高破坏性网络攻击的潜在能力。它不再需要人类黑客在旁指挥，不再被动等待指令，也不再依赖人类的临场判断。它自身就是策略的制定者和执行者。

它不再仅仅是一个工具，而更像是一个具备目标感、策略性和执行力的自主数字实体。这，或许正是高盛不惜代价加固防线的根本原因。

拔网线都来不及，这次噩梦成真了

回顾AI在专家级夺旗赛中的进化阶梯，速度堪称恐怖：

2024年，AI仅能勉强理解初学者代码。
2024年，Opus 4.6能协助编写局部脚本，平均完成16步攻击。
2026年，Mythos已能独立完成32步连环攻击，并自主发现、利用Linux内核与浏览器的0-day漏洞。

网络上曾流传一个老梗：面对无法阻挡的黑客攻击，最终极的防御手段就是物理“拔网线”。但Claude Mythos的出现，可能让这最后一招也宣告失效。

核心原因在于其攻击速度。既然Mythos Preview完成32步攻击链的时间远低于人类的20小时，那么整个入侵过程完全可以在防御团队反应过来之前就宣告结束。当你察觉异常、准备切断连接时，AI可能早已获取最高权限，并完成了数据窃取。

英国AISI的评估报告已明确警告：Mythos已具备对防御薄弱的企业系统进行自主潜入与破坏的能力。

我们离「AI黑客泛滥」还有多远？

或许有人会心存侥幸：Claude Mythos不是还在防御严密的工业控制系统测试中卡壳了吗？这是不是意味着我们还有缓冲时间？

答案是：时间确实还有，但窗口正在急速收窄。

英国AISI的评估中揭示了一个关键细节：即使在1亿token的预算限制下，Mythos Preview的性能曲线仍未到达平台期，仍在持续提升。换言之，给予它更多的计算资源，它的能力天花板还能继续抬高。

（图注：在一部分私有网络安全任务中，累计成功率随token预算和交互轮次预算的变化关系。随着预算的增加，累计成功率的每一次提升，都意味着有更多尝试最终取得成功。横轴采用对数刻度，因此曲线的上升反映的是推理计算量跨数量级增长所带来的性能提升）

与此同时，计算资源的成本正在以指数级速度下降。两年前，最先进的AI连入门级CTF都难以应对；今天，AI已能完成专家级任务；那么两年后呢？

英国国家网络安全中心已经发出明确警告：未来的前沿模型将更加强大，现在对网络防御的投资至关重要。留给人类加固防线的时间窗口，已经不多了。

为什么 Mythos 让全行业脊背发凉？

Claude Mythos 之所以引发如此高度的警觉，在于它似乎解决了AI发动网络攻击的三个核心难题：

第一：从「工具人」到「指挥官」的角色跃迁。
以往的AI需要人类给出具体指令，例如“帮我写个缓冲区溢出脚本”。而现在的Mythos，只需要一个高层级目标，比如“接管这个财务网络”。它会自主进行信息收集、发现漏洞、尝试不同攻击路径。这种多步自主决策能力，正是其通关TLO靶场的关键。

第二：对0-day漏洞的敏锐「嗅觉」。
0-day漏洞是防御方尚未知晓的致命弱点。Mythos展现出了在庞大代码库中定位未公开缺陷的潜力。这使它不再是一个简单的程序，更像是一个永不疲倦、能以每秒数百万行速度审计代码的顶级黑客。

第三：毁灭性的推理扩展效应。
测试中那个令人不安的细节再次被印证：推理计算的规模效应。只要给Mythos更多的计算配额，它的攻击成功率就会呈现指数级增长的趋势。这就像一个怪物，投喂的能量越多，其智力的上限就越是模糊。

现实世界的阴影

或许还有人认为：“这不过是实验室里的测试，现实世界的防御要严密得多。”

但AISI的警告非常明确：尽管Mythos目前在防御等级极高的工业OT环境中存在局限，但对于绝大多数防御薄弱的企业系统，它已经具备了实施毁灭性打击的潜在能力。

更严峻的挑战在于双重用途风险。尽管Anthropic目前仅对AWS、微软等40多个合作伙伴开放Mythos的访问权限，但风险无法完全规避。如果模型泄露了呢？如果地下黑客组织成功训练出了自己的“暗黑版”Mythos呢？

正如安全专家所言：“我们正在进入一个攻击成本近乎为零的新时代。”每个组织都必须扪心自问下面五个问题：

你的系统补丁更新频率如何？
你的访问控制策略是否足够严格？
你是否具备完整的日志记录与监控能力？
你是否定期进行模拟攻击演练？
你的安全团队是否配备了AI辅助防御工具？

必须认清的现实是：你并非在与AI赛跑，而是在与“使用AI的攻击者”赛跑。

在少数顶级实验室的服务器里，AI已经能够自主完成企业网络劫持。在少数科技巨头的安全团队中，AI已经在帮助发现零日漏洞。然而，在大多数普通企业、学校、医院和政府机构里，网络安全观念可能还停留在“安装防火墙就万事大吉”的阶段。

当AI黑客能力真正泛滥的那一天到来，那些今天仍抱有“我们没那么重要，不会被盯上”侥幸心理的组织，很可能成为第一波牺牲品。

参考资料：
https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilities

来源：https://36kr.com/p/3767251453149697

Claude

上一篇号称世界最好喝可乐国内亮相被抢购一空：单瓶29元口感两极分化 下一篇雪藏背后：Anthropic的技术、商业与伦理困境

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。