一周前遭泄露、被Anthropic定义为最高机密模型的Claude Mythos,如今终于揭开了它的神秘面纱。
4月8日凌晨,Anthropic正式对外公布了Claude Mythos预览版的核心信息。根据官方说法,这个原本旨在提升逻辑推理能力的模型,在没有经过任何特定网络安全训练的情况下,仅凭对代码库的深入理解,竟然自主“猎杀”了OpenBSD系统中一个隐藏超过二十年的致命漏洞。
为防止该技术被恶意利用,Anthropic联合了亚马逊、苹果、微软、英伟达等40家行业巨头,紧急启动了名为“Project Glasswing”(玻璃翅膀计划)的防御性合作项目。
01 硅基安全专家
传统工具只能按图索骥,依赖已知的漏洞特征进行匹配。而Mythos则截然不同,它具备顶级人类黑客那样的逻辑推演能力。
在对以安全性著称的OpenBSD操作系统进行分析时,Mythos捕捉到了一个潜伏了27年之久的漏洞。这意味着,任何攻击者只需通过远程连接,就能让这个号称“最安全”的系统瞬间崩溃。
在视频流媒体领域广泛应用的FFmpeg编解码库中,Mythos还发现了一行存在长达16年的逻辑漏洞代码。有趣的是,专业的自动化安全测试工具此前曾对该行代码进行过超过500万次的暴力扫描,但均因无法理解其深层逻辑而铩羽而归。
到了Linux内核测试环节,Mythos的表现更令人印象深刻。它不再是简单地发现一个孤立点,而是自主寻找并串联起多个微小的低危漏洞,最终构建出一条从普通用户权限到获取机器完全控制权的完整攻击链路。
02 性能飙升,Token降低
如果说Claude Opus 4.6是当前市场上最强大的生产力工具之一,那么Mythos预览版给人的感觉更像一个“六边形战士”。
在Anthropic公布的评估数据中,Mythos几乎在所有核心维度上都对前代产品实现了全方位超越。
在衡量模型复现漏洞利用方法的CyberGym基准测试中,Mythos得分83.1%,而上一代旗舰Opus 4.6仅为66.6%。这16.5个百分点的差距,代表着从“辅助分析”到“自主攻防”的本质性飞跃。

在模拟真实世界软件修复任务的SWE-bench Pro测试中,Mythos得分77.8%,领先Opus 4.6约24个百分点。
在经由人工验证的严苛代码测试SWE-bench Verified中,Mythos拿到了93.9%近乎满分的成绩。这意味着它生成的修复代码不仅正确,且符合高质量工程标准。即便面对非英语环境或复杂的视觉代码图表,Mythos的表现依然稳健,多语言得分87.3%,而Opus 4.6为77.8%。
在多模态SWE-bench内部测试中,两者差距更为悬殊:Mythos得分59.0%,Opus 4.6仅为27.1%。

在Terminal-Bench 2.0(评估AI智能体在真实命令行环境下端到端执行能力)测试中,Mythos需要在命令行环境里完成一系列复杂操作,得分为82.0%,Opus 4.6为65.4%。Anthropic在报告中提到,如果将超时限制延长至4小时并使用2.1版本测试,Mythos得分能提升至92.1%。
在BrowseComp(评估大语言模型在实时互联网浏览场景下的信息检索和推理能力)复杂搜索测试中,Mythos得分86.9%,Opus 4.6为83.7%。
特别值得关注的是,Mythos在推理能力大幅提升的同时,资源消耗反而呈反向变动:其token消耗量比Opus 4.6低了4.9倍。这对那些因token大量消耗而产生高昂成本的用户来说,无疑是一个好消息。
在OSWorld-Verified(智能体计算机使用基准测试)测试中,Mythos得分79.6%,Opus 4.6为72.7%。

在GPQA Diamond(测试大型语言模型在科学领域的推理和知识水平)测试中,Mythos得分94.6%,Opus 4.6为91.3%。在难度更高的Humanity’s Last Exam(评估大模型的复杂推理能力和专业知识水平)数据集中,Mythos在无工具状态下得分56.8%,Opus 4.6为40.0%;使用工具后,Mythos提升至64.7%,Opus 4.6为53.1%。
03 玻璃翅膀计划
这一次,Anthropic并没有像外界猜测的那样,连夜炸场发布新模型。
根据Anthropic公布的信息,公司启动了一个名为“Project Glasswing”(玻璃翅膀)的项目,旨在建立一个先发制人的防御联盟。

据了解,Anthropic拿出了价值1亿美元的Mythos预览版使用额度,无偿或低价提供给Glasswing计划的合作伙伴。理由很简单:既然攻击能力在一年内必然会扩散,那么防御者必须抢在这12个月内,用最好的工具把门窗加固。

不过,从最新公布的合作伙伴名单来看,似乎这些企业并不缺这1亿美元的Token包。
有趣的是,Anthropic还向Linux基金会、Apache软件基金会等组织捐赠了400万美元。这算是对全球基础设施大多运行在开源软件之上这一现状的致敬。
值得留意的是,Mythos不会作为通用聊天机器人上线,而是作为专用安全API,通过亚马逊AWS Bedrock、谷歌云Vertex AI等专业平台分发,确保每一笔调用都可追溯、受监管。
正如CrowdStrike首席技术官伊利亚·扎伊采夫(Elia Zaitsev)所说:“AI已将漏洞被发现到被利用的窗口期从数月缩短至几分钟。这不是我们放慢脚步的理由,而是我们必须跑得更快的信号。”
再回到玻璃翅膀项目上,它的合作名单几乎涵盖了现代数字世界的每一个角落。

在硬件层面,英伟达、博通等公司的参与意味着安全风险正向底层硬件渗透。思科高级副总裁安东尼·格里科(Anthony Grieco)指出,过去加固系统的方法已经失效,Mythos正在以前所未有的速度扫描硬件漏洞,这种深刻的转变没有回头路可走。

在系统层面,微软和谷歌的投入表明,网络安全将不再受限于“人力瓶颈”。微软网络安全与微软研究院执行副总裁伊戈尔·齐甘斯基(Igor Tsyganskiy)表示,通过Mythos,微软可以在其庞大的代码库被恶意利用前,预先识别并降低风险。
在金融领域,摩根大通的加入意味着,即便在极其严苛的合规环境下,顶级金融机构也开始承认:协作式的AI防御是未来的必选项。摩根大通首席信息安全官帕特·奥佩特(Pat Opet)强调,他们会采取严格、独立的方法来决定如何推进,但Anthropic的倡议反映了这个时刻所要求的那种前瞻性、协作性的方法。
说到底,玻璃翅膀计划本质上是在进行一场全球范围内的“系统补丁总动员”。而Anthropic试图建立一个漏洞披露的新范式:在模型公开讨论任何技术细节之前,先给开发者90天的时间进行秘密修复。
04 第一个“火山口”

在社交媒体上,Anthropic首席执行官达里奥·阿莫代伊(Dario Amodei)的发言显得忧虑多过兴奋。在他看来,Mythos所展示的漏洞挖掘能力,只是前沿AI带来的第一个清晰而紧迫的风险。
随着模型推理能力的进一步提升,AI可能会在生物安全、化学防御乃至关键基础设施的博弈中展现出类似的“非预期能力”。玻璃翅膀计划的意义,不仅在于修复了几个Linux内核漏洞,更在于它为人类社会如何应对AI的“越界”提供了一个可参考的蓝图:透明、协作、先发制人。
Anthropic前沿红队负责人洛根·格雷厄姆(Logan Graham)说:“如果玻璃翅膀计划仅仅是少数几家公司在闭门造车,那它注定会失败。它必须发展成更大规模的东西。”
总结来说,Claude Mythos的发布标志着一个时代的终结——那个靠人力和时间堆砌安全长城的时代已然过去。在AI自主扫描每一个代码比特的未来,唯有以AI治AI,人类方能在这片数字化森林中获得安宁。
