首页 游戏 软件 资讯 排行榜 专题
首页
AI
Claude Mythos一月内发现271个历史漏洞 部分潜伏长达20年

Claude Mythos一月内发现271个历史漏洞 部分潜伏长达20年

热心网友
24
转载
2026-05-20

最近,软件安全领域发生了一件堪称“地震级”的事件。Mozilla发布的一篇深度复盘博文,在技术圈引发了巨大震动。

核心数据令人瞠目结舌:Firefox团队借助Claude Mythos Preview,在短短一个月内修复了423个安全漏洞。这个数字是什么概念?它超过了团队此前15个月的漏洞修复总量。单月产出飙升了14倍,连一些潜藏了20年的“骨灰级”Bug都被连根拔起。

做个对比会更直观:2025年,Firefox平均每月修复的安全漏洞约为21.5个。即便在同期4月,依靠传统方法也只解决了31个。这种效率的跃升,已经不能用“提升”来形容,而是一次彻底的“降维打击”。难怪消息一出,评论区里满是行业大佬们的惊叹。

从“幻觉噩梦”到“顶级猎手”的蜕变

Mozilla工程师在博文中写下一句耐人寻味的话:“突然之间,这些bug变得非常好。”这句话背后,是AI在安全领域角色的一次根本性转变。

就在几个月前,AI生成的安全漏洞报告还是开源维护者的“噩梦”。那些报告看起来头头是道,但深究下去往往是“幻觉”(Slop),维护者需要耗费大量精力去验证一个最终被证明不存在的“发现”。

那么,是什么让局面在短时间内天翻地覆?关键原因有两个:第一,模型本身的能力出现了质的飞跃;第二,也是更重要的,工程师们驾驭模型的工程方法取得了突破性进展。

简单说,模型在飞速变强,而人类工程师也在飞速学会如何高效地使用它。当这两条增长曲线相乘,就产生了Firefox单月423个漏洞修复这种夸张的结果。

271个漏洞的深度剖析:高危占比惊人

这场效率革命始于今年2月。当时,Firefox团队开始与Anthropic合作,最初使用Claude Opus 4.6,在Firefox 148版本中修复了22个安全漏洞,算是一次小试牛刀。

真正的爆发出现在Firefox 150版本发布时。恰逢Claude Mythos Preview上线,谁也没料到,它首次大规模应用就一口气挖出了271个安全漏洞。更值得关注的是这些漏洞的严重性分布:

  • 180个被评为“高危”(sec-high)
  • 80个被评为“中危”(sec-moderate)
  • 11个被评为“低危”(sec-low)

“高危”级别的漏洞意味着什么?它代表用户在日常浏览网页时就可能触发,是攻击者最梦寐以求的目标。在过去十几年里,这类漏洞往往需要通过高额悬赏,吸引外部白帽子黑客花费巨大精力才能发现,一个漏洞的赏金可达数千甚至上万美元。

如今,Mythos直接批量发现了271个。这还没完,在后续的149.0.2、150.0.1和150.0.2等版本中,它又协助修复了更多。总计4月的423个漏洞中,271个由Mythos直接发现,41个来自外部安全研究员,剩余的111个则由内部团队通过其他AI模型或模糊测试等方式找到。

Mozilla甚至公开了其中12个漏洞的详细报告,以展示其发现深度。其中一个HTML元素的漏洞在代码中隐藏了15年,另一个与XSLT相关的Bug更是存在了整整20年。这些“陈年旧账”的清理,极大地提升了浏览器的安全基线。

攻克“皇冠上的明珠”:沙箱逃逸漏洞

最让安全圈感到震撼的,是Mythos成功找到了多个“沙箱逃逸”(sandbox escape)漏洞。这是浏览器安全中最棘手、价值最高的一类漏洞。

现代浏览器会将每个网页标签放在一个独立的“沙箱”中运行,以此实现隔离。即使某个网页被恶意代码攻陷,攻击者也应该无法逃出这个沙箱去危害系统或其他标签页。而“沙箱逃逸”,就是找到方法打破这个隔离,实现“越狱”。

这类漏洞的挖掘难度极高,甚至连传统的模糊测试(Fuzzing)都很难有效覆盖。正因如此,Mozilla的“漏洞赏金计划”为沙箱逃逸漏洞开出了最高2万美元的赏金,这是其赏金体系的天花板。

Firefox安全工程师Brian Grinstead在博文中坦言:“Mythos找到的沙箱逃逸漏洞数量,已经超过了人类安全研究员的总和。”这足以说明AI在此类顶级漏洞挖掘上的压倒性优势。

Mythos的挖掘方式也极具“硬核”色彩:它会自主编写一段恶意补丁,尝试注入沙箱进程,然后用这段代码去攻击浏览器最核心、最安全的部分。整个过程不仅需要强大的代码理解能力,更需要对浏览器多进程架构的深度把握和创造性的攻击思维。

工程化杠杆:Agentic Harness系统

当然,模型强大只是成功的一半。如果无法将模型能力规模化、工程化地应用,一切仍是空谈。Firefox团队早期用GPT-4或Claude Sonnet 3.5做静态代码分析时,就饱受误报率过高之苦,根本无法投入实际生产。

转折点在于一套名为“Agentic Harness”的系统。这套系统的核心工作流逻辑清晰:

  1. 发现漏洞:给模型一段代码,让它寻找潜在的Bug。
  2. 动态验证:模型需要编写具体的测试用例,去动态验证它的假设。只有能成功复现的漏洞才会被采纳,无法复现的则自动排除,这极大降低了误报。
  3. 去重和分诊:自动与已知漏洞数据库比对,避免重复劳动。
  4. 跟踪和修复:确认后的漏洞进入正式的安全Bug生命周期管理流程。

起初,团队需要在终端手动操作,不断调整提示词(Prompt)。跑通流程后,他们开始实现并行化,在多台临时虚拟机上同时运行扫描任务,每台机器负责一个特定的文件或函数。效率由此呈指数级提升。

这套工程化框架带来了另一个巨大优势:模型的可替换性。一旦Pipeline搭建完成,更换底层模型几乎只需修改一行代码。从Opus 4.6切换到更强大的Mythos Preview,过程堪称无缝衔接。而且,每次模型升级,整条流水线的发现能力、验证精度和报告质量都会同步获得提升。正如一些安全专家所言:“真正的杠杆可能不只在模型本身,而在于驾驭模型的工程能力。”

人机协同:百人工程师团队的“消化战”

必须明确的是,AI发现漏洞只是第一步,远非终点。Brian Grinstead在博文中说得很直白:每一个被确认的Bug,都需要一名工程师编写补丁,再由另一名工程师进行严格的代码审查。AI生成的补丁只能作为参考,绝不能未经审核直接部署。

为了消化这波史无前例的漏洞洪流,Firefox动员了超过100名工程师参与其中。这支队伍涵盖了写补丁的、做代码审查的、搭建和维护管道的、进行分类的、测试修复效果的、管理发布流程的各个环节。这是一场全员上阵的“消化战”,也由此诞生了Firefox历史上最大规模的安全修复行动,以及迄今为止最安全的一个浏览器版本。

路线分野:Anthropic与OpenAI的正面对决

Firefox的423个漏洞,或许只是AI重塑网络安全格局的一个序幕。在这场关乎未来的竞赛中,两大巨头Anthropic和OpenAI已经展现出截然不同的战略路线。

先看Anthropic。今年4月初,在发布Claude Mythos Preview的同时,他们还祭出了一个名为“Project Glasswing”(玻璃翼计划)的战略项目。

Anthropic的策略带有强烈的“封闭”和“控制”色彩。他们发布了有史以来最强大的模型,却亲手将其“关”了起来。他们声称,Mythos已经在每一个主流操作系统和浏览器中发现了数千个高危漏洞,甚至包括一个潜伏了27年的OpenBSD漏洞。这种策略的核心在于严格控制顶级AI安全能力的扩散,可能优先服务于特定合作伙伴或内部研究。

再看OpenAI,其路线恰恰相反,核心是“开放”与“赋能”。在Anthropic发布Mythos仅一周后,OpenAI便火速跟进,发布了GPT-5.4-Cyber,并同步将其“网络防御者访问计划”(TAC)扩展到数千名个人防御者和数百个安全团队。就在近期,更强的GPT-5.5-Cyber已向TAC最高层级的用户开放,可用于漏洞猎杀、恶意软件分析和攻击逆向工程。

根据官方介绍,GPT-5.5-Cyber在网络安全相关任务中取得了81.9%的优异成绩。OpenAI的逻辑很清晰:通过严格的身份验证和分级授权,让尽可能多的防御者能够获得尽可能强大的AI工具,以此构建更广泛的网络安全防线。

一个试图建起高墙,守护最锋利的矛;另一个则致力于将利器分发给更多的盾牌。然而,技术扩散的规律往往难以阻挡。AI安全能力的扩散速度,最终可能会超过任何一家公司“建墙”的速度。这场对决才刚刚开始,但其结果将深刻影响未来网络安全的生态格局。

来源:https://www.163.com/dy/article/KTBK04CD0511ABV6.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Claude代码能力更新引争议思考深度下降难处理复杂工程
AI
Claude代码能力更新引争议思考深度下降难处理复杂工程

近期,AI编程工具Claude Code的性能表现引发了开发者社区的广泛关注与深度讨论。一份在官方仓库引发热议的Issue直指核心问题:这款曾被寄予厚望的AI编程助手,在经历特定更新后,其处理复杂工程任务的能力似乎出现了显著退化。 核心指控聚焦于一次关键更新:据称,该更新导致模型的内部推理深度骤降约

热心网友
05.20
Claude for Word测试版上线专为律师打造高效办公助手
AI
Claude for Word测试版上线专为律师打造高效办公助手

当地时间4月11日,人工智能公司Anthropic正式发布Claude for Word测试版。此举不仅是对微软办公软件生态的一次有力挑战,更精准聚焦于法律行业用户,致力于打造一款专为律师设计的“高效智能助理”。 事实上,这一战略布局早有端倪。今年初,Anthropic已将Claude的强大功能成功

热心网友
05.20
Claude AI 创始人账号被封 Anthropic与OpenAI竞争加剧
AI
Claude AI 创始人账号被封 Anthropic与OpenAI竞争加剧

4月11日,AI行业发生了一起引人关注的争议事件。知名开源工具“龙虾”OpenClaw的创始人Peter Steinberger在社交媒体平台X上发文,称其Claude账户因被系统标记为“可疑活动”而遭到Anthropic临时封禁。这一事件迅速在开发者社区内引发广泛讨论,数小时后,他的账户访问权限才

热心网友
05.20
Claude周末复刻30年前经典游戏完整教程
AI
Claude周末复刻30年前经典游戏完整教程

近日,Reddit上一则热帖引发了广泛关注。游戏开发商Beamable的首席执行官Jon Radoff,利用一个周末的时间,借助AI助手Claude,成功复活了自己19岁时开发的一款名为《未来往昔传奇》(Legends of Future Past)的MUD(多用户地下城)游戏。这款诞生于1992年

热心网友
05.20
马斯克透露Claude Opus参数达5T Sonnet模型为1T
AI
马斯克透露Claude Opus参数达5T Sonnet模型为1T

马斯克最近的一次“无心之言”,似乎意外揭开了Claude模型参数规模的神秘面纱。 事情源于他在社交媒体上透露,xAI的Colossus 2超算正在训练一系列模型,其中最大的一款参数达到了惊人的10万亿(10T)。这份清单还包括6T、1 5T和1T等不同规模的变体。Colossus 2作为其“巨硬计划

热心网友
05.19

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

异人之下手游陆瑾连招技巧 安卓版技能玩法教学
游戏攻略
异人之下手游陆瑾连招技巧 安卓版技能玩法教学

陆瑾是《异人之下》手游中操作门槛较高的角色,主打中近距离压制。其核心在于普攻攒炁,并衔接常技【太冲震恚】与【曲泉交忿】进行输出。关键技能【五雷符】可攻可守,成功防御反击可重置冷却。连招依赖“反手”逻辑与精准预判,形成攻防循环。投技【双龙探爪】与【戾走急脉】则需把握时机,分别用于破防与针。

热心网友
05.20
欧易投资策略指南:新手如何制定稳健的Web3投资计划
web3.0
欧易投资策略指南:新手如何制定稳健的Web3投资计划

投资策略需要明确目标与风险偏好,合理分配资金。通过研究项目基本面、关注市场周期与情绪,建立多元化组合。执行中需设定清晰的买卖规则,利用工具辅助决策,并保持长期视角与纪律性,避免情绪化操作。定期复盘与调整是策略持续有效的关键。

热心网友
05.20
异人之下手游巴伦技能强度解析与安卓实战教程
游戏攻略
异人之下手游巴伦技能强度解析与安卓实战教程

巴伦是《异人之下》手游中的近战压制型角色,核心玩法在于追击与倒地连招。其技能“破势突击”衔接流畅,“极速连斩”可追击倒地目标,“飞身十字固”抓取伤害高,“逆势突围”用于防守反击。角色操作上限高,需练习掌握连招循环,但对战远程角色时较为吃力。

热心网友
05.20
谷歌Gemini 3.5 Pro模型正式发布 性能大幅提升下月上线
AI
谷歌Gemini 3.5 Pro模型正式发布 性能大幅提升下月上线

谷歌宣布Gemini3 5Pro模型下月发布,已在内部广泛使用且进步显著。具体技术细节、性能参数及开放计划尚未公布,更多信息将于下月揭晓。

热心网友
05.20
谷歌AI Ultra订阅计划上线 每月100美元起享高级功能
AI
谷歌AI Ultra订阅计划上线 每月100美元起享高级功能

谷歌在2026年I O大会上推出月费100美元的新AI订阅计划,旨在填补其现有20美元与250美元两档服务之间的市场空白。该计划面向需要更多资源的高级用户和小型团队,提供比基础版更强的性能,同时避免企业级的高昂成本,以竞争中高端市场。

热心网友
05.20