Anthropic Mythos模型协助合作伙伴发现超万安全漏洞

时间：2026-05-24 13:45

Anthropic公司利用其未公开的ClaudeMythosPreview模型开展网络安全项目，仅一个月就协助合作伙伴发现超万个安全漏洞，其中多数属严重或高危级别。因当前防护机制尚不足以防止恶意滥用，公司决定待安全保障完善后再向公众发布此类高级模型，体现了对技术创新与安全伦理的审慎平衡。

来源：环球网

【环球网科技综合报道】5月24日消息，据科技媒体engadget报道，人工智能公司Anthropic近日披露，其前沿AI模型Claude Mythos Preview已成功协助识别出超过一万个网络安全漏洞，展现了AI在安全防御领域的巨大潜力。

近期，人工智能安全领域取得一项突破性进展。Anthropic公司正式公布了其网络安全项目“Glasswing”的初期成果。该项目于今年4月启动，核心是运用其尚未公开发布的Claude Mythos Preview模型，主动探测并预防潜在的人工智能网络攻击与安全风险。

成效究竟如何？项目启动仅一个月后，便已帮助其合作企业发现了超过一万个安全漏洞。尤为关键的是，据Anthropic报告显示，多数合作伙伴借助该模型，均在自身软件系统中发现了数百个被标记为“严重”或“高危”等级的安全缺陷。如此高效的漏洞挖掘能力，无疑对传统网络安全审计模式构成了新的挑战。

如此强大的AI模型，为何尚未向公众开放？Anthropic在技术报告中阐明了原因，这直接关联到当前AI行业面临的核心难题：安全防护体系尚未完善。公司坦承，目前包括自身在内，没有任何企业已建立起足够强大的防护机制，以确保此类高级模型不会被恶意攻击者滥用。简而言之，在释放强大AI能力之前，必须先构建起坚固可靠的安全防线。

基于此，Anthropic的明确规划是，待未来相应的AI安全治理措施和保障技术成熟后，再向业界正式发布“Mythos级模型”。这一策略深刻体现了一家负责任的AI企业在推动技术革新的同时，对安全伦理与风险管控所秉持的审慎态度。