来源:环球网
【环球网科技综合报道】5月24日消息,据科技媒体engadget报道,人工智能公司Anthropic近日披露,其前沿AI模型Claude Mythos Preview已成功协助识别出超过一万个网络安全漏洞,展现了AI在安全防御领域的巨大潜力。

近期,人工智能安全领域取得一项突破性进展。Anthropic公司正式公布了其网络安全项目“Glasswing”的初期成果。该项目于今年4月启动,核心是运用其尚未公开发布的Claude Mythos Preview模型,主动探测并预防潜在的人工智能网络攻击与安全风险。
成效究竟如何?项目启动仅一个月后,便已帮助其合作企业发现了超过一万个安全漏洞。尤为关键的是,据Anthropic报告显示,多数合作伙伴借助该模型,均在自身软件系统中发现了数百个被标记为“严重”或“高危”等级的安全缺陷。如此高效的漏洞挖掘能力,无疑对传统网络安全审计模式构成了新的挑战。
如此强大的AI模型,为何尚未向公众开放?Anthropic在技术报告中阐明了原因,这直接关联到当前AI行业面临的核心难题:安全防护体系尚未完善。公司坦承,目前包括自身在内,没有任何企业已建立起足够强大的防护机制,以确保此类高级模型不会被恶意攻击者滥用。简而言之,在释放强大AI能力之前,必须先构建起坚固可靠的安全防线。
基于此,Anthropic的明确规划是,待未来相应的AI安全治理措施和保障技术成熟后,再向业界正式发布“Mythos级模型”。这一策略深刻体现了一家负责任的AI企业在推动技术革新的同时,对安全伦理与风险管控所秉持的审慎态度。
