正当Anthropic呼吁建立全球AI治理框架之际,监管压力却意外降临自身。这一戏剧性转折,凸显了人工智能监管的复杂性与紧迫性。
美国时间6月12日,Anthropic官方发布公告:美国政府依据国家安全相关法规,下达了一项紧急出口管制指令,全面暂停所有非美国公民对新一代模型Fable 5和Mythos 5的访问权限。此项限制适用于身处美国境内及境外的所有外籍人士,甚至包括Anthropic公司内部的非美籍员工。
受此指令影响,Anthropic必须立即停止提供Fable 5与Mythos 5系列模型的商业服务,以确保所有用户均符合合规要求。该公司其他所有人工智能模型的访问与服务将维持正常,不受本次事件波及。
Anthropic透露,公司于当日下午5点21分正式接收到政府函件。但该指令并未详细阐述其背后具体的国家安全风险依据。

根据已披露的信息,政府方面表示掌握了一种可绕过Fable 5安全防护机制的技术方法。然而,Anthropic在审阅该技术演示后指出,其所利用的仅是少数此前已被识别的、严重性较低的已知漏洞。这些漏洞本身结构相对简单,且通过其他公开可用的通用模型同样能够识别,无需依赖特殊的“越狱”手段。
为积极应对此次监管封禁,Anthropic重申,公司在Fable系列模型部署前已构建了多层次、强有力的安全保障体系,显著降低了该模型在网络安防等高风险任务中被恶意利用的潜在可能性。
此外,在Fable正式发布前的数周内,Anthropic已协同美国政府、英国人工智能安全研究所(AISI)、多家独立第三方专业机构以及内部安全团队,累计投入超过数千小时进行密集的红队对抗测试。测试结果表明,Fable模型所采用的安全防护效能,远超以往部署的任何同类前沿模型。
截至目前,所有内外部测试均未发现一种通用的、可广泛破解该模型多项安全限制、系统性绕过其防护机制的越狱方法。
Anthropic进一步表示,公司尚未收到任何关于新模型存在可能导致实际危害的、非通用性潜在安全漏洞的披露。因此,尽管公司正依法遵从政府指令,暂停所有用户对Fable 5和Mythos 5的访问,但Anthropic明确表示并不认同仅因发现一个潜在的、影响范围有限的漏洞就全面召回已面向全球数亿用户部署的商业产品。倘若这一标准在行业内被广泛采用,实质上将阻碍所有前沿人工智能模型提供商的新模型迭代与部署进程。
Anthropic建议,监管机构应在透明、公正、权责明确且基于技术事实的法定程序框架下,行使阻止不安全模型部署的权力。而本次行动并未充分遵循上述原则。Anthropic相信此次事件源于信息沟通与技术评估上的误解,目前正与相关部门紧密协作,全力争取尽快恢复模型的正常访问权限,推动事件妥善解决。
