2026年6月13日,一则突发消息引爆整个AI行业:Anthropic正式发布声明,为遵守美国政府最新发布的出口管制指令,立即暂停所有非美国公民(无论身处美国境内还是境外)对Fable 5和Mythos 5模型的访问权限,甚至连公司内部的外籍员工也被限制使用。
简单来说,为了满足合规要求,Anthropic不得不紧急关闭这两款模型面向全球用户的服务窗口。当然,公司也明确表示,其他Claude系列模型的访问不会受到任何影响。
这个时间节点极为微妙。Fable 5作为Anthropic在6月9日刚刚发布的新模型,从高调亮相到全球范围被紧急禁用,仅仅过去了72小时。如此戏剧性的转折,让外界嗅到了不同寻常的信号。
一场“误解”引发的下架风波?
根据Anthropic的声明,美国政府的指令信函并未详细说明具体涉及何种国家安全担忧,但其核心依据似乎是:有人发现了能够绕过Fable 5安全机制的方法。
对此,Anthropic方面显然持不同意见。公司表示,经过内部审查,这只是一个用于识别少数已知且较为轻微软件漏洞的方法。关键是,这些漏洞本身相对基础,即便是市面上其他公开可用的模型,在不进行任何“越狱”操作的情况下,也能轻易发现。换句话说,在Anthropic看来,这远不是一个严重到需要召回整个模型的“超级漏洞”。
“我们坚信这其中存在误解,”声明中写道,“并正在全力争取尽快恢复访问权限。” 这句话的背后,折射出公司与监管机构在风险认知和判定标准上的直接碰撞。
强监管时代的标志性序幕
业内观察人士普遍认为,这绝非一次简单的技术性模型下架。它更像一道分水岭,标志着前沿AI技术正式步入强监管时代。它将“模型核心能力”、“国家安全关切”、“商业发布流程”与“全球用户访问权”这几个复杂命题,同时推到了聚光灯下。
整件事后续最值得关注的有两个看点: 第一,美国政府是否会公开更多、更具体的技术依据,以支撑其出于“国家安全”理由所采取的行动。监管的透明性是建立行业信任的基石。 第二,Anthropic能否如其所说,快速解决问题并恢复Fable 5和Mythos 5的访问。如果恢复过程漫长,甚至最终无法恢复,那么此次事件很可能成为一个具有标杆意义的案例,深远影响未来所有前沿AI模型的发布策略与监管框架。
Anthropic的完整声明与深度辩白
为了更清晰地展现双方立场的差异,以下是Anthropic针对此事发布的声明全文,其中包含了大量关于其安全理念和技术细节的解释:
关于美国政府要求暂停访问Fable 5和Mythos 5指令的声明
2026年6月11日,美国政府以国家安全为由发布了一项出口管制指令,要求暂停任何非美籍人士(无论身处美国境内还是境外,包括Anthropic的外籍员工)对Fable 5和Mythos 5的所有访问权限。
这项命令造成的实际影响是,为了确保合规,我们不得不紧急对所有客户禁用Fable 5和Mythos 5。Anthropic所有其他模型的访问将不受影响。
我们在当天下午5:21(美国东部时间)收到了政府的指令函。该函件并未提供关于其国家安全担忧的具体技术细节。
我们的理解是,政府认为他们获悉了一种绕过(或称“越狱”)Fable 5的方法。我们立即审查了使用该特定技术来识别少量此前已知、轻微漏洞的演示案例。实际情况是,这些被发现的漏洞看起来都相对简单。更重要的是,我们发现即使不借助任何越狱手段,其他公开可用的模型也能够轻易识别出这些漏洞。
Fable的安全防护哲学
正如我们在发布博客文章中所阐述的,Anthropic在Fable安全防护上秉持以下核心立场:
首先,我们建立了极其强大的安全防护体系,极大降低了Fable被滥用于网络安全或其他高风险任务的可能性。事实上,我们的防护严格到甚至引来部分用户抱怨限制过于宽泛。
其次,在Fable正式发布前的几周内,Anthropic与美国政府、英国人工智能安全研究所(AISI)、多家第三方私营机构以及公司内部团队展开了密集合作,累计进行了数千小时的红队测试。
这些测试一致表明,Fable的安全防护效果,远比以往部署的任何大型模型都要有效得多。
至今,还没有任何测试人员能够找到一种“通用越狱”方法——即那种能够大范围、系统性绕过模型安全防护,从而全面解锁其网络安全能力的攻击手段。
关于“完美防御”的现实考量
我们有一个基本判断:在现阶段,任何模型提供商都不可能实现完美的、无法被越狱的防御。业内存活着的每一种安全防护手段,实际上都难以抵御那些高度定制化的“非通用越狱”攻击。这一点,我们在发布Fable 5时就已向外界明确说明过。
既然完美防御目前并不现实,Anthropic为Fable 5量身定制了“纵深防御”策略。我们的核心目标,是让任何越狱尝试要么变得适用范围极窄(针对非通用越狱),要么让其制作和实施成本变得极高(针对通用越狱)。同时,我们结合了严密的实时监控系统,以确保能快速检测并阻断任何成功的攻击尝试。
这正是Anthropic为何坚持要求对Fable的用户数据保留30天的原因——这项政策确实给我们和客户都带来了额外的实际成本,但它至关重要,能让我们深入研究并有效缓解出现的越狱问题。
我们始终坚信这一纵深防御策略。它已经成功地将Fable可能带来的风险,降低到了与全行业广泛部署的现有模型相当的水平。
对当前“越狱”披露的评估
事实上,迄今为止,我们甚至没有收到过任何一起因非通用越狱而导致有害结果或真正令人担忧的案例披露。目前向我们披露的所有所谓“潜在越狱”,其演示结果要么是模型给出了完全无害的回复,要么仅仅是一些微不足道的发现,完全没有体现出Mythos模型所特有的那种能力阶跃。
具体到本次事件,截至目前,政府仅向我们提供了一种局部、非通用潜在越狱手段的口头描述,其基本方式就是引导模型去读取特定代码库并修复软件漏洞。据了解,有人向政府提交了这样一个演示案例。我们经过审查后确认,该案例所展示的能力水平,在其他主流模型(例如OpenAI的GPT-5.5)上随处可见,并且每天都被全球无数的系统安全维护人员作为常规工具使用。我们将在未来24小时内分享更多技术细节。
原则立场与行业呼吁
我们将无条件遵守政府的法律指令,并已立即取消了所有用户对Fable 5和Mythos 5的访问权限。
然而,我们必须明确指出:我们无法认同“仅仅因为发现一种局部的、非通用的潜在越狱手段,就应当成为召回一个已部署给数亿用户使用的商业模型的充分理由”。如果这一标准被确立并施加于整个行业,那将意味着实际上迫使所有前沿AI模型提供商停止一切新模型的部署与迭代,因为按照这个逻辑,没有任何一个复杂模型能绝对免疫于某种特定的、局部的试探。
正如我们多次公开声明的,我们支持政府应当拥有叫停不安全部署的法定权力,但这项权力的行使,必须建立在透明、公平、程序清晰且基于坚实技术事实的基础之上。在我们看来,此次行动并未完全符合这些基本原则。
我们对由此给客户带来的困扰深表歉意。我们依然认为当前局面源于误解,并正动用一切资源,致力于尽快恢复访问权限。
