昨天,人工智能公司Anthropic迎来重大更新,正式面向公众推出全新Claude Fable 5模型。这是他们此前发布的Mythos级模型首次以受限版本向更广泛的用户群体开放。然而上线不到24小时,尴尬局面便接连出现——Fable 5同时遭到两大阵营的质疑:网络安全研究人员指责其安全护栏过于严格,甚至连常规工作请求也会被拦截;微软则因数据留存规则的问题直接限制员工使用该模型。
安全护栏反成安全从业者的障碍
Fable 5的安全保护机制其实早有伏笔。今年4月,Anthropic首次发布Mythos级模型时,仅通过“玻璃翼计划”向少数企业和机构开放,核心目标是保护关键软件与基础设施。上周,访问范围才扩大到15个国家的数百家机构。Fable 5正是这条路线上的新一步:将Mythos级的能力以更强安全约束的形式推向公众。
但事态很快变得耐人寻味——最早被拦住的,恰恰是最需要它的那群人。
IBM X-Force的安全研究员瓦伦蒂娜·帕尔米奥蒂在社交媒体上公开吐槽:Fable会拒绝大量与网络安全相关的请求,就连阅读一篇博客文章都被禁止。一旦触发拦截,模型会提示用户,安全措施已将消息标记为涉及网络安全或生物学话题。
安全研究员马特·苏伊什向TechCrunch表示,若让Fable编写安全相关代码,模型可能将该请求归入“网络安全任务”而非普通软件工程,随后降级到Claude Opus 4.8处理。苏伊什认为,这种分类机制很可能由关键词或主题领域触发。当然,这只是受访者的个人观察,Anthropic至今未公开说明分类器具体的运作方式。
Anthropic倒是提供了“网络安全验证项目”,获批的安全专业人士可在相关工作中享受较少的限制。但对于临时测试、快速验证以及普通安全团队来说,申请审核本身就已经构成额外的门槛。
企业客户卡在数据留存条款上
如果说安全研究员的抱怨主要在于使用门槛过高,那么企业这边面临的则是合规方面的直接阻碍。据The Verge报道,微软正在限制员工内部使用Claude Fable 5,原因是Anthropic为这款模型设定了与其他Claude版本不同的数据留存规则。
具体而言,Fable 5会为安全分类器保留用户的提示词和模型输出,通常30天后删除;但如果内容被信任与安全机制标记为违反使用政策,最长可保存两年。微软此前使用的其他Claude模型均遵循“零数据留存”原则,而Fable的新规则直接触发了法务部门的审查。
直接影响是:外部客户已可通过GitHub Copilot和Foundry使用Claude Fable 5,但微软内部员工的模型选择器中暂时无法看到它。知情人士透露,微软法务团队主要担忧客户数据与保密信息的暴露风险,最终是否放行尚无定论。微软拒绝向The Verge发表评论。
更强的模型,更高的部署门槛
Fable 5的尴尬之处在于:它被设计成更安全的大模型,却因为安全部署本身的复杂性,同时挡住了专业用户和企业内部的流程。
对安全研究员来说,代码审查、漏洞分析、阅读安全文章都是日常必要操作。如果每次触及敏感主题都可能被拦截或降级,那么Fable就不再是随手可用的工具,而是一个需要提前申请权限的受控系统。
对企业客户而言,问题更为直接:员工究竟能不能将客户材料、内部代码、合同信息或未公开产品计划交给Fable 5处理?即便数据只保留30天,也足以让法务与信息安全团队重新评估使用边界。微软的限制并不意味着最终禁用,但信号已足够清晰:模型能力越强,围绕数据留存、审计以及误用防护的部署成本也会相应攀升。
