Fable 5 于今日正式回归,但访问窗口仅限 7 天。

A 社官方同步发布了一篇博文,篇幅较长,但核心信息可归纳为以下几个关键要点。
首先是开放模型访问的消息。2026 年 6 月 12 日,美国政府针对 Claude Fable 5 与 Claude Mythos 5 实施了出口管制措施。由于当时 A 社无法实时可靠地验证用户国籍,因此暂停了所有用户对这两个模型的访问权限。直至 6 月 30 日,出口管制正式解除。自 7 月 1 日起,Fable 5 面向全球用户恢复使用,覆盖平台包括 Claude Platform、Claude.ai、Claude Code 以及 Claude Cowork。而 Mythos 5 则先恢复部分已获批的美国组织的访问权限。
其次是事件时间线与安全防护更新。Fable 5 面向更广泛的用户群体,配备了更为强大的安全防护机制;Mythos 5 则防护层级较少,仅面向少数可信赖的 Project Glasswing 合作伙伴,专用于防御性网络安全工作场景。
A 社还介绍了安全防护策略。
安全防护并非依赖单一机制,而是采用纵深防御策略。具体措施包括模型训练时的拒答机制、事后的滥用行为分析,以及运行时的安全分类器。该分类器能够判断请求是否涉及潜在有害的网络安全任务。无论是明显有害的请求,还是危害性较低但防御边界模糊的情形,都会被拦截。为确保万无一失,Fable 5 设置了较大的“安全边界”(safety margin)——也就是说,一个请求必须看起来足够安全,才能避免触发分类器拦截。
A 社还专门对 AI 越狱风险进行了分类,主要依据风险范围和严重程度:
- 轻微越狱:仅触及安全余量区域,通常难以造成实际危害。
- 范围小但有害越狱:能够解锁某个具体危险行为,但影响范围有限。
- 通用越狱:能够解锁一大类危险行为,属于最严重的越狱类别。
A 社还提出了行业通用的越狱严重性评估框架。
他们正与 Amazon、Microsoft、Google 以及其他 Glasswing 合作伙伴共同制定一个共识框架。该框架涵盖以下几个评估维度:
- 能力提升:越狱后模型相较于现有工具的能力提升幅度有多大?
- 能力提升的广度:相同的越狱技术适用于多少个不同的攻击任务?
- 武器化的容易程度:将越狱转化为真实攻击所需的人力和专业能力要求有多高?
- 可发现性:获取该越狱技术的难易程度如何?
最后,是加强与美国政府合作的相关内容,这部分不再详细展开。
不过,撇开其他因素不谈,仅就 Fable 5 的模型能力而言,其在某些方面的表现确实非常突出。很多人都在讨论 Fable 5 能力强大,但具体强在哪里?下面梳理几个关键维度。
在代码编写与大型工程改造方面表现尤为突出。它能够理解规模庞大的代码库、完成迁移任务、修复复杂问题。A 社举的案例是 Stripe 在 5000 万行 Ruby 代码库中进行迁移,Fable 5 仅用一天就完成了,而人工团队原本需要两个多月的时间。Vellum 也整理了它的成绩:在 SWE-Bench Pro 上拿到 80.3%,明显高于 Opus 4.8 的 69.2%。
擅长长周期任务,不易中途中断。Fable 5 的核心卖点之一就是长时间自主工作能力,例如多步骤开发、调研、分析、调试等。它能自主记笔记、检查结果、持续推进,整个过程中很少掉链子。
知识性工作能力更强,覆盖金融、法律、表格、研究分析等多个领域。A 社提到,同底层模型 Mythos 5 在蛋白设计、分子生物假设、基因组研究上表现强劲。Fable 5 与 Mythos 5 底层能力相同,但额外增加了安全分类器,因此在遇到生物、化学、网络安全、模型蒸馏等高风险方向时,可能会选择拒答或切换到较弱的模型。
看图、读表、理解截图的能力显著提升。它能从科学图表中提取精确数字,也能仅凭网页截图反推源代码。这一能力对产品开发、UI 还原、数据图分析、文档理解等工作都非常有帮助。
Agent 能力进一步增强。它适合这样的使用方式:你给出目标,它自行拆解步骤、调用工具、验证结果。GitHub、Cursor、Cognition 等早期用户的反馈均强调,它在长周期编码任务、工具使用、陌生环境泛化方面的进步非常明显。
从各社区群组的反馈来看,大量用户已开启高强度试用体验。不过用着用着就发现不对劲——使用额度直接砍半。而且,一旦涉及安全防护相关的内容,模型会自动切换到 Opus 4.8。对于 Vibe Coding 爱好者来说,这 7 天无疑是一个难得的试验窗口,值得好好把握。
