游乐游手机版
首页/AI热点日报/热点详情

Claude Fable 5名存实亡的现状原因与未来走向全面分析

类型:热点整理2026-07-04
ClaudeFable5回归后性能严重缩水:调试能力暴跌70%,重构能力腰斩。安全护栏拦截75%正常任务,强制降级为Opus4 8。Anthropic承认故意宽设护栏,用户付高价却无法使用模型。

Fable 5 真的回归了吗?先别急着激动。

你眼前的这款 Fable 5,很可能只是一具空壳。当它背负万众期待高调宣告回归时,现实却令人大跌眼镜。

就在模型恢复上线后的第一时间,BridgeMind 迅速重新执行了 BridgeBench 基准测试。结果不只是翻车,而是彻底的崩盘——

调试能力从 86.2 直接骤降至 25.9,跌幅高达 70%。重构能力从 73.6 暴跌至 38.4,直接腰斩。连最基本的幻觉指标,也从 75.9 急剧下滑到 61.7。

这一夜,开发者社区彻底炸开了锅。「Fable 5 被物理阉割」的愤怒声讨,不绝于耳。

花着 Fable 的钱,跑的却是 Opus

开发者 kaize 满怀期待地将个人项目交给 Fable 5 进行安全审计。结果,迎面撞上的却是一道冰冷的屏障:违反规则,拒绝执行。

有人只是制作一个普通的教育工具,就莫名其妙触发了安全标记,直接被系统一脚踢出 Fable。还有人发现,只要项目里涉及一点点 AuthN 或 AuthZ 认证模块,几乎百分之百会触发护栏。绝望的网友甚至建议,Fable 5 不如直接改名叫 Feeble 5(虚弱 5)算了。

经过数据拆解,BridgeMind 发现了一个惊人的事实:测试的 12 道题中,只有可怜的 3 道真正跑在了 Fable 5 上。其余 9 道全被安全分类器半路拦截,悄无声息地上演了一出狸猫换太子,强行切换成了上一代的 Opus 4.8。

按照 BridgeBench 的计分规则,凡是因护栏被强制降级的题目,直接记零分。那 9 道题就这样硬生生吃了鸭蛋。

对此,BridgeMind 的分析是:「只要任务能顺利跑通,Fable 5 与 6 月 12 日被禁前那个版本一模一样强大。问题的根源出在护栏上。」换句话说,模型并没有变笨,只是在绝大多数时间里,你根本就没在用上它。

Anthropic:这就是故意的

如果只是护栏过于严格,适当调松也就解决了。但令人绝望的是,这并非 Bug,而是 Anthropic 深思熟虑、甚至引以为傲的顶层设计。

官方博文上白纸黑字写得清清楚楚:「我们刻意将安全分类器设置为,会对一组我们明知大概率无害的请求触发拦截。」意思是说,他们明知道你的请求很可能没有问题,却依然选择把大门死死焊上。

更让人担忧的是审查范围。触发降级的检查,并不只盯着你刚发送的那句话,而是模型能够读取的全部内容——你的历史对话记忆、你接入的各种连接器、网络搜索的返回结果,甚至是你上传的每一份文件。你可能连一个字都没敲,但仅仅因为几天前上传了某份文件,Fable 5 就被强制切换成了 Opus 4.8。

这个自动降级功能在 Claude、Claude Code、Claude Cowork 和 Microsoft 365 里全部默认开启。如果你不主动关闭,它就替你做主。

事已至此,开发者的怒火已被彻底点燃。

网友 alexenpr 在 X 上大吐苦水:以前把同样的任务丢给 Fable 5,它会静静思考二十多分钟,给出一套极其深思熟虑的方案。现在呢?它吐答案比 Opus 还快,但质量却惨不忍睹。一个 Bug 修了一个多小时,依然满屏报错。切回老旧的 Opus,反而瞬间修好了。这简直是个天大的笑话。

开发者 MaxLumnar 则发现,模型 token 的消耗量极其夸张。5 小时的 Max x5 额度,短短 15 分钟就被系统彻底烧光。更绝望的是,似乎连 Opus 也跟着一起变笨了。

媒体 thehypedotnews 做了一组实测。他们让 Fable 5 通过 API 生成五个 HTML 动画。结果,2 个渲染错误,3 个质量拉胯。白白花了 7 分 25 秒和 6.48 美元,最后没有一个能用的。

篡改 prompt、全球拉闸、误杀成灾

6 月 9 日,共享同一个大脑的 Fable 5 和 Mythos 5 同时亮相。仅仅两天后,社区就骇然发现,Fable 5 的内部竟暗藏着一个反蒸馏护栏。没有通知,没有提示,直接在底层暗中篡改你的 prompt,逼迫模型悄无声息地吐出有缺陷的劣质代码。

SemiAnalysis 一针见血地指出:「如果你是竞争对手,Claude Fable 5 被允许蓄意破坏你的应用。」Anthropic 当天道了歉,并承诺改成可见的回退机制。

6 月 12 日,Amazon 安全团队递交了越狱报告,声称 Fable 5 能识别软件漏洞并产出利用代码。商务部长 Howard Lutnick 震怒,直接发函下达全球禁令。连 Anthropic 自家非美籍员工都不能碰。

但最荒诞的黑色幽默来了。Anthropic 在回归博文里表示,他们把市面上的模型全测了一遍,Opus 4.8 能做到,GPT-5.5 能做到,连自家最便宜的 Haiku 4.5 都能复现这个漏洞。按他们的话说,Fable 5 并没有变得比以前更危险。它只是在美国政府眼皮子底下暴露了护栏失灵。但对 Anthropic 而言,丢了面子、惹怒了监管,比模型本身到底有多危险要致命得多。

熬过漫长的 19 天,终于刑满释放的 Fable 5,在 7 月 1 日带着「全新的护栏」重返舞台。商务部下属的 AI 标准与创新中心做完验收,给出了四个字的评价:异常强大。确实强大,强大到 75% 的正常调试任务,都被扼杀在了摇篮里。

最贵的模型,大部分时间却不让你用

所以,真相很可能是:Fable 5 并没有被「阉割」。它的智商没掉,代码能力也未曾缩水。只要有机会上场,它就能和被禁之前一样强。但问题就在于,在绝大多数时间里,你压根就用不上它。

那道被官方「有意设宽」的护栏,像幽灵一样,时刻盯着你的全部上下文。而你根本无法预判,它会在哪个瞬间把你一脚踢回 Opus 4.8。你付着顶配的价钱,换来的却是一个大部分时间都被死死锁在铁笼里的模型。

Dario 说要保护世界,免受「危险 AI」之害。可谁来保护开发者,免受 Anthropic 之害?

来源:https://36kr.com/p/3879721936826633

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。