DeepSeek V3.1回应“极”字输出异常,官方称已修复
DeepSeek V3.1 上演的 bug 大秀“极你太美”,可谓是让全网热议了一波。
简单来说呢,就是陆续有开发者们发现,当他们在调用 API 进行代码开发的过程中,输出结果里会时不时蹦出来“极”字。
像这样:

这个问题最初是在火山引擎、chutes 等平台上被发现,但随着事件的发酵,更多平台也被卷入了进来,包括腾讯的 CodeBuddy,甚至是 DeepSeek 官方……

事件之火,在国外 Reddit 上也是讨论声一片,重灾区是“extreme”、“极”和“極”:
“extreme”(id:15075)
“极”(id:2577,简体中文的 extreme)
“極”(id:16411,繁体中文中的 extreme)

腾讯 CodeBuddy 还出现了更加奇葩的情况,直接插了句带“极”字儿的广告……

若是开发者们没有细看,直接用了生成的代码,那定然是会导致编译不通过等情况,可以说是对需要高精度、结构化输出的场景是致命一击。
截至目前,大家已经统一将问题的矛头指向了 DeepSeek V3.1 模型本身,以及 CodeBuddy 帮忙问了:
已经和 DeepSeek 团队取得联系,将在最近的一个版本中进行修复。

现在该如何防范“极”字 bug?
就目前来看,虽然完全解决问题要等到 DeepSeek 官方下场,但已经有网友开始支招解决这个问题了。
例如小红书网友 @大模型产品经理,便分享了一招 —— 提示词缓解:

关键的一句提示词是这样的:
禁止如下符号序列模式:
[空格] [几个token] [占位符/省略符号]
并且这个方法主要是针对调用 API 的第三方平台,若是在 DeepSeek V3.1 官方,则不需要。
为什么会这样?
最后,至于为什么 DeepSeek V3.1 会出现这样的 bug,知乎网友、阶跃星辰黄哲威给出了他的看法,并获得了高赞。

他首先指出,这种现象并非孤例。在他使用小模型和开源数据蒸馏,以及在测试早期的 R1 模型时,就曾遇到过类似的 bug。
黄哲威认为,这与大模型编程编题时可能出现的一种“恶性模式”(malicious pattern)有关。他举例说,在枚举素数的任务中,一个正常的模型本应无限地列举下去,如“素数表 2, 3, 5, 7 …”。
然而,他观察到之前一个代号为 R1-0528 的模型会出现一种奇特行为:在列举一段后会自行停止,变成一个有限的列表,例如“素数表 2, 3, 5, 7 … 997, 极长”。
这个“极长”的用法,与现在讨论的“极”字问题非常相似,常常出现在大量恶性重复之后,作为正常推理过程的回正。有时,模型甚至会输出“90000000…0000 极大的数字”这样的内容。
他进一步描述了这种 bug 的触发场景。当模型陷入“thinking”的末尾循环无法跳出时,有千分之一的概率会突然蹦出一个“极”字,然后终止思考(),这似乎是一种特殊的终止符或标记。
通过观察 R1 模型大量的输出,黄哲威发现了不少问题,包括超长响应(response)、大面积的空白字符、不断的短句重复等,甚至连 thinking 末尾的英文字符都变得破碎。
基于以上观察,他提出了一个核心推测:这个问题的根源可能在于数据清洗不彻底。他认为,在进行 SFT(监督微调)数据合成,乃至构建预训练数据时,可能没有将一组名为“‘极长’的数组”的“脏数据”清洗干净。
他推断,R1 模型在处理一些难题的解答时,似乎大量使用了 RAG(检索增强生成)技术,而后续的 RL+(强化学习)阶段,模型直接将这个“极”字当作了某种终止符或者语言切换标记来学习和使用了。
最后,黄哲威总结道,如果 R1 迭代时的数据没有清洗干净,模型自行蒸馏并“污染”到正常的输出过程中,是完全可能发生的。这为理解 DeepSeek V3.1 模型出现的“极”字问题提供了一个可能的解释路径。

至于这个被网友戏称为“极你太美”、“‘极’速版”的问题到底何时会彻底解决,就要等 DeepSeek 官方的新版本了。
参考链接:
[1]https://mp.weixin.qq.com/s/MrozcO_iRvoxK1HvgP4IVA
[2]https://www.zhihu.com/question/1942934856603505597
[3]https://www.reddit.com/r/LocalLLaMA/comments/1mzsg6v/deepseek_v31_getting_token_extreme_%E6%9E%81_%E6%A5%B5_out_of/
[4]https://linux.do/t/topic/897789
本文来自微信公众号:量子位(ID:QbitAI),作者:金磊
相关攻略
DeepSeek-V4-ProAPI宣布永久降价至原价的四分之一。原定于2026年结束的2 5折优惠将转为长期定价标准,输入与输出费用均大幅降低。此举为开发者和企业用户提供了明确的成本利好,市场预期的优惠后涨价并未发生。
DeepSeek的低价源于全方位成本控制:通过上下文缓存复用降低长文本生成开销,采用混合注意力机制高效处理超长序列,利用MoE架构推理时仅激活部分专家以提升算力效率。训练阶段通过算法与工程优化压缩开支,最终形成极低服务成本与竞争力定价。
近日,DeepSeek 官方对其 API 服务文档进行了一次关键性更新。根据最新发布的定价信息,DeepSeek-V4-Pro 模型的 API 计费策略已作出明确调整:原计划于 2026 年 5 月 31 日截止的 2 5 折限时优惠活动到期后,服务价格将不会回调至最初公布的标准原价,而是会永久性调
2026年5月23日,这个看似寻常的日期,或许将在未来被视作一个关键的转折点。一系列独立事件正同步发生,悄然交织成一张影响深远的趋势网络。 市场波动通常由多重因素共振导致。从宏观政策微调到前沿科技突破,从产业链局部调整到全球资本重新配置,每一个信号都蕴含深层信息。当这些信号在相近时段密集出现,其背后
宁德时代近期密集布局AI算力基础设施,投资超145亿元入股世纪互联和中恒电气,覆盖算力机房、电力供应与储能主业,并参投能源大模型公司,与商汤科技落地算电协同平台。此举旨在构建从储能、供电到算力调度的完整闭环,推动公司从电池供应商向算力时代能源基建巨头转型,顺应政策与产。
热门专题
热门推荐
公安部就电子数据取证规则公开征求意见,拟将网络安全等行政案件纳入适用范围,并规范取证流程与核心概念。新规特别明确了获取密码、调取通讯内容等特殊程序,需经严格审批并保障当事人权利。配套法律文书也同步优化,以构建更规范且注重权利保障的取证体系。
理想L9和LIvis的定价策略刚掀起波澜,小鹏GX的最终价格就给出了更猛烈的回应——从近40万元的预售价直降至27万元起。用小鹏产品矩阵负责人吴安飞的话说,这叫“9系的产品,8系的价格”。 这12万元的下调,效果堪称立竿见影。发布会次日,小鹏集团港股股价一度大涨超8%。更关键的是市场订单:上市12小
5月21日,环塔拉力赛新疆且末赛段大营迎来了一位备受瞩目的访客——知名零售企业胖东来的创始人于东来。他专程前往长城汽车车队营地,与参赛车手及后勤团队进行了深度交流。据悉,于东来此次自驾越野之旅已历时一月,随行车队中包含多款国产越野车型。经过实地驾驶与多维度对比,他对以长城汽车为代表的国产越野车品质给
比特币官方入口在哪里?一个核心门户的权威指南 说起比特币,很多人第一反应是去找它的“官网”或“官方App”。但这里有个关键点需要先理清:比特币本质上是一种去中心化的全球数字货币,它不属于任何一家公司或机构,而是由一个庞大的、遍布全球的社区共同维护。因此,它并没有传统意义上由某个企业运营的“官方网站”
Ring-2 5-1T是什么 在当今大模型技术激烈竞争的赛道上,追求更长的上下文处理能力和更强大的深度推理性能已成为核心焦点。近日,蚂蚁集团旗下的inclusionAI团队重磅开源了Ring-2 5-1T模型,这是一个参数规模高达万亿级别的混合线性思考大语言模型。该模型基于先进的Ling 2 5架构





