谷歌新研究:DeepSeek推理现多重人格,左右脑互搏越用越聪明
AI变聪明的真相,竟然是在“颅内群聊”?
谷歌的最新研究表明,像DeepSeek-R1这样的顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,比如外向的、严谨的、多疑的……
大模型的解题推理过程,就是这些人格之间一场精彩的社交辩论会;左右脑互搏的场面大概是:
“这个思路对吗?试试这样验证……”
“不对,之前的假设忽略了XX条件。”
……

有意思的是,AI还越吵越聪明。
研究发现,当遇到GPQA研究生级别科学问题、复杂数学推导这类高难度任务时,这种内部观点冲突破会变得更加激烈。
相比之下,面对布尔表达式、基础逻辑推理等简单任务,模型的内部分歧对话则会明显减少。

模型推理过程正是“左右脑互搏”
团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,它们的推理过程充满了对话感。
内部分裂出来的虚拟角色不仅性格迥异,还能覆盖更多解题角度。
创意型角色擅长提出新颖思路,批判型角色专注于挑错补漏,执行型角色负责落地验证……

通过这些不同人格的头脑风暴,不同观点的碰撞能让模型更全面地审视解决方案。
就连网友都说,自己在思考的时候,也会出现“左右脑互搏”的现象。

不过,这种多角色互动并不是开发人员刻意设计的,而是模型在追求推理准确率的过程中自发形成的。
那么实验是如何证明这一点的呢?

团队借助稀疏自编码器SAE,对AI的推理黑盒进行了深度解码,成功“监听”到了AI的颅内群聊。
首先,研究者让AI执行复杂的数学或逻辑推理任务。在模型产出思维链的同时,团队同步提取其隐藏层神经元的激活数值。
但此时的数据是由数亿参数构成的复杂非线性信号,无法直接对应任何语义。
将这些激活数据输入SAE,通过SAE的稀疏约束机制,就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征;
通过分析这些特征的激活频率以及它们在时间序列上的协同关系,团队成功识别出了不同的内部逻辑实体。
再给上述特征打上“规划者”、“验证者”等虚拟角色的标签,就成功解码了AI内部的多角色对话行为。
“哦?”能让推理更准确
通过对比DeepSeek-R1与DeepSeek-V3、Qwen-2.5-32B-IT这类普通指令模型的推理轨迹,发现推理模型的对话式行为出现的频率显著更高。

这里还有个很有意思的发现——
“哦?”能让推理更准确。
当团队通过激活添加法强化模型的对话特征,放大“哦?”这类表达惊讶、转折的话语标记时,模型在CountDown算术推理任务中的准确率直接从27.1%翻倍至54.8%。

更关键的实验证据来自强化学习训练。
研究人员不提供任何对话结构的训练信号,只奖励模型答对题目的行为,结果发现模型会自发学会用对话式思考;
而先通过多智能体对话数据对模型进行微调,再进行推理训练,进步速度会远快于直接训练推理或用独白式推理数据微调的模型。
在Qwen-2.5-3B和Llama-3.2-3B两个模型体系中,早期训练阶段对话微调模型的准确率比独白微调模型高出10%以上,Llama-3.2-3B到训练后期差距甚至扩大到22%。

这一发现恰好呼应了人类演化生物学中的著名理论“社会脑假说”。
假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。
如今看来,AI也是一样,为了变聪明,得先学会和不同“人格”社交!
相关攻略
4月2日,阿里巴巴正式推出新一代大语言模型Qwen3 6-Plus,并宣布其企业级AI旗舰应用“悟空”率先完成接入。此次升级不仅是模型的迭代,更标志着AI在企业级应用场景中的核心能力实现了关键性跨越。 官方信息显示,Qwen3 6-Plus在代码生成、智能体协作、逻辑推理及原生多模态理解等核心维度均
近日,开源技术圈迎来一项标志性进展:百度依托文心大模型打造的PaddleOCR项目,在GitHub上的Star数量突破73 3K,首次超越谷歌旗下长期占据领先地位的Tesseract OCR(73 2K)。这意味着,全球最受开发者欢迎的OCR开源项目正式易主,标志着大模型驱动的技术范式正在重塑行业格
Cursor的命运,悬在两个速度之间:AI自主编码成熟的速度,和Cursor自我蜕变的速度。 这家公司正处在一个奇特的矛盾点上:它依然蒸蒸日上,却又似乎正在走向绝望。关于这家一度是“Vibe Coding”代名词的明星公司,市场同时存在着两种截然相反却又似乎都能成立的观点。 数据描绘的是一幅烈火烹油
近日,Reddit上一则热帖引发了广泛关注。游戏开发商Beamable的首席执行官Jon Radoff,利用一个周末的时间,借助AI助手Claude,成功复活了自己19岁时开发的一款名为《未来往昔传奇》(Legends of Future Past)的MUD(多用户地下城)游戏。这款诞生于1992年
上周,Anthropic刚宣布对OpenClaw采取限制措施,这周,事情就发展到了一个新阶段——连OpenClaw项目的核心人物Peter Steinberger的个人账户也遭到了封禁。这场风波究竟会如何演变? 今天一早,OpenClaw创始人Peter Steinberger在社交平台X上发文确认
热门专题
热门推荐
现货持有者坚守仓位,比特币接近115,000水平 近期比特币(BTC)价格接近$115,000水平,市场整体情绪谨慎,但现货持有者依旧坚守仓位,显示出一定的多头信心。 市场现状与资金流动 那么,当前市场的资金究竟在如何流动?分析显示,一个有趣的现象正在上演:短线资金的流入其实相当有限,市场热度并未急
目录 要点介绍:分析师称XRP呈现“最强看涨结构”高位清算集中于2 90美元以上区域 周四,XRP价格稳稳站在了2 80美元上方。这个位置守住了,意味着什么?意味着市场向那个经典的“杯柄形态”目标价——6美元以上——又迈进了一步。 要点介绍: 先看几个核心数据:周四XRP报收2 82美元。技术分析显
近期,以太坊(ETH)衍生品市场经历了短暂的闪崩,但随后价格快速企稳,交易者开始关注关键突破点——$4,500水平。 ETH衍生品市场现状 市场情绪往往在剧烈波动后显露真容。从最新的链上数据和期权、永续合约的交易情况来看,那场短暂的闪崩更像是一次压力测试——结果是,市场波动率显著下降,多空力量似乎进
DOGE单日暴涨11%,交易量激增四倍,市场风向变了? 最近,加密货币市场又热闹起来了。DOGE(狗狗币)上演了一出“旱地拔葱”,价格单日暴涨11%,更关键的是,成交量直接翻了四倍。这种“价量齐升”的场面,无疑给整个迷因币板块打了一针强心剂,市场情绪肉眼可见地回暖了。 DOGE价格拉升原因分析 那么
如何安全获取欧易(OKX)官方APP?一份详尽的下载与使用指南 Binance币安 欧易OKX ️ Huobi火币️ 当人们谈论“欧易易欧”时,指的往往是那个全球顶尖的数字资产交易平台——欧易(OKX)。作为业务版图庞大的行业巨头,其官方APP无疑是用户进行交易、查看行情和管理资产的核心工具。不过,





