谷歌新研究：DeepSeek推理现多重人格，左右脑互搏越用越聪明

首页

AI资讯

热心网友

转载

2026-01-20

AI变聪明的真相，竟然是在“颅内群聊”？

谷歌的最新研究表明，像DeepSeek-R1这样的顶尖推理模型在解题时，内部会自发“分裂”出不同性格的虚拟人格，比如外向的、严谨的、多疑的……

大模型的解题推理过程，就是这些人格之间一场精彩的社交辩论会；左右脑互搏的场面大概是：

“这个思路对吗？试试这样验证……”

“不对，之前的假设忽略了XX条件。”

……

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

有意思的是，AI还越吵越聪明。

研究发现，当遇到GPQA研究生级别科学问题、复杂数学推导这类高难度任务时，这种内部观点冲突破会变得更加激烈。

相比之下，面对布尔表达式、基础逻辑推理等简单任务，模型的内部分歧对话则会明显减少。

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

模型推理过程正是“左右脑互搏”

团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现，它们的推理过程充满了对话感。

内部分裂出来的虚拟角色不仅性格迥异，还能覆盖更多解题角度。

创意型角色擅长提出新颖思路，批判型角色专注于挑错补漏，执行型角色负责落地验证……

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

通过这些不同人格的头脑风暴，不同观点的碰撞能让模型更全面地审视解决方案。

就连网友都说，自己在思考的时候，也会出现“左右脑互搏”的现象。

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

不过，这种多角色互动并不是开发人员刻意设计的，而是模型在追求推理准确率的过程中自发形成的。

那么实验是如何证明这一点的呢？

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

团队借助稀疏自编码器SAE，对AI的推理黑盒进行了深度解码，成功“监听”到了AI的颅内群聊。

首先，研究者让AI执行复杂的数学或逻辑推理任务。在模型产出思维链的同时，团队同步提取其隐藏层神经元的激活数值。

但此时的数据是由数亿参数构成的复杂非线性信号，无法直接对应任何语义。

将这些激活数据输入SAE，通过SAE的稀疏约束机制，就可以把杂乱的激活拆解为“自问自答”、“切换视角”等独立的对话语义特征；

通过分析这些特征的激活频率以及它们在时间序列上的协同关系，团队成功识别出了不同的内部逻辑实体。

再给上述特征打上“规划者”、“验证者”等虚拟角色的标签，就成功解码了AI内部的多角色对话行为。

“哦？”能让推理更准确

通过对比DeepSeek-R1与DeepSeek-V3、Qwen-2.5-32B-IT这类普通指令模型的推理轨迹，发现推理模型的对话式行为出现的频率显著更高。

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

这里还有个很有意思的发现——

“哦？”能让推理更准确。

当团队通过激活添加法强化模型的对话特征，放大“哦？”这类表达惊讶、转折的话语标记时，模型在CountDown算术推理任务中的准确率直接从27.1%翻倍至54.8%。

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

更关键的实验证据来自强化学习训练。

研究人员不提供任何对话结构的训练信号，只奖励模型答对题目的行为，结果发现模型会自发学会用对话式思考；

而先通过多智能体对话数据对模型进行微调，再进行推理训练，进步速度会远快于直接训练推理或用独白式推理数据微调的模型。

在Qwen-2.5-3B和Llama-3.2-3B两个模型体系中，早期训练阶段对话微调模型的准确率比独白微调模型高出10%以上，Llama-3.2-3B到训练后期差距甚至扩大到22%。

谷歌新发现：DeepSeek推理分裂出多重人格，左右脑互搏越来越聪明

这一发现恰好呼应了人类演化生物学中的著名理论“社会脑假说”。

假说认为人类大脑的进化主要是为了应对复杂的社交关系和群体互动需求。

如今看来，AI也是一样，为了变聪明，得先学会和不同“人格”社交！

来源:https://tech.ifeng.com/c/8q4ARvfiv2w

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：华为启境与奕境如何搭载全栈智能化方案下一篇：LLM如何跨越物理鸿沟？具身智能机器人安全的实现路径

相关攻略

AI资讯

悟空编程率先接入国产大模型Qwen3.6 Plus

4月2日，阿里巴巴正式推出新一代大语言模型Qwen3 6-Plus，并宣布其企业级AI旗舰应用“悟空”率先完成接入。此次升级不仅是模型的迭代，更标志着AI在企业级应用场景中的核心能力实现了关键性跨越。官方信息显示，Qwen3 6-Plus在代码生成、智能体协作、逻辑推理及原生多模态理解等核心维度均

热心网友

05.20

AI资讯

GitHub最受欢迎OCR项目PaddleOCR使用指南

近日，开源技术圈迎来一项标志性进展：百度依托文心大模型打造的PaddleOCR项目，在GitHub上的Star数量突破73 3K，首次超越谷歌旗下长期占据领先地位的Tesseract OCR（73 2K）。这意味着，全球最受开发者欢迎的OCR开源项目正式易主，标志着大模型驱动的技术范式正在重塑行业格

热心网友

05.20

AI资讯

Cursor会倒闭吗分析其商业模式与未来前景

Cursor的命运，悬在两个速度之间：AI自主编码成熟的速度，和Cursor自我蜕变的速度。这家公司正处在一个奇特的矛盾点上：它依然蒸蒸日上，却又似乎正在走向绝望。关于这家一度是“Vibe Coding”代名词的明星公司，市场同时存在着两种截然相反却又似乎都能成立的观点。数据描绘的是一幅烈火烹油

热心网友

05.20

AI资讯

Claude周末复刻30年前经典游戏完整教程

近日，Reddit上一则热帖引发了广泛关注。游戏开发商Beamable的首席执行官Jon Radoff，利用一个周末的时间，借助AI助手Claude，成功复活了自己19岁时开发的一款名为《未来往昔传奇》（Legends of Future Past）的MUD（多用户地下城）游戏。这款诞生于1992年

热心网友

05.20