最近,谷歌的一项研究表明,像DeepSeek-R1这样的顶尖推理模型在解决复杂问题时,其内部会自发“分裂”出性格迥异的虚拟人格,比如外向型、严谨型或多疑型。这些不同的人格在模型思考过程中会展开激烈的社交与辩论,类似于人类“左右脑互搏”,从而使模型越“吵”越聪明。研究进一步揭示,当面对高难度任务时,这种内部冲突会更加明显且有益,而在处理简单任务时则会显著减少。
研究团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,它们的推理过程充满对话感,内部裂变出的虚拟角色性格各异,能覆盖更多解题视角。例如,创意型角色负责提出新颖思路,批判型角色专司挑错补漏,而执行型角色则负责将方案落地验证。值得注意的是,这种多角色互动并非开发人员刻意设计,而是模型在追求推理准确性的过程中自发形成的机制。
借助稀疏自编码器(SAE),研究人员成功“监听”到了AI的“脑内群聊”。通过提取模型隐藏层神经元的激活数值,并利用SAE的稀疏约束机制,将复杂的信号拆解为独立的对话语义特征,从而识别出不同的内部逻辑实体,并为其打上虚拟角色标签,最终解码了AI内部多角色对话的行为模式。
实验数据表明,推理模型出现对话式行为的频率显著高于普通的指令模型。一个有趣的发现是,当强化模型的对话特征,例如放大“哦!”这类表达惊讶或转折的语气标记时,模型在算术推理任务中的准确率会得到显著提升。此外,在强化学习训练中,模型会自发学会使用对话式思考,并且那些预先经过多智能体对话数据微调的模型,在推理训练中的进步速度远超直接训练或使用独白式推理数据微调的模型。
这一发现呼应了人类演化生物学中的“社会脑假说”,即大脑的进化是为了应对复杂的社交关系和群体互动需求。如今,AI似乎也在通过与不同“人格”的社交互动来提升其智能水平。
