谷歌研究:DeepSeek推理模型如何通过“脑内群聊”优化AI智能
最近,谷歌的一项研究表明,像DeepSeek-R1这样的顶尖推理模型在解决复杂问题时,其内部会自发“分裂”出性格迥异的虚拟人格,比如外向型、严谨型或多疑型。这些不同的人格在模型思考过程中会展开激烈的社交与辩论,类似于人类“左右脑互搏”,从而使模型越“吵”越聪明。研究进一步揭示,当面对高难度任务时,这种内部冲突会更加明显且有益,而在处理简单任务时则会显著减少。
研究团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,它们的推理过程充满对话感,内部裂变出的虚拟角色性格各异,能覆盖更多解题视角。例如,创意型角色负责提出新颖思路,批判型角色专司挑错补漏,而执行型角色则负责将方案落地验证。值得注意的是,这种多角色互动并非开发人员刻意设计,而是模型在追求推理准确性的过程中自发形成的机制。
借助稀疏自编码器(SAE),研究人员成功“监听”到了AI的“脑内群聊”。通过提取模型隐藏层神经元的激活数值,并利用SAE的稀疏约束机制,将复杂的信号拆解为独立的对话语义特征,从而识别出不同的内部逻辑实体,并为其打上虚拟角色标签,最终解码了AI内部多角色对话的行为模式。
实验数据表明,推理模型出现对话式行为的频率显著高于普通的指令模型。一个有趣的发现是,当强化模型的对话特征,例如放大“哦!”这类表达惊讶或转折的语气标记时,模型在算术推理任务中的准确率会得到显著提升。此外,在强化学习训练中,模型会自发学会使用对话式思考,并且那些预先经过多智能体对话数据微调的模型,在推理训练中的进步速度远超直接训练或使用独白式推理数据微调的模型。
这一发现呼应了人类演化生物学中的“社会脑假说”,即大脑的进化是为了应对复杂的社交关系和群体互动需求。如今,AI似乎也在通过与不同“人格”的社交互动来提升其智能水平。
相关攻略
与3D数字人互动时,你是否曾感到一丝难以言喻的“不自然”?它的嘴唇在同步发音,表情却略显呆板;手臂虽有动作,却与对话内容缺乏关联。更常见的是,那些外观高度拟真但动作僵硬、节奏失调的数字人,很容易将用户体验带入“恐怖谷”效应。 问题的核心在于,人类的高效沟通从来不是单一维度的信息传递。一个细微的耸肩足
在人工智能领域,我们正见证着一个激动人心的范式转变。过去,构建一个强大的AI系统往往意味着需要“从头开始”训练一个庞大的模型,这个过程不仅耗费巨量的计算资源和数据,而且周期漫长。但现在,一种更高效、更灵活的策略正在成为主流:基于现有的、能力强大的基础模型,通过“微调”来快速适配特定任务或领域。 这就
多模态大模型的幻觉问题,一直是阻碍其实际落地的核心挑战。传统观点认为,模型“胡言乱语”源于视觉感知错误。然而,最新研究揭示了一个更深层的原因:很多时候,模型并非“看”错了,而是在推理链条最脆弱的转折点上,“想”偏了方向。 这项关键研究发现,当模型生成“因为”、“但是”、“等等”这类表示因果、转折或反
ReCALL团队 投稿量子位 | 公众号 QbitAI 把生成式大模型拿去当检索器用,是不是有点大材小用,效果还总不尽如人意? 按理说,多模态大模型(MLLM)拥有强大的图文理解和逻辑推理能力,用它来处理图像检索,特别是组合图像检索(CIR)这类复杂任务,本该是降维打击、手到擒来。 但现实却狠狠打了
面对复杂连续任务的长程规划,现有的生成式离线强化学习方法往往会暴露短板。它们生成的轨迹经常陷入局部合理但全局偏航的窘境。它们太关注眼前的每一步,却忘了最终的目的地。针对这一痛点,厦门大学和香港科技大
热门专题
热门推荐
苹果MacStudio库存见底,预示新款即将发布。外观预计延续经典紧凑设计,接口布局不变。核心升级为M5Max和M5Ultra芯片,性能大幅提升,但内存供应可能受限。固态硬盘速度有望翻倍。作为苹果专业桌面新旗舰,其起售价可能小幅上调,WWDC大会可能是发布窗口。
对于使用尼康Z卡口APS-C画幅(DX格式)相机(如Z fc、Z30、Z50)的摄影爱好者而言,在套机镜头之外选择一支定焦镜头,是提升创作自由度和画面质量的关键一步。尼克尔 Z DX 24mm f 1 7正是这样一款专为轻量化与大光圈设计的定焦镜头,目前京东售价1899元,为追求便携与画质平衡的用户
自动驾驶技术的分级标准正面临行业内部的深度反思与重构。在2026北京车展上,小马智行联合创始人兼CEO彭军发表的观点,将行业关注的焦点从技术参数转向了更为根本的责任归属议题。 彭军明确指出,当前广泛采用的L1至L5自动驾驶分级体系已显得“极其无厘头”。他认为,这些层级划分并非衡量自动驾驶商业化前景的
4月28日,《商业内幕》发布的一篇深度报道,揭示了特斯拉自动驾驶承诺背后日益凸显的信任危机。多年来,“未来将实现完全自动驾驶”是特斯拉吸引消费者的核心卖点,但对于众多早期支持者而言,这一愿景正变得愈发渺茫。 图1:马斯克确认HW3车型无法升级至无监督版FSD 问题的根源在于硬件代际差异。在近期举行的
当AI智能体不仅能说会道,还能帮你订餐、写报告,甚至用周杰伦的风格唱首歌时,汽车行业的竞争焦点,已经悄然从硬件参数转向了软件生态。这届北京车展,就是最好的证明。 “你能让它用周杰伦那种吐字不清的风格,唱首歌吗?”在火山引擎的展台,一位体验者向工作人员提出了这个有趣的要求。指令下达后,座舱里的“豆包”





