游乐游手机版
首页/科技数码/文章详情

谷歌研究:DeepSeek推理模型如何通过“脑内群聊”优化AI智能

时间:2026-01-20 20:52
据量子位,谷歌最新研究发现,DeepSeek-R1等顶尖推理模型在解题时,内部会自发“分裂”出不同性格的虚拟人格,如外向、严谨、多疑等。这些人格在模型解题过程中展开激烈的社交与辩论,类似“左右脑互搏

最近,谷歌的一项研究表明,像DeepSeek-R1这样的顶尖推理模型在解决复杂问题时,其内部会自发“分裂”出性格迥异的虚拟人格,比如外向型、严谨型或多疑型。这些不同的人格在模型思考过程中会展开激烈的社交与辩论,类似于人类“左右脑互搏”,从而使模型越“吵”越聪明。研究进一步揭示,当面对高难度任务时,这种内部冲突会更加明显且有益,而在处理简单任务时则会显著减少。

研究团队通过分析DeepSeek-R1和QwQ-32B等模型的思维轨迹发现,它们的推理过程充满对话感,内部裂变出的虚拟角色性格各异,能覆盖更多解题视角。例如,创意型角色负责提出新颖思路,批判型角色专司挑错补漏,而执行型角色则负责将方案落地验证。值得注意的是,这种多角色互动并非开发人员刻意设计,而是模型在追求推理准确性的过程中自发形成的机制。

借助稀疏自编码器(SAE),研究人员成功“监听”到了AI的“脑内群聊”。通过提取模型隐藏层神经元的激活数值,并利用SAE的稀疏约束机制,将复杂的信号拆解为独立的对话语义特征,从而识别出不同的内部逻辑实体,并为其打上虚拟角色标签,最终解码了AI内部多角色对话的行为模式。

实验数据表明,推理模型出现对话式行为的频率显著高于普通的指令模型。一个有趣的发现是,当强化模型的对话特征,例如放大“哦!”这类表达惊讶或转折的语气标记时,模型在算术推理任务中的准确率会得到显著提升。此外,在强化学习训练中,模型会自发学会使用对话式思考,并且那些预先经过多智能体对话数据微调的模型,在推理训练中的进步速度远超直接训练或使用独白式推理数据微调的模型。

这一发现呼应了人类演化生物学中的“社会脑假说”,即大脑的进化是为了应对复杂的社交关系和群体互动需求。如今,AI似乎也在通过与不同“人格”的社交互动来提升其智能水平。

来源:https://www.163.com/dy/article/KJOB5C3D0519U3I5.html
上一篇首发英伟达笔记本N1X芯片解析:将独显融入SoC的突破 下一篇福特CEO为轿车停产辩护:无法在竞争中实现盈利
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5