首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
DeepMind终结十年争论:GPT-5倚仗世界模型实现关键推理

DeepMind终结十年争论:GPT-5倚仗世界模型实现关键推理

热心网友
12
转载
2025-10-31

【导读】GPT-5令人惊艳之处,不只是文笔流畅,更在于它展现出强大的推理能力。近期一项研究揭开了背后的秘密:通用智能体之所以聪明,并非因为参数更多,而是它们在“大脑”中悄然构建起一张“世界模型”。这幅无形的认知地图,也正在重塑我们对AI的理解。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

GPT-5正式推出后,最让人震撼的并非其吟诗作画的本领,而是它在逻辑推理上的惊人表现。

网友感叹:“感觉像是在和博士讨论问题”,更有媒体直言它的逻辑水平已经“堪比专家”。

为什么会出现这种“思维飞跃”的效果?

最新发布的研究论文给出了答案:

通用智能体能进行推理,不靠死记硬背,而是因为它们在神经网络中悄然生成了对现实世界的抽象表征。

论文传送门:https://arxiv.org/pdf/2506.01622

是模仿还是思考?学界争论了十年之久

究竟什么是“世界模型”?简单来说,它就是AI对现实规律的预测图谱。

对人类而言,我们天生具备预测的能力:

球在桌边滚动→它可能会掉下去

开车时看到红灯→如果不刹车可能引发事故

两个人对话,其中一人说“我饿了”→下一步很可能要寻找食物

那么对于AI来说,它是如何形成这种能力的呢?

在过去的十几年里,学界一直在争论——AI到底仅靠模仿(无模型学习),能否真正解决复杂问题?

“模仿派”认为,只要有足够多的数据加上强大的算力,AI就能像条件反射一样给出正确答案。

在GPT-3.5时代,大部分AI的回答都像在“背诵题库”,有时蒙对,有时则完全错误。

与此相对的则是“思考派”。他们坚持认为,如果没有形成对现实的理解框架,AI永远只是机械的复读机。

一旦问题需要多步逻辑推理,比如解数学题、规划一个流程,纯模仿型AI就会掉链子。

最近,一项研究为这些争论按下了终止键:

任何一个智能体只要能完成多步骤的复杂目标任务,它的策略中就必然隐含了对环境的认知模型。

在学术框架中,“目标、策略、世界模型”曾经像缺了一角的三角形。

已知世界模型和目标,可以推导出最优策略;已知策略和世界模型,可以反推出目标。

图1 目标g、策略π、世界模型p之间的三角关系

而现在最后一角也被补齐——只要知道智能体的策略和目标,就能恢复出它对环境的理解模型。

这个推导让“世界模型不可或缺”的结论更加稳固。

也就是说,GPT-5之所以能展现惊人的推理能力,是因为它在训练过程中,逐步形成了对现实规律的内在表征。

可以说,没有世界模型,就没有真正的通用智能。

探究AI大脑里的认知地图

仅有理论还不够,研究团队决定深入验证。

既然说智能体一定会“形成”世界模型,那么我们能否在实验室里,把这张隐形的“认知地图”提取出来?

为AI搭建的“迷你世界”

为了验证AI体内是否真的存在世界模型,研究团队设计了一个巧妙的实验。

他们搭建了一个虚拟世界,里面只有几个状态(X、Y),它们会按一定概率互相跳转。

然后研究人员将任务交给智能体,让它自主探索这个世界。

最后,研究人员尝试仅根据智能体的行为表现,反推出它对状态转换规律的认知。

图2 智能体-环境系统示意图

任务越复杂,误差反而越小

刚开始,智能体在简单目标里横冲直撞,恢复出来的世界模型差错很多,还有一堆错误。

可当任务变得复杂(比如要先到X,再转到Y),情况就完全不同:它会自动构建更精细的“状态转移概率表”。

随着任务难度增加,世界模型的误差迅速下降。

图3 任务复杂度vs世界模型误差曲线

无论是训练样本还是任务深度,结果都指向同一个结论——任务越复杂,世界模型越精确。

实验员还尝试了更复杂的目标组合:智能体需要在不同状态之间来回跳转,才能完成目标。

图4 复合目标实验示意图

没有认知地图,就没有真正智能

数学推理也印证了这一点。

实验表明,只要一个智能体在复杂任务中不会频繁犯低级错误,始终保持有限的“后悔值”,它的策略中就必然已经包含了环境的转移规律。

也就是说——世界模型不是AI的附加功能,而是它进化的必需品。

智能体越强大,内心构建的“认知地图”就越精确。

这就是为什么GPT-5会让人觉得“突然会推理了”,其实是它脑内的世界模型日渐清晰的体现。

一幅认知地图带来的希望与隐忧

实验告诉我们:只要AI能完成复杂任务,它的大脑里就一定存在某种“世界模型”。

这也解释了近来备受关注的“涌现能力”现象。

研究表示,这并非魔法,而是AI在完成任务过程中,认知模型逐步清晰的必然结果。

我们以为GPT-5突然学会了推理,其实是它在任务进程中,内部的世界模型逐渐明晰,于是能力自然显现。

这让人类看到了希望:如果世界模型真的存在,我们或许有机会把它抽取出来,借此理解AI的内心世界。

未来,当它变得更强大时,这或许能成为破解黑箱、提升安全性的关键。

但这也埋下了隐忧的种子。

真实世界远比实验室复杂,AI学到的地图或许是模糊的,甚至与人类理解不一致。

可能它觉得安全,而我们觉得危险。

对研究者来说,这同样是一个转机。

既然世界模型必然存在,那么我们或许能在未来把它抽取出来,用以解释和验证AI的决策依据。

这意味着,破解“黑箱”不再只是愿景,而有了真正的理论支撑。

所以,GPT-5带来的震撼不只是“它会推理”,更深层的意义在于:AI已经能在大脑中构建自己的认知地图。

而这幅地图,既可能是通往智慧之路的通行证,也可能成为未来不确定性的源头。

参考资料:

https://arxiv.org/abs/2506.01622

来源:https://36kr.com/p/3532732831603585
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查
web3.0
美国SEC主席Paul Atkins证实:加密货币安全港提案已送交白宫审查

加密货币行业翘首以盼的监管里程碑,终于有了实质性进展。美国证券交易委员会(SEC)主席保罗·阿特金斯(Paul Atkins)近日证实,那份允许加密项目在早期获得注册豁免权的“安全港”框架提案,已经正式送抵白宫,进入了最终审查阶段。 在范德堡大学与区块链协会联合举办的数字资产峰会上,阿特金斯透露了这

热心网友
04.08
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币
web3.0
微策略Strategy报告:第一季录得144.6亿美元浮亏 再斥资约3.3亿美元买进4871枚比特币

微策略Strategy报告:第一季录得144 6亿美元浮亏 再斥资约3 3亿美元买进4871枚比特币 市场震荡的威力有多大?看看Strategy的最新季报就明白了。根据其最新向美国证管会(SEC)提交的8-K报告,受市场剧烈波动影响,这家公司所持的比特币在第一季度录得了一笔惊人的数字——144 6亿

热心网友
04.08
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch
web3.0
稳定币发行商Tether再扩Web3版图!Paolo Ardoino:正开发去中心化搜索引擎Hypersearch

稳定币巨头Tether的动向,向来是加密世界的风向标。这不,它向Web3基础设施的版图扩张,又迈出了关键一步。公司执行长Paolo Ardoino在社交平台X上透露,其工程团队正在全力“烹制”一个新项目——去中心化搜索引擎 “Hypersearch”。这个消息一出,立刻引发了行业的广泛猜想。 采用D

热心网友
04.08
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线
web3.0
Base链首个原生DeFi借贷协议Seamless Protocol倒闭 将于2026年6月30日下线

基地位于Coinbase旗下以太坊Layer2网络Base的Seamless Protocol,日前正式宣告了服务的终结。这个曾经吸引了超过20万用户的原生DeFi借贷协议,在运营不到三年后,终究没能跑赢时间。它主打的核心产品是Integrated Leverage Markets(ILMs)——一

热心网友
04.08
PAAL代币如何参与治理?社区投票能决定哪些事项?
web3.0
PAAL代币如何参与治理?社区投票能决定哪些事项?

PAAL代币揭秘:深度解析Web3社区治理的核心钥匙 在去中心化自治组织的浪潮中,谁真正掌握了项目的话语权?PAAL代币提供了一套系统化的答案。它不仅是生态内流转的价值媒介,更是开启链上治理大门的核心凭证。通过持有并质押PAAL代币,用户能够对协议升级、资金分配乃至战略方向等关键事务投出决定性的一票

热心网友
04.08