2025 年 12 月 16 日,Google DeepMind 官方播客推出本季收官之作。本期节目与 Demis Hassabis 深度对话,时长超 50 分钟,全面探讨了人工智能的前沿方向。
这并非产品发布会,也不是单纯的复盘总结。节目开篇即定下基调:呼吁观众“超越产品发布本身”(look beyond the product launches),聚焦未来十年最根本的两大命题。
Hassabis 明确指出:通往通用人工智能(AGI)的路径,必须优先攻克两项核心任务。
第一项是构建世界模型,让 AI 真正理解物理世界与空间规则;第二项是实现自动实验,使 AI 能自主解决材料科学、核聚变等基础难题。更为关键的是,这两项能力必须衔接起来,形成一个完整的科研闭环——AI 能够自行提出问题、验证假设、迭代优化。在 Hassabis 看来,AGI 并非生成式模型的终点,而是科研闭环的起点。
第一节|世界模型:AI 不止理解语言,更要看懂现实世界
世界模型始终是 Hassabis 的核心研究重点。这并非全新概念,但到了 2025 年,它已成为不可回避的基石。
过去几年,语言模型在写作、问答、总结等方面表现惊人,似乎无所不能。Hassabis 承认,语言中蕴含的世界信息远超预期,甚至超过语言学家的想象。但他也指出了一个矛盾:这些模型能在国际数学奥林匹克竞赛中拿金牌,却在小学几何题上连连出错;能生成惊艳图像,却不理解杯子为什么不会悬浮在空中。
问题根源在于——它们缺乏世界模型。
简而言之,世界模型是 AI 对物理现实的直觉理解能力:比如什么物体可以倾倒、什么会运动、事物如何随时间变化,空间如何构成,时间如何推移。更关键的是,许多信息根本无法用语言描述——传感器数据、电机角度、气味、触感等。人类自幼通过身体感知学会这些,而语言模型只读过文本,从未真正接触物理世界。这就像一个只看了菜谱却从未下过厨房的人。
DeepMind 的应对策略体现在几个产品中:Veo 能理解视频中的运动、液体流动、光线变化;Genie 可即时生成可交互的游戏世界,具备空间结构与物理反馈;Sima 则让 AI 化身在虚拟环境中执行任务,训练出感知、行动、反应的完整能力链条。
有趣的是,Genie 和 Sima 可以相互协作。Genie 生成世界,Sima 在其中探索,两个 AI 形成训练闭环。这意味着 AI 能够自动设定任务、解决任务,难度不断递增,完全无需人类介入。这是继 AlphaGo 之后,DeepMind 第二次尝试让 AI 实现自我进化。
不过也要看到,这些模型目前仅“看起来真实”。如果用牛顿三定律测试,会发现它们只是近似模拟。对于机器人应用来说,精度仍然不够。因此 DeepMind 正在利用游戏引擎创建物理基准,像做高中物理实验一样,测试 AI 是否真正理解了世界的运行规律。
如果你能模拟这个世界,那就说明你真正理解了它。
这也解释了为什么世界模型是 AGI 的前置条件——AGI 的目标不是更好的聊天机器人,而是能在物理世界中行动的智能体。从机器人到 AR 助手,再到终极游戏,所有这些都需要 AI 先理解物理世界如何运作。简单来说,世界模型是 AI 走出纯数字空间的必经之路。
第二节|自动实验:AI 不只说得像样,更要动手实践
语言模型能讲述故事,世界模型能构建环境,但真正让 AI 参与现实的关键一步,是实验。
Hassabis 表示,做 AlphaFold 时就想证明一件事:AI 不只是工具,它可以成为真正的科研参与者。如今,DeepMind 正将这一理念推向更大规模。

(CNBC:在英国,DeepMind 成立首个全自动化实验室)
就在 2025 年 12 月 10 日,DeepMind 与英国政府达成合作,计划于 2026 年建立其第一座全自动化科学实验室。这是一台从头设计、完全集成 Gemini 的科研引擎。它每天能合成并测试数百种材料,由多学科研究团队监督,但实验执行、数据分析、方向调整主要由 AI 和机器人完成。
研究方向集中在几块硬骨头:更高效的电池材料、室温超导体、新一代低损耗半导体。这些都不是模型生成答案就能解决的问题,而是必须走进实验室、接触物质、通过试错迭代来突破。
与 AlphaFold 相比,区别在哪里?AlphaFold 证明了 AI 可以预测——用算力穷尽蛋白质的可能折叠方式,输出的是数字答案。而自动实验室要证明的是 AI 可以验证——它要真正合成物质、测量性能、发现问题、改进配方。前者是数字世界的突破,后者是物理世界的突破。
Hassabis 表示,这一步的意义不仅在于提升效率,更在于让 AI 真正进入科学的内部流程。过去,AI 辅助的是科研周边工作:文献总结、图像识别、数据标注。现在,它开始参与假设提出、实验设计、数据验证,甚至能反过来修正最初的研究思路。
材料科学是最适合做这件事的领域。因为它既需要大量试错(一个新材料配方可能要测试几千次),又有明确的验证标准(测一下电阻、强度、熔点就知道行不行)。这让 AI 的自主实验成为可能。
速度是关键。Hassabis 提到的室温超导体、聚变材料,都是困扰人类几十年的问题。不是因为理论不够,而是因为试错太慢。如果 AI 能把材料筛选速度提升 100 倍,那能源革命可能真的只需要 10 年。
除了自动实验室,DeepMind 还在与美国核聚变技术研发商 Commonwealth Fusion Systems 合作,用 AI 帮助控制托卡马克反应堆中的等离子体。这是核聚变商业化的最后一道坎。用 Hassabis 的话说:AGI 的前提不是更聪明,而是更能动手。
第三节|闭环是关键:AI 要能自己提问、动手、再推理
前两节讲的是两件事:世界模型让 AI 看懂世界,自动实验让 AI 动手验证。但真正让 AGI 成为可能的,不是它们各自有多强,而是它们能否连接起来,跑通一个完整的认知闭环。
Hassabis 的原话是:我们过去在训练回答者,现在要训练研究者。
什么意思?关键在于如何让感知和行动形成循环。DeepMind 的做法是:把第一节提到的 Genie 和 Sima 连接起来。Genie 根据需要即时生成场景(比如重力变化、摩擦力变化的环境),Sima 在里面完成挑战(搬箱子、避障、寻找目标)。任务失败或成功,都成为 AI 自我学习的材料。两个 AI 在彼此的思维中互动,却不知道对方是谁。Genie 不知道 Sima 是另一个 AI,只是把它当成玩家。Sima 也不知道世界是 AI 创造的,它只是在完成任务。
这就创造了一个可以无限扩展的训练循环:Sima 想学什么,Genie 就能即时创造什么。你可以自动设置和解决数百万个任务,难度不断递增,完全不需要人类介入。
把这个循环抽象出来,你会看到一个完整的科研流程:提出问题(要解决什么?)→ 生成场景(在哪种条件下测试?)→ 执行任务(模拟、行动、实验)→ 整理反馈(数据、结论、优化)→ 再提出更好的问题(迭代进入下一轮)。这个过程,过去只有科学家在做。现在,AI 开始具备类似能力。
这个循环不只是为了训练更好的模型。Hassabis 提到,同样的技术可以用来创造更智能的游戏 NPC,也可以用来训练机器人。因为机器人需要的能力和游戏智能体高度重叠:感知环境、规划路径、执行动作、从失败中学习。
Genie+Sima 形成的虚拟闭环,和第二节提到的自动实验室,构成了两个平行的自主研究系统:一个在数字世界跑通逻辑,一个在物理世界验证假设。所以,AGI 不只是一个更大的模型,而是一个能自己生成任务、动手验证、推理更新的智能体。简单说,它必须能像研究者那样工作。
结语|AGI 的门口,不在参数里
Hassabis 给出的这条通往 AGI 的路线,不依赖更大模型,也不依赖更强算力,而是依靠 AI 真正“理解世界”和“改变世界”的能力。世界模型是基础,让 AI 看清因果;自动实验是手段,让 AI 验证认知。这不是模型优化,而是智能的重构。
未来,AI 会自己提问、自己试验、自己修正。到那时,我们对知识、科学甚至思维的定义,可能都得重新写一遍。
