Demis Hassabis：达成AGI需先做成两件事

时间：2026-06-19 13:51

通往AGI需先完成两件事：世界模型使AI理解物理与空间，自动实验让AI动手解决基础科学问题。二者形成科研闭环，使AI能自主提问、验证、迭代，而非仅优化模型参数。这是实现真正智能的关键路径。

2025 年 12 月 16 日，Google DeepMind 官方播客推出本季收官之作。本期节目与 Demis Hassabis 深度对话，时长超 50 分钟，全面探讨了人工智能的前沿方向。

这并非产品发布会，也不是单纯的复盘总结。节目开篇即定下基调：呼吁观众“超越产品发布本身”（look beyond the product launches），聚焦未来十年最根本的两大命题。

Hassabis 明确指出：通往通用人工智能（AGI）的路径，必须优先攻克两项核心任务。

第一项是构建世界模型，让 AI 真正理解物理世界与空间规则；第二项是实现自动实验，使 AI 能自主解决材料科学、核聚变等基础难题。更为关键的是，这两项能力必须衔接起来，形成一个完整的科研闭环——AI 能够自行提出问题、验证假设、迭代优化。在 Hassabis 看来，AGI 并非生成式模型的终点，而是科研闭环的起点。

第一节｜世界模型：AI 不止理解语言，更要看懂现实世界

世界模型始终是 Hassabis 的核心研究重点。这并非全新概念，但到了 2025 年，它已成为不可回避的基石。

过去几年，语言模型在写作、问答、总结等方面表现惊人，似乎无所不能。Hassabis 承认，语言中蕴含的世界信息远超预期，甚至超过语言学家的想象。但他也指出了一个矛盾：这些模型能在国际数学奥林匹克竞赛中拿金牌，却在小学几何题上连连出错；能生成惊艳图像，却不理解杯子为什么不会悬浮在空中。

问题根源在于——它们缺乏世界模型。

简而言之，世界模型是 AI 对物理现实的直觉理解能力：比如什么物体可以倾倒、什么会运动、事物如何随时间变化，空间如何构成，时间如何推移。更关键的是，许多信息根本无法用语言描述——传感器数据、电机角度、气味、触感等。人类自幼通过身体感知学会这些，而语言模型只读过文本，从未真正接触物理世界。这就像一个只看了菜谱却从未下过厨房的人。

DeepMind 的应对策略体现在几个产品中：Veo 能理解视频中的运动、液体流动、光线变化；Genie 可即时生成可交互的游戏世界，具备空间结构与物理反馈；Sima 则让 AI 化身在虚拟环境中执行任务，训练出感知、行动、反应的完整能力链条。

有趣的是，Genie 和 Sima 可以相互协作。Genie 生成世界，Sima 在其中探索，两个 AI 形成训练闭环。这意味着 AI 能够自动设定任务、解决任务，难度不断递增，完全无需人类介入。这是继 AlphaGo 之后，DeepMind 第二次尝试让 AI 实现自我进化。

不过也要看到，这些模型目前仅“看起来真实”。如果用牛顿三定律测试，会发现它们只是近似模拟。对于机器人应用来说，精度仍然不够。因此 DeepMind 正在利用游戏引擎创建物理基准，像做高中物理实验一样，测试 AI 是否真正理解了世界的运行规律。

如果你能模拟这个世界，那就说明你真正理解了它。

这也解释了为什么世界模型是 AGI 的前置条件——AGI 的目标不是更好的聊天机器人，而是能在物理世界中行动的智能体。从机器人到 AR 助手，再到终极游戏，所有这些都需要 AI 先理解物理世界如何运作。简单来说，世界模型是 AI 走出纯数字空间的必经之路。

第二节｜自动实验：AI 不只说得像样，更要动手实践

语言模型能讲述故事，世界模型能构建环境，但真正让 AI 参与现实的关键一步，是实验。

Hassabis 表示，做 AlphaFold 时就想证明一件事：AI 不只是工具，它可以成为真正的科研参与者。如今，DeepMind 正将这一理念推向更大规模。

（CNBC：在英国，DeepMind 成立首个全自动化实验室）

就在 2025 年 12 月 10 日，DeepMind 与英国政府达成合作，计划于 2026 年建立其第一座全自动化科学实验室。这是一台从头设计、完全集成 Gemini 的科研引擎。它每天能合成并测试数百种材料，由多学科研究团队监督，但实验执行、数据分析、方向调整主要由 AI 和机器人完成。

研究方向集中在几块硬骨头：更高效的电池材料、室温超导体、新一代低损耗半导体。这些都不是模型生成答案就能解决的问题，而是必须走进实验室、接触物质、通过试错迭代来突破。

与 AlphaFold 相比，区别在哪里？AlphaFold 证明了 AI 可以预测——用算力穷尽蛋白质的可能折叠方式，输出的是数字答案。而自动实验室要证明的是 AI 可以验证——它要真正合成物质、测量性能、发现问题、改进配方。前者是数字世界的突破，后者是物理世界的突破。

Hassabis 表示，这一步的意义不仅在于提升效率，更在于让 AI 真正进入科学的内部流程。过去，AI 辅助的是科研周边工作：文献总结、图像识别、数据标注。现在，它开始参与假设提出、实验设计、数据验证，甚至能反过来修正最初的研究思路。

材料科学是最适合做这件事的领域。因为它既需要大量试错（一个新材料配方可能要测试几千次），又有明确的验证标准（测一下电阻、强度、熔点就知道行不行）。这让 AI 的自主实验成为可能。

速度是关键。Hassabis 提到的室温超导体、聚变材料，都是困扰人类几十年的问题。不是因为理论不够，而是因为试错太慢。如果 AI 能把材料筛选速度提升 100 倍，那能源革命可能真的只需要 10 年。

除了自动实验室，DeepMind 还在与美国核聚变技术研发商 Commonwealth Fusion Systems 合作，用 AI 帮助控制托卡马克反应堆中的等离子体。这是核聚变商业化的最后一道坎。用 Hassabis 的话说：AGI 的前提不是更聪明，而是更能动手。

第三节｜闭环是关键：AI 要能自己提问、动手、再推理

前两节讲的是两件事：世界模型让 AI 看懂世界，自动实验让 AI 动手验证。但真正让 AGI 成为可能的，不是它们各自有多强，而是它们能否连接起来，跑通一个完整的认知闭环。

Hassabis 的原话是：我们过去在训练回答者，现在要训练研究者。

什么意思？关键在于如何让感知和行动形成循环。DeepMind 的做法是：把第一节提到的 Genie 和 Sima 连接起来。Genie 根据需要即时生成场景（比如重力变化、摩擦力变化的环境），Sima 在里面完成挑战（搬箱子、避障、寻找目标）。任务失败或成功，都成为 AI 自我学习的材料。两个 AI 在彼此的思维中互动，却不知道对方是谁。Genie 不知道 Sima 是另一个 AI，只是把它当成玩家。Sima 也不知道世界是 AI 创造的，它只是在完成任务。

这就创造了一个可以无限扩展的训练循环：Sima 想学什么，Genie 就能即时创造什么。你可以自动设置和解决数百万个任务，难度不断递增，完全不需要人类介入。

把这个循环抽象出来，你会看到一个完整的科研流程：提出问题（要解决什么？）→ 生成场景（在哪种条件下测试？）→ 执行任务（模拟、行动、实验）→ 整理反馈（数据、结论、优化）→ 再提出更好的问题（迭代进入下一轮）。这个过程，过去只有科学家在做。现在，AI 开始具备类似能力。

这个循环不只是为了训练更好的模型。Hassabis 提到，同样的技术可以用来创造更智能的游戏 NPC，也可以用来训练机器人。因为机器人需要的能力和游戏智能体高度重叠：感知环境、规划路径、执行动作、从失败中学习。

Genie+Sima 形成的虚拟闭环，和第二节提到的自动实验室，构成了两个平行的自主研究系统：一个在数字世界跑通逻辑，一个在物理世界验证假设。所以，AGI 不只是一个更大的模型，而是一个能自己生成任务、动手验证、推理更新的智能体。简单说，它必须能像研究者那样工作。

结语｜AGI 的门口，不在参数里

Hassabis 给出的这条通往 AGI 的路线，不依赖更大模型，也不依赖更强算力，而是依靠 AI 真正“理解世界”和“改变世界”的能力。世界模型是基础，让 AI 看清因果；自动实验是手段，让 AI 验证认知。这不是模型优化，而是智能的重构。

未来，AI 会自己提问、自己试验、自己修正。到那时，我们对知识、科学甚至思维的定义，可能都得重新写一遍。

来源：https://www.aiagiai.com/15695.html

上一篇英伟达超600人调研报告揭示AI医疗未来发展方向 下一篇AI时代品牌官网打造与存量内容激活的方法

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。