AI何时能超越爱因斯坦？诺奖得主Demis Hassabis揭秘人工智能科学极限_AI热点日报

在科学智能的浪潮里，如果要找一位兼具远见与实绩的领航者，谷歌DeepMind的创始人兼首席执行官、诺贝尔化学奖得主德米斯·哈萨比斯，无疑是绕不开的名字。最近，在知名学术期刊《Dædalus》上，谷歌母公司Alphabet的高级副总裁詹姆斯·M·马尼卡采访了数十位人工智能科学家，核心议题

在科学智能的浪潮里，如果要找一位兼具远见与实绩的领航者，谷歌DeepMind的创始人兼首席执行官、诺贝尔化学奖得主德米斯·哈萨比斯，无疑是绕不开的名字。

最近，在知名学术期刊《Dædalus》上，谷歌母公司Alphabet的高级副总裁詹姆斯·M·马尼卡采访了数十位人工智能科学家，核心议题直指一个宏大命题：“在人工智能的新时代，科学发现的未来是什么？”哈萨比斯正是其中一位关键对话者。

在这场对话中，哈萨比斯展现了他一向的前瞻性思维，围绕现实的本质、AI的边界与科学的奥秘，分享了一系列大胆而深刻的见解。他甚至提出了一个引人深思的猜想：信息，或许才是物理学中最基本的单位，比物质和能量更为根本，是理解宇宙真实本质的最佳途径。同时，他也对“真正的通用人工智能还需跨越哪些关键障碍”给出了具体而独到的分析。

以下内容基于《Dædalus》上马尼卡对哈萨比斯的采访编译整理而成。

科学为何重要？

驱动哈萨比斯始终向前的，是一种深入理解周遭世界的强烈渴望。在他看来，科学方法是人类为推进知识进步所创造的最伟大的思想工具。置身于知识的最前沿，去拓展边界，首次发现全新事物——没有比这更令人兴奋的事了，这恰恰是科学极致的魅力所在。

从工程师到科学家

如今，哈萨比斯首先将自己视为一名科学家。但这条路并非一开始就如此清晰。早年在剑桥大学攻读计算机科学、为游戏编写AI程序时，他更多自视为一名工程师。后来，随着他对大脑研究的长期兴趣被点燃，转而投身认知神经科学，并在博士阶段专注于记忆与想象力的研究，他才意识到自己最擅长的工作方式其实是科学家的模式：提出关于世界的假说，并设计实验去验证或推翻它。

当然，务实的一面从未离开。他始终关注现实世界的影响力——这大概是他脑中工程师那一半仍在发挥作用。他不会沉溺于纯粹的理论争论，而是倾向于思考如何构建工具或设计实验来验证想法。AlphaGo和AlphaFold就是这种思维方式的绝佳例证。

哪些科学成就最令人受启发？

哈萨比斯非常钦佩文艺复兴和古希腊时期的博学家，比如亚里士多德、达·芬奇这样的巨匠。因为他们从不认为学科之间存在不可逾越的界限。这种跨界思维令人着迷，因为它能让人发现看似迥异领域之间隐藏的联系。有理由相信，未来十年到二十年里，最重大的进展将恰恰来自这些交叉地带，而人工智能将通过发现不同领域之间的共性或交汇点来扮演关键角色。

同样启发他的，还有那些凭借巨大想象力和直觉完成的飞跃——回望历史，它们仿佛凭空而来。爱因斯坦、牛顿、玻尔、拉马努金、费曼是他最钟爱的几位。这些科学家和数学家的头脑，如同一个融合了各种思想、专长和兴趣的熔炉，最终对世界的运作方式做出了直觉性的、跨越式的洞察。

尚未解决的最重要科学问题

哈萨比斯进入科学和人工智能领域，源于从小就困扰他的一些终极问题：现实的本质是什么？意识是什么？时间是什么？引力如何与量子世界相协调？令人惊讶的是，过去五十多年里，其中一些根本性问题进展甚微，部分原因在于它们过于复杂。

他一直坚信，人工智能有潜力成为推动知识前沿的终极工具。无论是通过处理海量数据，还是协助人类提出新的猜想，AI都能帮助我们攻克这些根本性的难题。

现实本质与计算视角

有一个问题始终让哈萨比斯深感兴趣：什么是经典计算机或图灵机可以建模的，什么是无法建模的？而答案又能告诉我们关于现实本质的什么信息。自然界中的大多数事物都具有稳定的结构，这些结构随时间演化并存续下来——细胞的行为、山脉的形状，甚至行星的轨道。这意味着应该存在某种模式或过程，是神经网络可能学习得到的。像AlphaFold这样的人工智能系统已经证明，我们能用经典计算机建模远比过去想象的更复杂的系统。

或许在极限情况下，大多数自然系统都可以被经典系统模拟或学习——某种程度上是进行逆向工程。这将支持他的一个核心猜想：信息是物理学中最基本的单位，比物质和能量更为根本，是理解宇宙真实本质的最佳途径。

为何信息可能是最基础层面？

传统上，物理学将能量和物质视为第一性。我们可以观察和测量它们。随后，计算机科学的奠基者们——克劳德·香农、艾伦·图灵、约翰·冯·诺依曼——引入了信息熵、信息的度量、互信息等关键概念。但他们的工作晚于物理学家，因此他们试图将信息论纳入物理学的现有框架。也许，顺序应该反过来，物理学应该以信息为框架来重新构建。

这个概念当然也与图灵机相关，即什么样的问题可以在经典系统上可计算。物理学家假设宇宙是一个量子系统，而经典系统由于量子系统的巨大复杂性而无法对其建模。但如果事实证明，自然界中更多的物理过程实际上能够被经典系统精确建模，那对我们理解物理学可能会产生重要的启示。

归根结底，哈萨比斯对现实的本质最感兴趣，并且质疑我们目前对量子系统的理解是否就是全部。他怀疑我们最终可能会为所见的现象找到一个更简单的底层描述，而该描述更易于被经典系统建模。如果我们把世界看作一个可计算的宇宙，就更有可能发现这一点。

计算视角下的难题与边界

如果采用信息或可计算性的视角看世界，我们确实会遇到一些根本性的难题，比如柯尔莫哥洛夫复杂性、P是否等于NP（即问题是否能在可行时间内求解）、或者图灵机中的停机问题。这些都可能潜在地限制计算方法能走多远，而它们本身也正是值得检验和理解的有趣边界。

P是否等于NP，是科学中最重要的问题之一。它试图通过求解和验证一个解分别需要多少计算量来对问题的难度进行分类。哈萨比斯猜测P不等于NP，有些问题如果不借助比如量子计算机的帮助，实际上无法在可行的时间内求解。但这可能比我们过去意识到的更加微妙。

在AlphaGo和AlphaFold的工作中，他们证明了如果进行大量的预计算，你似乎可以在多项式时间内以近似最优的方式回答一些极其复杂的问题。神经网络实质上是在利用海量的预计算，将知识压缩成某种高效的“工件”。这个计算得出的“工件”在测试时可用，对于许多自然系统而言，你可以用它来缩小搜索空间，从而不必考虑所有可能的构型，而只需关注那些实际可行的、远小于全集的那部分。

以蛋白质为例，一个普通蛋白质大约有10^300种可能的构象。如果穷举所有可能来找出它实际折叠成的特定形状，所需时间比宇宙的年龄还要长。因此你必须采取更巧妙的方法——你需要学习氨基酸序列存在哪些模式，然后只搜索极小一部分可能性，以找到近似正确的解。这似乎正是AlphaFold所做到的。也许并非完美，但至少达到了足以用于实际目的的近似精度。

类似地，围棋棋局中大约有10^170种可能的局面；仅凭简单的启发式搜索和纯粹的蛮力计算，根本无法找到最优解。而AlphaGo的做法是：学习一个关于合理围棋落子的优秀模型，从而只需考虑最有价值的那几条行棋路径，然后从这个大大缩减的选项集合中，找出最可能导向胜利的最佳落子。

在成功驾驭这些巨大搜索空间的过程中，发生了一些非常有趣的现象。其意义可能相当深远。由于在人工智能领域所看到的进展，我们得以近距离观察这些根本性问题——不仅来自AlphaGo、AlphaFold，也来自像Veo 3这样的视频模型。它们仅仅通过观看几十亿个视频，就能对现实的某些方面进行建模。它们能够逆向推导出某种直觉物理学的规律：液体如何流动、玻璃中的反射、物体投射的阴影——这看起来相当惊人。

所有这些都在告诉我们关于物理学底层本质的某些信息，包括图灵机的极限在哪里，在哪些情况下又需要借助量子系统，进而也告诉我们关于现实本质本身的一些东西。人工智能对所有这些问题的研究都具有深远意义。

AlphaFold的启示

AlphaFold似乎完美印证了哈萨比斯的观点——自然界具有能够被神经网络建模或学习的稳定结构。这个项目旨在解决蛋白质折叠（即蛋白质结构预测）问题。从一个氨基酸序列（可以粗略理解为蛋白质的基因序列，一维的字母串）出发，预测它会在体内折叠成怎样的三维结构，而这个结构在很大程度上决定了蛋白质的功能。

预测这些结构是生物学领域一个长达五十年的重大挑战。他们最终用AlphaFold解决了它——至少达到了原子级别的精度，这也是实验人员认为有用的精度水平。

他们的做法是：利用过去三十到四十年间，结构生物学家们利用电子显微镜等昂贵设备解析出的约15万个已知结构数据。这些数据恰好足以为AI系统提供关于蛋白质拓扑结构的线索。蛋白质并非随机折叠，而是存在某些物理和化学约束，AI系统学习到了这些规律。最终它能够在几秒钟内，针对一个从未见过的蛋白质给出一个合理的预测结构。随后，在一年时间里，他们折叠了科学界已知的所有约两亿个蛋白质，并与欧洲生物信息学研究所的同事合作，将它们免费开放，供全球研究人员使用。

从蛋白质到细胞：下一个目标

AlphaFold 2本质上预测的是蛋白质的静态快照结构。但生物学是一个动态系统，需要理解蛋白质之间的相互作用，以及它们如何改变自身的形态和行为。

AlphaFold 3是迈出的下一步。现在可以预测蛋白质与蛋白质、蛋白质与配体、蛋白质与RNA、蛋白质与DNA之间的所有成对相互作用。基本上，所有生命分子及其成对相互作用都可以用AlphaFold 3来建模。

但要扩展到整个细胞，还需要做得更好。因为存在级联的相互作用，涉及不止两个生物分子，显然极其复杂。下一阶段可能是对一个通路进行建模，然后可能是一个简单的细胞，比如酵母细胞——它本身就是一个完整的生物体。如果成功了，也许可以模拟来自更复杂生物体的某个细胞器，最终模拟整个生物体。

这个梦想哈萨比斯已经怀揣了二十多年。其构想是：建立一个足够真实的细胞模拟系统，使得在计算机上进行的实验可能比湿实验室快若干个数量级。这样，实验室就留给验证步骤和结果的确证，而不是用于探索阶段。一个虚拟细胞不仅对基础生物学，对药物研发也是难以置信的巨大福音。

科学智能的共性特征

DeepMind涉足的科学领域很广，包括物理、化学、天气、气候系统等。这些领域的共同特征是否在于它们都是自然系统，因此天然适合被学习？

在判断一个问题是否适合用当前的人工智能技术来解决时，哈萨比斯团队会考察三个方面。第一，该问题能否被描述或转化为一个巨大的组合空间的描述？可能这个空间大得难以处理，常规的蛮力方法行不通。第二，如果确实如此，是否有足够的数据来学习该空间拓扑结构的某种模型？或者是否存在或可学习一个模拟器，能够生成一些额外的合成数据？理想情况下，两者兼备。第三，需要一个明确的目标——最小化或最大化某个量。在游戏中，那就是赢棋或最大化得分。在自然系统中，可能是最小化该系统的自由能。如果你能量化这个目标，就可以利用模型在目标函数的引导下搜索最优解。事实证明，很多问题都符合这一描述。

除此之外，他们还会寻找那些一旦解决就能产生巨大影响的问题。如果把整个知识体系想象成一棵树，那么存在一些根节点式的问题——一旦解决了它们，就会解锁全新的研究分支。蛋白质折叠无疑是其中之一，它为药物研发和疾病理解开启了新的机遇。无论是聚变能源、天气系统、材料设计，还是基础数学——他们尝试解决的所有问题都具备这些特征。

数学中的结构

并非直观上就能认为所有数学都具有结构——至少不是我们能理解的那种结构。素数的分布或许是一个很好的例子。

关于数字中到底存在多少结构，这仍然是一个悬而未决的问题。哈萨比斯猜测结构相当丰富，因为数学正是为了描述现实世界而发展起来的，而现实世界确实具有结构，数学似乎也能非常好地完成这一任务。

有些卓越的数学家，比如斯里尼瓦瑟·拉马努金，他极具直觉，常常不经过所有中间步骤就直接得出惊人的结论，以至于他觉得这些想象力的飞跃是受到了神启。我们称之为隐性知识或直觉，因为我们无法有意识地获取它，也无法用结构化的方式明确解释它。

但直觉并非魔法——它只是我们用来描述大脑通过经验获得的隐性知识的词语。在某些领域非常擅长的人，比如音乐家，拥有极其高效且高度抽象的隐性知识版本。即便如此，背后依然存在一个过程，在极限情况下，这个过程是可以被人工智能系统建模的。

他们正在将人工智能应用于数学，并且已经初步看到了可被建模的迹象。最新的Gemini模型Deep Think在国际数学奥林匹克竞赛中达到了金牌级别的水平——这是面向全球顶尖高中生的一项极具难度的数学挑战。该模型接收一个自然语言描述的问题，将其转换为形式化的数学语言，然后通过迭代方式求解：执行一系列数学运算，直到得出一个可验证的正确证明。

但这与理解数字中是否存在模式或数学中是否存在结构是截然不同的。后者需要另一种类型的系统。两者都很有趣——人工智能既能解决数学猜想，也能发现数学中更深层的模式——而且两者可能都是可行的。

当前AI的局限与所需突破

缺失的一点——也是哈萨比斯认为当今系统尚未接近通用人工智能的原因之一——是它们不具备真正的创造力。这里所说的创造力是指：一个人工智能系统不仅能解决一个难题，而且能真正提出一个优美且有意义的猜想，比如千禧年大奖难题或黎曼猜想。这要困难得多。提出正确的问题是科学中最难的部分。哪个假设值得探索、值得为此做科学研究？我们尚未完全理解这种层次的创造力在人类专家中是如何运作的，而当前的人工智能系统当然也还不具备这种能力。

当前人工智能系统缺失的另一个特征是一致性。一方面，这些系统能解决非常复杂的奥数难题；另一方面，如果你把问题的表述方式稍作改变，系统就可能在初等数学上犯错。人类数学家不会这样——他们会在整个领域内保持能力的一致性。

通用人工智能意味着什么？

哈萨比斯一直将通用人工智能定义为一个能够展现人类心智所具备的所有认知能力的系统。这是一个关键的参照点，因为人脑是目前已知唯一一个证明通用智能确实存在的实例。人脑具有极强的通用性和适应性——令人惊叹的是，我们的大脑是为狩猎采集而进化出来的，但我们却能发明科学方法，建造出从望远镜、喷气机到计算机的现代文明奇迹。历史上伟大的艺术家、科学家和哲学家的才智，都源于这个同样非凡的大脑结构。在他看来，直到我们能够完全匹配大脑结构所能做到的一切，我们才能真正确信自己构建了一个完全的通用系统。

从理论角度看，这个定义与图灵机的概念密切相关。艾伦·图灵曾提出著名猜想：给定无限的时间和内存，图灵机可以计算任何算法。人脑可以被视为图灵机的一种生物学近似，这意味着从理论上讲，它可以学习任何可计算的东西。然而，与任何有限系统一样，由于时间、内存和信息总是有限的，必然存在一定程度的专门化。没有哪个实用系统能同时针对所有可能的任务进行优化——我们无法规避“没有免费午餐”定理。但关键在于，人脑具有学习几乎任何事物的潜能，尤其是当我们能够设计和建造工具与机器来帮助我们获取知识时。

任何候选的通用人工智能系统都应该具备全面的一致性，能够覆盖人类能力的惊人广度——包括能够实现真正直觉性的发现飞跃，提出有价值的新颖假说或猜想。这可以通过以下方式测试：训练一个知识截止于1910年的人工智能系统，看看它是否能像爱因斯坦在1915年那样提出广义相对论。就目前而言，答案显然是不能。

基础模型如今能做到的事情已经极其令人印象深刻，而且毫无疑问它们最终将成为任何未来通用人工智能系统的骨干。仅靠进一步扩展现有模型是否就足以达到通用人工智能，这是一个有待实证检验的开放性问题。如果仍然需要少量类似于Transformer或深度强化学习级别的突破，也不会令人惊讶。因此，在Google DeepMind，他们继续不懈地同时推进规模扩展与创新前沿。

如何判断通用人工智能的到来？

在评估是否实现了通用人工智能时，一方面可以使用一系列测试，另一方面也许会出现某种直觉性的飞跃或火花——就像AlphaGo对战李世石时走出的那步超越人类直觉的第37手——然后我们会说：“啊，我觉得我们做到了！”是需要两者兼备，还是其中之一即可？

哈萨比斯认为两者都需要。这是人类历史上极其重要的时刻，应该以真正科学和审慎的态度来确认。应该出现相当多显而易见的发明或创造实例——比如有新的物理学被发明出来，或者提出了被数学家们认为极具意义的猜想。不仅仅是像AlphaGo那样在围棋中想出一个出色的新策略，而是能否发明出像围棋一样精妙的游戏？他希望至少看到多个这样的实例，才能让它成为一个候选者。

然后，应该采用穷尽式的科学方法，确保系统不存在任何缺陷或漏洞。当今的大语言模型就是一个例子。普通人很容易就能找出它们做不到的事情。例如，它们甚至无法达到业余水平的国际象棋对弈，也无法学习新游戏，而且它们不具备持续学习的能力。在推理、记忆和一致性方面也都有问题。要能通过刚才提议的那种测试，所有这些都需要被解决。

AI是工具、合作者，还是别的？

在未来十年左右的时间里，应该将人工智能视为一种帮助科学家的神奇工具——无论是数值计算、模式匹配，还是某种低层次的编码或工程工作。以这些方式使用，它将成为推动科学和医学进步的终极工具，并将引领一个新的科学发现黄金时代。猜想和假设将来自人类专家，然后专家使用这些工具，使工作效率大大提高——可能提高十倍甚至一百倍。在那之后的时间框架内，也许这些系统会变得更像合作者。

负责任地使用AI于科学

意味着遵循科学方法，对测试和系统相关的主张极其严谨和审慎。这也意味着对部署和使用系统的目的深思熟虑，并努力思考其二阶效应。你永远无法做到完美，因为这是一项如此新的技术，前沿发展如此之快，但应该尽一切可能的努力。

与此相关的是，这意味着利用科学方法本身来帮助理解人工智能：它的局限性、它的能力以及它的风险。然后应该利用这种理解来为人工智能设置恰当的护栏，并对这些护栏本身进行监测和研究。

随着人工智能变得日益普及和强大，科学方法是应对其挑战的最佳途径，而不是那种先构建、后提问的黑客心态。当然，后者也有其用武之地，并且对推动进步非常有益。但对于像人工智能这样具有变革性和重大影响的事物，需要使用我们拥有的最佳工具——在哈萨比斯看来就是科学方法——来尽可能多地获得对这些技术的远见和理解。

最希望带来的益处

首要的是改善人类健康、治愈疾病，尤其是那些对世界较贫困地区影响尤为严重的疾病。他认为我们能做得比现在好得多。

其次是助力能源、气候和环境——通过更快地开发新材料和新技术，优化现有基础设施和电网，对全球正在发生的变化以及我们对生态系统的影响进行建模。在他看来，这些是近期内利用人工智能所能做的最重要的事情。

展望2050年

考虑到事物发展的速度——几乎每周都在推进——唯一能确定的是，到2050年，情况很可能会与现在截然不同。希望到那时，领域已经以安全的方式将通用人工智能带入世界，造福全人类，而我们正在讨论如何驾驭一个极度丰裕的后通用人工智能世界，并生活在一个充满科学发现与奇迹的新黄金时代！