超级人工智能无疑令人向往——它能以极高效率完成大量工作。然而,挑战也随之浮现:当AI的智能超越最杰出的人类时,关于灾难性风险的探讨便持续不断。

近期一项研究引人关注:科学家通过理论计算证实,所谓的遏制算法根本无法有效控制超级AI。这源于牛津哲学家尼克·博斯特罗姆提出的经典“控制问题”——如何确保超级人工智能始终服务于人类利益?
基于这一假设,研究人员设计了一种理论上的遏制算法:模拟AI行为,一旦检测到潜在有害动作便自动终止程序。看似合理?然而模型运行后的分析结果令人失望——从根本上说,算法无法实现超级AI的有效控制。
研究团队成员伊亚德·拉万指出一个关键矛盾:若将问题还原为理论计算机科学的基本规则,会发现那个指令AI不得危害世界的遏制算法,本身可能在运行中意外中止。一旦如此,麻烦随之而来——你无法判断算法仍在评估威胁,还是已成功终止了有害AI。简言之,这种算法难以有效应用。
问题根源在于计算的基本局限性。当前没有任何算法能够可靠地预测超级AI是否会造成危害。原因并不复杂:超级人工智能本质上包含一个程序,其输入的复杂度可能堪比真实世界。试图为其建立“围堵算法”?理论上本就不可行。因为涉及的仿真早已超出通用图灵机的能力范围。
当然,目前超级AI仍停留在科幻领域。但研究人员指出,AI技术的发展正逐步接近科幻作家构想的超级智能。马克斯·普朗克人类发展研究所的曼努埃尔·塞布里安提到一个值得警惕的现象:部分AI机器已能独立执行重要任务,而程序员自身尚未完全弄清它们的学习机制。
这带来了一个现实问题:未来某一时刻,AI是否会变得无法控制,进而对人类构成威胁?
超级AI的发展趋势不会停歇。与此同时,约束手段也必须同步跟进——正如法律引导人类行为,唯有为超级AI建立一套类似的“规则框架”,才能让它服务于人类,而非制造灾难。这才是核心所在。
