Bengio最新世界模型与数学证明确保AI系统可靠运行

时间：2026-07-03 15:17

YoshuaBengio加入英国ARIA资助的SafeguardedAI项目，担任科学总监。该项目旨在结合科学世界模型与数学证明，构建量化安全保障的AI系统，以降低其他AIAgent的风险。项目分三个技术领域，并规划了从L0到L5的安全等级体系。

深度学习三巨头之一Yoshua Bengio的下一步动向终于公开了——这次重心放在了AI安全上。

曝Bengio新动向：世界模型+数学证明，确保AI系统正常运作

他加入了一个名为Safeguarded AI（受保护的人工智能）的项目，担任科学总监。简单来说，这个项目想干一件大事：通过结合科学的世界模型和数学证明，构建一个专门负责理解和降低其它AI Agent风险的AI系统。主打量化安全保障，而不是空口说白话。

项目由英国高级研究与发明局（ARIA）提供支持，据说未来ARIA将投入共计5900万英镑（约合软妹币5.37亿元）。Bengio对此的表态很干脆：“如果你计划部署某种技术，鉴于AI行为异常或误用可能带来非常严重的后果，你需要提出充分的理由，最好能提供强有力的数学保证，确保你的AI系统将正常运作。”

这话说得够硬核，也正呼应了项目的核心逻辑。

“受保护的AI”

Safeguarded AI项目被划分为三个技术领域，每个领域都有明确的目标和预算：

支架（Scaffolding）：构建一个可扩展、可互操作的语言和平台，用于维护现实世界模型/规范并检查证明文件。
机器学习（Machine Learning）：使用前沿AI帮助领域专家构建一流的复杂现实世界动力学的数学模型，并利用前沿AI训练自主系统。
应用（Applications）：在关键的网络-物理操作环境中部署一个由“把关AI”保护的自主AI系统，通过量化的安全保障释放重要的经济价值。

官方表示，Bengio加入后将特别关注TA3和TA2两个领域，在整个计划中提供科学战略建议。ARIA还计划投入1800万英镑（约合软妹币1.64亿）成立一个非营利组织，专门领导TA2的研发工作。

项目总监是前Twitter高级软件工程师Da vid “da vidad” Dalrymple，去年9月加入ARIA。他还在X上晒了和Bengio的合照，颇有几分“大佬联手”的味道。

关于“构建一个负责理解和降低其它AI Agent风险的AI系统”的具体方法论，Dalrymple、Bengio等人专门起草了一份文件。其中提出了一套称为Guaranteed Safe AI（保证安全的AI）的模式，核心是通过三个相互作用的组件量化AI系统的安全保障：

世界模型：提供数学描述，阐述AI系统如何影响外部世界，并妥善处理贝叶斯和奈特不确定性。
安全规范：定义哪些效果是可接受的数学描述。
验证器：提供证明AI符合安全规范的可审计证书。

他们还为创建世界模型的策略划分了L0到L5共六个安全等级：

Level 0：没有明确的世界模型。关于世界的假设隐含在AI系统的训练数据和实现细节中。
Level 1：使用经过训练的黑盒世界模拟器作为世界模型。
Level 2：使用机器学习生成的概率因果模型的生成模型，可以通过检查它是否为特定的人类制作的模型（例如科学文献中提出的模型）分配足够的可信度来进行测试。
Level 3：使用（一个或多个）概率因果模型（或它们的分布），可能在机器学习的帮助下生成，这些模型经过人类领域专家的全面审核。
Level 4：使用关于真实世界现象的世界模型，这些模型被正式验证为基本物理定律的合理抽象。
Level 5：不依赖具体的世界模型，而是使用覆盖所有可能世界的全局性安全规范。

这个分级体系从“完全黑箱”一步步走向“全局可证明”，很有层次感。实际应用中，可能大多数人会从Level 2或Level 3起步，但最终目标显然是Level 5那种“万能保险”的境界。

“AI风险”备受学术圈关注

AI风险早就是行业大佬们唇枪舌战的焦点。Hinton离职谷歌，为的就是能自由讨论AI风险。之前吴恩达、Hinton、LeCun、哈萨比斯等AI巨佬线上“对喷”的那场大戏，想必不少人还记忆犹新。

吴恩达曾经表示：对AI最大的担忧其实是AI风险被过度鼓吹，导致开源和创新被严苛规定压制。某些人传播AI灭绝人类的恐惧，只是为了搞钱。而DeepMind CEO哈萨比斯则针锋相对：这不是恐吓，AGI的风险如果到现在才开始讨论，后果可能很严重。我不认为我们会想在危险爆发之前才开始做防范。

Bengio此前也和Hinton、姚期智、张亚勤等人工智能大拿联合发表了一封公开信《在快速进步的时代管理人工智能风险》。信中明确指出：人类必须认真对待AGI在这十年或下一个十年内在许多关键领域超越人类能力的可能性。建议监管机构应该对AI发展全面洞察，尤其警惕那些在价值数十亿美元的超级计算机上训练出来的大模型。

就在一个月前，Bengio还专门写了一篇文章，论证为什么要认真对待AI安全。他反驳了那些“不必杞人忧天”的观点，逻辑清晰，说服力很强。如果你对这个话题感兴趣，可以去翻翻他的个人博客。

来源：https://www.aiagiai.com/2439.html

上一篇英特尔AI困境：错失OpenAI投资市值跌破千亿美元 下一篇谷歌乒乓机器人学1.4万对拉球击败多数选手，网友预测4年后战奥运

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-07-03

批处理BAT入门教程第一篇

提供13个批处理实战技巧，覆盖全盘查找并删除文件夹或文件、拷贝移动文件、创建畸形文件夹及设置隐藏属性等场景，可一键完成系统维护与文件管理工作，极大提升自动化操作效率和便捷性。

AI教程 · 2026-07-03

从零开始批处理命令For循环详解与实战案例

批处理For命令支持 d、 l、 r、 f四个参数。 d仅列出当前目录下的目录名； r递归搜索指定路径及其子目录中的文件； l生成数值序列； f可解析文件、字符串或命令输出，通过delims、tokens、skip、eol等选项灵活处理内容。

AI教程 · 2026-07-03

批评你的人是你生命中的贵人

批评你的人往往最值得珍惜，因为他们关注你、助你成长。面对批评应包容反思，用行动改进而非辩解。接受批评是自我完善的过程，能让人少走弯路，避免重复犯错。这样的人正是生命中的贵人，值得感恩与珍惜。

AI教程 · 2026-07-03

测试人员角色定位与职责详解

测试人员角色经历了从找问题、保证质量到分析风险的转变，最终核心职责是提供关键信息，协助团队创造优秀产品。这包括识别问题、评估风险及帮助团队了解项目状态，而非单纯把关或追求完美。

AI教程 · 2026-07-03

经营成功测试生涯的实用方法与策略

一、测试生涯的起点 1989年，我在田纳西大学攻读研究生时，意外地从软件开发人员转行成为一名软件测试工程师。这并非我主动选择，说起来还有些戏剧性——某个早晨，教授质问我为何缺席那么多开发会议，我解释说这些会议总是安排在周末早上，对我这个第一次离家、刚入学的学生来说实在不便。结果呢？等待我的不是解聘通