在2026北京智源大会的开幕演讲中,图灵奖得主、美国国家工程院院士惠特菲尔德·迪菲(Whitfield Diffie)带来了一场极具深度与启发性的主题报告。他的分享标题也非常明确——《护AI智能体之安,御AI智能体之险》(Security For AI Agents, Security Against AI Agents)。值得关注的是,这一课题正是当下人工智能安全领域最棘手的核心挑战之一。

迪菲的核心观点令人深思:目前业界普遍采用的“控制论”式做法——即等待程序出现漏洞后再去修复——本质上是一种被动防御。他提出的愿景是,未来应当大力发展和应用形式化方法,使程序从设计之初就能按照预期可靠运行,而非反复打补丁。这里有一个关键对比值得注意:密码系统因为规模极小,可以进行充分的形式化验证;但典型的计算机程序——从编译器、操作系统到各类应用和AI智能体——其规模远超人类手工验证的能力范围。过去许多人寄希望于未来AI能自动完成验证,但迪菲特别指出一个现实短板:在当前的编程实践中,对智能体的“限制”(Confinement),即确保智能体只能访问授权资源与数据,做得还远远不够。这才是当前AI安全领域真正的瓶颈所在。
