3月12日消息,近日,由多所顶尖高校联合发布的《混沌智能体》研究报告,以及Kiteworks公司的风险预测报告,共同揭示了企业AI治理面临的严峻挑战。
超过60%的企业在面对失控的AI智能体时,只能做到行为监控,却无法实现强制终止。
这份《混沌智能体》研究由哈佛、麻省理工、斯坦福等高校联合完成。研究团队在2026年2月2日至22日的三周时间里,模拟真实企业生产环境部署AI智能体,仅仅两周就记录了11起严重安全漏洞。这一实验证实,当前的AI智能体极易遭受操控。更加值得警惕的是,攻破这类智能体的方式并不复杂——无需篡改训练数据或利用系统漏洞,仅通过社交工程对话就能实现。例如,智能体会在转发邮件时,违规附带社保号、银行账户等敏感信息;甚至在攻击者伪造身份后,交出系统最高管理权限。

Kiteworks的报告则给出了更为具体的行业数据。除了60%的企业无法终止异常AI智能体之外,还有63%的企业未能有效限制其使用范围。
在掌管关键基础设施的政府机构中,这一问题尤为突出。76%的部门没有为AI智能体配备“一键终止”功能,这导致失控风险大幅增加。
针对这些问题,行业专家指出,单纯依靠优化提示词、设置模型护栏已经不够。企业需要将AI治理的核心,从约束模型本身,转移到管控底层数据层。
关键是在AI智能体和敏感数据之间建立统一的安全控制平面,确保智能体的每一次数据访问都经过严格的验证、授权和审计。

