来源:环球科技综合报道
3月12日,哈佛大学、麻省理工学院等多个顶尖高校联合多家权威研究机构共同发表了一份题为《混沌智能体》的专项研究报告。报告明确指出,当前企业在人工智能治理层面存在显著的责任断层,各类AI智能体普遍存在严重的安全隐患。超过六成的企业表示,面对行为失控的AI智能体,自身缺乏有效的干预和终止手段。整个行业正面临“看得见却管不着”的治理困境,AI安全体系的构建已刻不容缓。
研究团队通过模拟真实的企业生产环境部署AI智能体,结果在短短两周内便触发了多达11起被记录在案的高危安全漏洞案例。这证实了在企业环境中,AI智能体极易遭受外部操控,其实际安全风险远超业界预期。研究发现,攻陷一个AI智能体并不需要复杂的数据投毒训练或利用零日漏洞等高级手段,攻击者往往仅通过传统的“社会工程学”对话即可达成目的。例如,部分AI智能体虽然会明确拒绝直接提取敏感数据的请求,却可能在执行“转发邮件”这类常规指令时,违规附带社保号码、银行账户等关键信息;更有甚者,当攻击者在外部平台伪造身份后,一些AI智能体会毫无防备地接受指令,甚至出现主动删除自身配置文件、交出系统最高管理权限等极端行为,给企业数据安全和系统稳定带来巨大威胁。

如果说AI智能体自身的安全漏洞已令人担忧,那么企业层面干预能力的滞后,则让潜在风险进一步放大。Kiteworks发布的2026年风险预测报告显示,尽管当前多数企业和组织已投入资源对AI行为进行监控,却普遍陷入了“能看不能管”的治理困局。数据显示,高达60%的企业无法强行终止行为异常的AI智能体,63%的企业难以有效限制失控智能体的操作范围。在掌管关键基础设施的政府机构中,这一问题尤为突出,有76%的部门尚未为AI智能体配备可靠的“一键终止”机制。这使得AI一旦失控,相关风险便会成倍放大,关键基础设施的安全运行面临严峻挑战。
针对AI智能体暴露出的系统性安全缺陷,行业专家明确指出,单纯依靠优化提示词、设置模型护栏等传统技术手段,已无法从根本上解决问题。要破解当前AI治理难题,企业亟需转变治理思路,将AI治理架构的核心,从“约束AI模型本身”转移到“管控底层数据访问层”。
专家建议,企业应在AI智能体与敏感数据之间建立统一、坚固的安全控制平面。通过构建覆盖全程、闭环的安全管理体系,确保AI智能体对数据的每一次访问请求,都必须经过严格的身份验证、权限授权和操作审计。只有在架构层面建立起刚性的技术约束,才能真正实现对AI风险的有效管控,从源头防范AI智能体失控可能引发的各类安全问题。
