蚂蚁集团携手清华大学开源智能体安全防御插件ClawAegis
2026年4月2日,智能体安全领域迎来了一项关键进展。蚂蚁集团AI安全实验室与清华大学联合宣布,正式开源智能体安全防御插件——ClawAegis。这个产品来头不小,它是全球第一个覆盖OpenClaw全生命周期的安全防护工具。其核心在于构建了一套覆盖五大运行阶段的全链路纵深防御体系,能为自主智能体提供多维度、轻量化且能即时干预的原生防护能力。可以说,它系统性地瞄准了OpenClaw这类框架普及过程中暴露出的各类安全隐患。
OpenClaw的机遇与隐忧
时间回到2025年,OpenClaw开源智能体框架一经发布,便迅速席卷开发者社区。仅仅一年,全球接入的开发者数量就突破了27万大关。基于它开发的各类自主智能体,早已渗透到办公自动化、生活服务、企业运维等十多个实际场景中。然而,硬币的另一面是,其自动化执行和自主决策的特性,也带来了前所未有的全新安全挑战——这是过去普通大模型应用很少需要面对的。
风险具体有哪些呢?从第三方功能插件被恶意“投毒”、智能体的记忆数据遭受污染,到用户意图被暗中诱导、进而执行转账或“删库”等高危操作,甚至因被攻击而导致服务器资源彻底耗尽。纵观智能体从初始化、接收用户输入、模型推理、做出决策到最终执行服务的整个链条,几乎每个环节都成了潜在的突破口。此前AI安全社区披露的测试数据颇为触目:未做任何防护的OpenClaw智能体,被成功攻击的最高概率竟能达到62%。而现实是,绝大多数中小型开发者,并不具备独立搭建完善安全防护体系的技术积累。
构筑全链路纵深防御
正是针对上述贯穿始终的安全痛点,ClawAegis应运而生。它的设计思路很清晰:构建一个覆盖智能体五大核心运行阶段的纵深防御体系。这套体系能够主动识别并拦截诸如恶意指令注入、敏感信息窃取、用户意图篡改、权限越界调用等多种运行时威胁。
更值得称道的是它的易用性。作为专为OpenClaw打造的内置轻量化安全插件,ClawAegis可以无缝集成到现有的OpenClaw框架中,开发者无需对原有代码进行大规模改造。它的防护机制仅在关键执行节点动态激活,对智能体整体运行效率的影响被控制在2%以内,在安全性与落地可行性之间取得了不错的平衡。
开源背后的生态考量
此次选择将ClawAegis开源,其核心目标直指“普惠安全”——降低整个OpenClaw生态的安全准入门槛。这意味着,中小开发者不再需要从零开始艰难地研发安全能力,直接接入即可获得一套成熟的全链路防护方案。
蚂蚁AI安全实验室的相关负责人在分享中提到了后续规划:团队将持续更新ClawAegis的攻击样本库和防护规则,以覆盖更多新型攻击手法。未来,还有计划适配更多主流智能体框架,与产业各界伙伴共同打造一个开放的AI安全生态。这一切的最终目的,都是为AI智能体能够安全、稳健地实现大规模商业化落地,筑牢最基础也最关键的安全底座。

