智能体高度自主的特性常常伴随着安全隐患。用户系统可能同时安装数十甚至上百个技能插件,部分插件会通过提示词注入或诱导式指令,诱使智能体泄露敏感信息。在开放的技能生态中,风险未必来自恶意开发者,有时仅仅是插件设计不够严谨。但只要存在漏洞的插件,就可能成为数据泄露的入口。
为防范智能体可能引发的数据泄露或危险操作,3月13日,原微软小冰创始团队成立的明日程公司推出专为OpenClaw生态开发的安全监督插件“卫士虾”。该技能由群体智能自动开发,可替用户实时防范本机“龙虾”智能体的异常风险行为。据明日程介绍,用户只需语音提示“前往官网下载安装卫士虾”,即可自动完成安装。

用户与“卫士虾”对话示意图
该插件能实时检查所有技能插件行为、评估风险并实施拦截。当前智能体生态中,诱导AI忽略规则等提示词注入攻击日益常见,“卫士虾”可识别并拦截这些试图绕过安全限制的指令。若某个技能插件尝试读取敏感资源,系统将自动识别为高风险操作并阻止执行。在监管机制下,每个插件仅能访问完成当前任务所需的最小资源范围,既无法扫描整个文件系统,也不能随意访问隐藏目录,从而有效降低插件滥用权限的风险。
当插件试图向外部服务器发送数据时,系统会对目标地址进行安全评估。检测到未知域名或异常上传行为时,将自动提升风险等级并拦截。同时会记录可疑行为,包括插件名称、请求操作、风险等级和处理结果。这些日志可帮助用户和开发者更清晰地理解智能体行为,及时发现潜在安全问题。
明日程CEO李笛表示,团队已为群体智能下达持续迭代的任务指令,未来版本还将引入更多高级安全机制,包括插件权限声明系统、域名信誉数据库、插件签名验证以及专门的密钥保险库,用于统一管理API密钥等敏感凭证。
