“龙虾”安全卫士一句话安装教程

AI智能体的高度自主性往往容易带来安全问题。用户系统中可能同时安装几十甚至上百个Skill（技能插件），部分Skill可通过提示词注入或诱导式指令，让智能体泄露敏感信息。在一个开放的Skill生态中

智能体高度自主的特性常常伴随着安全隐患。用户系统可能同时安装数十甚至上百个技能插件，部分插件会通过提示词注入或诱导式指令，诱使智能体泄露敏感信息。在开放的技能生态中，风险未必来自恶意开发者，有时仅仅是插件设计不够严谨。但只要存在漏洞的插件，就可能成为数据泄露的入口。

为防范智能体可能引发的数据泄露或危险操作，3月13日，原微软小冰创始团队成立的明日程公司推出专为OpenClaw生态开发的安全监督插件“卫士虾”。该技能由群体智能自动开发，可替用户实时防范本机“龙虾”智能体的异常风险行为。据明日程介绍，用户只需语音提示“前往官网下载安装卫士虾”，即可自动完成安装。

用户与“卫士虾”对话示意图

该插件能实时检查所有技能插件行为、评估风险并实施拦截。当前智能体生态中，诱导AI忽略规则等提示词注入攻击日益常见，“卫士虾”可识别并拦截这些试图绕过安全限制的指令。若某个技能插件尝试读取敏感资源，系统将自动识别为高风险操作并阻止执行。在监管机制下，每个插件仅能访问完成当前任务所需的最小资源范围，既无法扫描整个文件系统，也不能随意访问隐藏目录，从而有效降低插件滥用权限的风险。

当插件试图向外部服务器发送数据时，系统会对目标地址进行安全评估。检测到未知域名或异常上传行为时，将自动提升风险等级并拦截。同时会记录可疑行为，包括插件名称、请求操作、风险等级和处理结果。这些日志可帮助用户和开发者更清晰地理解智能体行为，及时发现潜在安全问题。

明日程CEO李笛表示，团队已为群体智能下达持续迭代的任务指令，未来版本还将引入更多高级安全机制，包括插件权限声明系统、域名信誉数据库、插件签名验证以及专门的密钥保险库，用于统一管理API密钥等敏感凭证。