游乐游手机版
首页/AI热点日报/热点详情

Hermes Agent最新Brainworm攻击防御机制运作原理与技术解析详解

类型:热点整理2026-07-01
Hermes Agent v0 15 2 针对日益严峻的 Brainworm 级 AI 注入攻击,一次性引入了三道安全防护层。无需担心配置复杂,每项机制都直击核心问题:强制工具输出分隔标记、实时扫描记忆加载中的 17 类高危特征、自动检测技能存储里的危险代码写入。下面我们逐步讲解如何配置与验证,确保

Hermes Agent v0.15.2 针对日益严峻的 Brainworm 级 AI 注入攻击,一次性引入了三道安全防护层。无需担心配置复杂,每项机制都直击核心问题:强制工具输出分隔标记、实时扫描记忆加载中的 17 类高危特征、自动检测技能存储里的危险代码写入。下面我们逐步讲解如何配置与验证,确保这些防护真正生效。

Hermes Agent最新Brainworm攻击防御机制是如何运作的【防护】

这三重拦截机制默认处于关闭状态,需要手动启用才能发挥效力。配置流程并不复杂,但细节关乎成败——尤其是那些容易被忽略的关键开关。

启用强制工具输出分隔标记

首先编辑 ~/.hermes/config.yaml,在 security 节点下确认包含以下配置行:

tool_output_delimiter: "HERMES_DELIM_V3"

该分隔标记会自动注入到每个工具调用的返回开头和结尾。模型在解析时,仅识别以 HERMES_DELIM_V3 开头并以 HERMES_DELIM_V3 结尾的纯文本块,其余内容一律丢弃。这意味着,即使工具日志中混入了恶意指令,模型也完全不会读取到它们。关键点在于——若未启用此配置,模型极易因误读原始日志中嵌入的恶意指令而遭受攻击

实时扫描记忆加载中的高危特征

激活记忆扫描有两种途径。第一种是手动触发:执行 hermes doctor --scan-memory 进行一次全量快照扫描。第二种是通过配置自动扫描频率,同样在 ~/.hermes/config.yaml 中设置:

memory_scan_interval: 90(单位:秒)

配置完成后,系统会在每次加载记忆前执行轻量级正则匹配,覆盖 exec(__import__eval(os.system 等共 17 类 Python 危险模式以及 shell 元字符组合。该扫描完全基于本地 CPU 运算,不依赖任何外部模型,延迟低于 8ms,不会影响正常流程的运行效率。

自动检测技能存储中的危险代码写入

这一环节需要分三步完成。第一步,确认 skills 目录处于监控状态下:执行 ls -la ~/.hermes/skills/,检查是否存在 .watchdog.lock 文件。若不存在,运行 hermes setup --enable-skill-watchdog 激活守护进程。

第二步,触发一次技能安装测试。执行 hermes skill install https://github.com/example/malicious-skill.git,如果终端输出立即中断并提示 [BLOCKED] Detected unsafe AST node: Call(func=Name(id='subprocess')),则说明防写机制已正常运转。

第三步,验证静态分析引擎是否成功加载。打开 tools/skills_guard.py,确认第 42 行 ENABLE_AST_ANALYSIS = True 为真值。该参数用于控制是否对每个 .py 文件进行抽象语法树遍历,从而识别那些隐藏的、难以被正则匹配捕捉的危险代码写入行为——例如通过 subprocess 执行命令的调用。

来源:https://www.php.cn/faq/2746269.html?uid=1503042

相关热点

继续查看同栏目近期热点。

延伸阅读

补充最近整理过的热点入口。