本文适合完全没有命令行经验的新手,也适合从 OpenClaw 迁移过来的老用户。不管你是第一次碰终端,还是已经在别的 Agent 框架里摸爬滚打了一阵子,这篇保姆级教程都能帮你从零起步——装好 Hermes Agent,接上 Telegram,再把它的核心玩法摸清楚。
### 它是什么

2024 年 2 月底,Nous Research 开源了 Hermes Agent,一个 AI Agent 框架。上线不到两个月,GitHub 上就狂揽 35K star,增长势头非常猛。
大多数人用 AI 的方式是:打开网页、输入问题、等它回答、关掉窗口。Hermes 的定位完全不一样——它更像是你能 24 小时部署在服务器上、随时待命的数字员工。你关掉电脑,它还在跑;你睡着了,它还在处理任务。这其实是把 AI 从“聊天工具”提升到“基础设施”的思维转变。理解了这一点,才算真正抓住了它的本质。
它的核心差异一句话就能说清楚:会自己变聪明。完成一个复杂任务后,Hermes 会自动把执行过程提炼成可复用的技能(Skill)存起来,下次遇到类似任务直接调用。而且随着使用次数增加,这个技能还会被持续调优——它真的会越用越好用,不是空话。有用户反馈,两小时内自动生成三份技能后,重复任务的处理速度提升了 40%。
底层用 Python 写的,这点很关键。对比之下,OpenClaw 用的是 JS。AI 时代,绝大多数工具和模型库都是 Python 生态,如果你有改源码、加自定义工具、对接本地模型这些需求,Hermes 的门槛明显更低。
至于模型接入,首推 OpenRouter,上面有免费模型可用,零成本就能上手体验。
⚠️ 发文时的最新消息:有推友下午反馈,Claude 订阅的接入方式已经失效了。Anthropic 从 4 月 7 日起调整了政策,Hermes 这类第三方工具不再走订阅额度,改为按量单独计费。目前最稳妥的方案还是优先用 OpenRouter 的免费模型。
### 开始之前
#### 1. 系统支持情况
? Windows 用户注意:官方不支持在 Windows 上原生运行,你需要先安装 WSL2(Windows Subsystem for Linux 2),然后在 WSL2 环境里按本教程操作。可以在微软官方文档搜索“安装 WSL”,按步骤装好后回来继续。
#### 2. 确认 Git 已安装
打开终端,输入:
git version
如果能看到版本号(比如 git version 2.x.x),那说明 Git 已经就绪。如果提示 command not found,需要先去 git-scm.com 下载安装。
#### 3. 准备好大模型 API Key
Hermes 支持接入 Claude、OpenAI、OpenRouter 等主流模型。安装过程中会引导你选择和配置,提前把 API Key 准备好就行。
### 第一步:安装
打开终端(Windows 用户在 WSL2 里操作),执行下面这条命令:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
这个脚本会自动完成所有准备工作:检测并安装 Python、Node.js、Git、ripgrep 等依赖,克隆仓库,最后在全局创建一个 hermes 命令。
⚠️ 需要注意:要安装的组件比较多,网络不好的话可能需要多等一会儿,千万别中途关掉终端。
安装完成后,脚本会自动进入引导设置。选择 Quick setup 模式,然后按提示配置模型。推荐选 OpenRouter,进入后可以选免费模型(比如 google/gemma-4-31b-it:free),零成本就能先跑起来体验一下。如果你之前本地已经有 OpenAI 或 Codex 的授权配置,Hermes 会自动读取,不用重复填写。
配置接近尾声时,脚本会询问是否注册为系统服务。选 Y 的话,Hermes 就能开机自启、后台常驻,省去每次手动启动的麻烦。
如果你暂时不想配置聊天平台,选择跳过(Skip),然后直接在终端里输入:
hermes
如果能弹出一个对话界面,说明安装成功了,直接在命令行里开聊就行。
⚠️ 如果提示找不到 hermes 命令,先执行 source ~/.bashrc 或 source ~/.zshrc 刷新一下 shell 环境,或者干脆关掉终端重新打开。实际体验下来,安装过程确实比 OpenClaw 要顺滑,一次就配置成功了。
### 第二步:接入 Telegram
? 如果你只是想用命令行和 Hermes 交互,这一步完全可以跳过。只有你想在手机或电脑的 Telegram 里跟它聊天,才需要配置。
#### 2.1 去 Telegram 创建一个 Bot
- 打开 Telegram,搜索 BotFather(官方账号,有蓝色认证标志)
- 发送 /newbot
- 根据提示依次输入 Bot 的显示名称(Name)和用户名(Username,必须以 bot 结尾)
- 创建成功后,BotFather 会返回一串 HTTP API Token,复制下来保管好
#### 2.2 回到终端配置
如果安装时跳过了 IM 配置,可以随时重新运行:
hermes gateway setup
在引导界面选择 Telegram,将刚才复制的 Bot Token 粘贴进去。
⚠️ 注意:粘贴 Token 时,终端上不会有任何显示,这是安全设计,纯属正常。直接按回车确认就行。
接下来需要填写你自己的 Telegram 数字 ID(Allowed User ID)。查询方法很简单:在 Telegram 里给 @userinfobot 发任意一条消息,它会立即回复你的账号 ID,把那串数字复制下来填进去就行。如果不填,任何人都能使用你的 Bot,存在安全隐患。
#### 2.3 完成配对
配置完成后,终端会给出一条命令,复制下来执行。然后打开 Telegram,找到你刚创建的 Bot,发一条消息,如果能收到回复,说明配对成功了。
### 其他聊天平台
飞书、企业微信、钉钉、Discord、WhatsApp 等平台的配置方式,与 Telegram 大同小异,都在引导菜单里可以找到。详细的参数配置可以参考官方文档中的消息平台接入指南。
### 第三步:验证安装
运行以下命令,做一次全面检查:
hermes doctor
如果输出全绿,说明 Hermes 运行正常,所有依赖和配置都没问题。如果有报错,它会明确提示具体是哪里出了状况。
### 核心特性
Skills 自动生成:完成一个复杂任务后,Hermes 会把整个执行过程沉淀成一份 Markdown 技能文档存起来,下次遇到类似任务直接调用。它还会记录每个 Skill 的调用次数和执行过程,到一定次数后自动调优——技能真的会越用越好,不是随便说说的。
分层记忆:核心信息常驻 MEMORY.md,每次对话都带着;历史对话全量存在 SQLite 里,按需检索召回,容量上不封顶。OpenClaw 的做法是每次任务都把历史上下文塞进 prompt,记得越多、单次 token 消耗越大,用得越久费用越贵。Hermes 是按需召回,用得越久成本反而稳定。
在 IM 里能看到 tool_call 过程,每一步 agent 在做什么都一目了然——OpenClaw 在这方面是黑盒。另外还支持 Profiles,可以同时跑多个隔离的 Agent 实例。
语音交互:CLI 里按 Ctrl+B 就能录音,Telegram 和 Discord 里支持直接语音对话,Discord 甚至能让 Agent 加入语音频道实时监听回话。支持本地 Whisper(免费)或 Groq 做语音识别,平时不一定会用到,但有需求的时候就会发现这是个加分项。
SOUL.md 人格定制:在 ~/.hermes/SOUL.md 里写几行描述,就能给 Agent 定义一个跨所有平台的持久人格——说话风格、处事偏好、什么该避免,全由你定义。想要一个务实的工程师助手,还是一个幽默的助理?完全自己决定。
总体来看,交互体验很流畅,配置也很简洁——不过界面这块还有继续打磨的空间。
### 接入第三方界面
不想用命令行的话,有两个选择:
- Hermes WebUI:专门为 Hermes 开发的网页界面,直接对着 Agent 聊,比命令行直观不少,对新手很友好。
- 接入现有工具:Hermes 内置兼容 OpenAI API 格式的服务端,Open WebUI、Cherry Studio 等支持自定义 API endpoint 的工具都可以直接接入,不用重新适应新界面。具体配置方式参考官方文档中的 API Server 使用指南。
### VPS 用户
如果你是在 VPS 上部署,而且已经安装了 Claude 或 Codex 这类 AI 工具,可以直接把 Hermes 的官方文档或者本文扔给它,让它自动读取并帮你执行配置步骤。这样可以省去逐行粘贴命令的麻烦,尤其适合环境依赖复杂、需要反复调试的场景。
### 常用命令速查
### 费用参考
Hermes 号称可以跑在 5 美元/月的 VPS 上,也支持 Docker 和 serverless 方案。以下是社区实测的费用参考:
为什么在同等使用强度下,Hermes 比 OpenClaw 便宜 30%-60%?原因出在架构上:OpenClaw 每次任务都把历史上下文塞进 prompt,记得越多、单次 token 消耗越大,用得越久越贵。Hermes 的记忆系统是按需召回的,成本随时间保持稳定。
⚠️ 社区里有个高频翻车案例:忘了关 Sonnet,跑了一整夜。OpenClaw 用户哭晕在厕所,Hermes 用户因为架构差异,翻车金额小了一个数量级。
### 安全性
Hermes 实施了七层防御:用户授权白名单、危险命令人工审批、Docker 容器隔离、凭证过滤保护、内容注入扫描、URL 验证(防 SSRF)、预执行终端攻击检测。高风险操作默认需要人工确认,超时会自动拒绝。
接入 IM 平台时,Hermes 支持配对码验证——8 位随机码,1 小时过期,5 次失败后锁定,比手动复制用户 ID 的方式更安全。
配置上,密钥和服务解耦管理,复杂度低,也减少了配错把自己搞死的概率。
两个使用前需要知道的点:
- 接入 Telegram 后,你的账号就是控制入口,账号安全就等于 Agent 安全,强烈建议开启两步验证。
- Skills 持久存活会被反复调用,有问题的技能需要手动清理——技能文件存在本地,可以随时打开查看和删除;hermes doctor 也可以定期检查运行状态。
### 常见问题
Q:Claude 订阅还能用吗?
4 月 7 日起 Anthropic 已经调整了政策,Hermes 等第三方工具不再走订阅额度,使用 Claude 需要单独按量付费。建议直接用 OpenRouter,注册后有免费模型可用,入门零成本,后续有需要再接付费模型。
Q:安装后输入 hermes 提示 command not found 怎么办?
通常是 PATH 没有刷新。关掉当前终端窗口,重新打开一个,再试一次。如果还不行,执行 source ~/.bashrc 或 source ~/.zshrc(取决于你用的 shell)。
Q:Windows 用户怎么办?
官方明确不支持 Windows 原生运行。需要先装 WSL2(Windows Subsystem for Linux 2),然后在 WSL2 里按本教程操作,安装命令完全一样。
Q:Bot Token 粘贴进去没有任何显示,是不是出错了?
没有出错,这是终端的安全机制——输入密钥类内容时不会回显。直接按回车确认即可。
Q:从 OpenClaw 迁移过来,原来的配置还能用吗?
可以,Hermes 内置了迁移命令:
hermes claw migrate
会导入原有的技能、记忆和设置,很多命令和 OpenClaw 也大同小异。
Q:/llm_wiki 是什么功能?
这是新版本新增的功能,支持 Karpathy wiki 方案——可以快速查阅大模型相关知识。在 IM 对话里直接输入 /llm_wiki 触发,比手动搜索方便不少。
官方文档:hermes-agent.nousresearch.com/docs
GitHub:github.com/NousResearch/hermes-agent
