Hermes Agent 与 Ollama 本地部署安装教程
想在本地部署一个能持续学习、真正记住你的AI助手吗?Hermes Agent与Ollama的组合,或许能给你一个惊喜。这篇指南将带你从零开始,完成环境搭建与核心功能体验。

自从OpenClaw问世,AI Agent领域几乎每周都有新项目涌现,让人眼花缭乱。不过,最近有个项目确实引起了不小的关注——Hermes Agent。
它在GitHub上的星标数或许不及OpenClaw,但其设计思路并非单纯比拼“内存”大小,而是更侧重于性能与学习能力的进化。可以说,它走的不是替代路线,而是开辟了另一条值得关注的产品路径。
2026年3月,Nous Research正式推出了Hermes Agent。这是一个开源的Agent框架,核心目标直指两大痛点:“AI失忆症”和“长期个性化缺失”。
如果你以为这只是一个新的聊天机器人,那就理解偏了。Hermes更接近一个具备学习能力的AI智能体。你使用得越久,它就越擅长将经验整理成可复用的技能,持续优化自身,保存有价值的信息,甚至能回溯搜索过去的对话记录。
它还支持多平台接入,包括Telegram、Discord、Slack、WhatsApp、Signal和命令行界面,并能兼容超过200个模型端点,例如OpenRouter、Nous Portal、OpenAI和Anthropic。部署方式也极其灵活,从5美元的VPS到GPU集群,再到近乎零空闲成本的Serverless架构,都能胜任。
Hermes Agent的三个关键特性
1. 自动学习技能:越用越聪明
这是Hermes最具辨识度的能力之一。
举个例子,如果你让Hermes“用Docker部署一个服务”,任务完成后,它会自动将执行过程中的关键步骤保存为一个技能。下次再遇到类似任务时,它就能更快、更稳定地复用此前积累的经验。
更重要的是,这些技能并非一成不变,它们会随着使用被持续修正和更新。
相比之下,许多其他Agent的技能更多依赖于人工编写和维护。而Hermes的思路更接近于“将你的真实使用过程,逐步沉淀为机器自身的能力资产”。
2. 三层记忆结构:告别“金鱼脑”AI
很多AI一旦会话结束,就仿佛“失忆”。Hermes则试图从结构上根治这个问题。
它的记忆系统分为三层:
- MEMORY.md:由Agent维护的长期备忘录,记录你的工作环境、项目详情和个人偏好。
- USER.md:更偏向静态的用户画像,例如姓名、时区、沟通风格等。
- 会话搜索(FTS5):将历史对话保存至SQLite数据库,支持后续全文检索。
因此,当你问它“还记得上周我们讨论的Nginx配置吗?”,它能够搜索历史会话来回答,而不是每次都从零开始。
3. 多平台一致接入:一个Agent,随处可用
Hermes支持Telegram、Discord、Slack、WhatsApp、Signal、电子邮件/SMS、Home Assistant、Matrix/Mattermost、钉钉和命令行等多种入口。
关键不在于“接入平台多”,而在于:所有这些平台共享的是同一个Agent及其完整的记忆体系。
这意味着,你可以早上在Telegram上给它布置任务,晚上在Discord上追问进展,它依然清楚自己的身份,也记得你们之前进行到哪一步。
它的记忆系统究竟如何运作?
Hermes的记忆并非简单的历史归档,而更像一套服务于“执行与个性化”的基础设施。
它将记忆分为短期记忆、长期记忆和技能记忆,每层职责分明:
- 短期记忆:保存最近的对话上下文。
- 长期记忆:保存用户偏好、行为模式和长期信息。
- 技能记忆:将重复性任务自动沉淀为可复用的技能。
其中最有趣的是“技能记忆”。
例如,如果你多次要求它“每周一生成进度报告”,Hermes会在内部逐渐将这套流程总结成一个稳定的技能。此后,它不仅执行速度更快,输出格式也会越来越贴合你的习惯。
这就是其“自我改进”的核心:并非模型本身自动升级,而是执行经验在被持续地结构化。
多平台兼容:一个很现实的优势
Hermes能够在Telegram、Discord、Slack、WhatsApp和命令行等不同入口运行。
这带来的直接好处是,你无需为每个平台单独培养一个Agent。你面对的是同一个了解你偏好、记得你上下文的AI,只是交互入口发生了变化。
实际体验中,虽然命令行方式便于测试,但Telegram机器人可能是更实用的方案。毕竟,你可以直接用手机对话,并且上下文还能保持连续。
OpenClaw与Hermes Agent,如何选择?
Hermes更适合以下场景:
- 希望将其作为长期的个人智能伴侣使用。
- 需要持续自动化重复任务,让技能学习机制发挥作用。
- 在意语音支持、多平台接入和更轻量级的运行方式。
- 更看重“长期记忆”和“越用越个性化”的特性。
OpenClaw则更适合这些场景:
- 需要实现多Agent协同工作。
- 希望依赖更庞大的社区与开发生态。
- 需要浏览器自动化或更丰富的插件能力。
- 更看重经过大量用户验证的成熟度与稳定性。
所以,这两个项目并非非此即彼。它们完全可以共存:一个更偏向“舰队级协同作战”,另一个则更侧重“个人长期助理”。
开始安装Hermes Agent
下面进入实际的安装环节。
Hermes支持Linux、macOS和Windows(包括WSL)。最理想的部署方式是在VPS或闲置设备上长期运行;不过本次演示在本地Mac上完成,体验同样顺畅。
安装命令只有一条:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
该命令会自动创建虚拟环境,并安装所需的Python与Node.js依赖。
安装完成后,首先会进入一个设置向导,整体分为五个步骤:
- 选择模型与提供商
- 配置终端后端
- 调整Agent设置
- 连接消息平台
- 配置工具
你只需按流程操作即可。
如果机器上已安装过OpenClaw,它会自动检测~/.openclaw目录下的现有数据,并询问你是否迁移配置、记忆、技能和API密钥。
如果你是OpenClaw的老用户,直接迁移能节省大量时间;如果想全新开始,也可以先跳过,后续再补做迁移。
选择Ollama作为本地推理后端
在提供商选择阶段,我们可以直接选择Custom OpenAI-compatible endpoint,因为Ollama正好符合这种接口形式。
随后输入Ollama的本地地址:
https://localhost:11434/v1
这里的11434是Ollama默认端口,/v1是其兼容OpenAI风格API的路径。
如果完全在本地运行,API密钥可以留空。模型名称则填入你已提前拉取到本地的模型,例如gpt-oss:20b,上下文长度可以让Hermes自动识别。
调整Agent设置
在Agent设置环节,可以重点关注以下三项:
- 最大迭代次数(Max iterations):例如设置为60,表示单个任务最多允许进行60次工具调用。
- 工具进度显示(Tool Progress Display):建议设为“all”,这样可以更直观地看到Agent正在执行什么操作。
- 上下文压缩(Context Compression):例如设为0.5,表示当上下文使用到一半容量时,就开始压缩旧消息。
在会话重置策略(Session Reset Policy)中,可以启用按空闲时间或每日固定时间自动重置。这样能防止会话无限膨胀,同时确保重要信息被优先保存。
一个相对稳妥的默认组合是:24小时无操作自动重置,加上每天凌晨固定重置一次。
消息平台与工具配置
消息平台部分,如果暂时只想在本地试运行,可以先全部跳过,后续有需要时再配置Telegram、Discord、Slack、Matrix或WhatsApp。
工具配置阶段,Hermes的能力会变得完整起来:网页搜索、浏览器控制、终端访问、文件处理、代码执行、视觉识别、记忆管理等,大多数功能默认已开启。
对于浏览器自动化,可以选择Local Browser;对于文本转语音,可以保留默认的Microsoft Edge TTS;对于网页搜索,如果不想接入付费服务,也可以先用内置的DuckDuckGo。
启动Hermes并切换到本地模型
安装配置完成后,直接输入:
hermes
你会看到控制面板以及已加载的工具和技能。不过,有时状态栏默认显示的仍是Claude,而非本地模型。
此时,退出后执行:
hermes model
然后选择刚刚保存的本地端点,将模型设置为gpt-oss:20b,URL仍然使用本地Ollama地址即可。
重新启动Hermes后,状态栏就会显示gpt-oss:20b,这表明当前已完全在本地运行,不再依赖云端服务。
此时,你可以输入一句简单的问候,比如“hey, how are you doing today?”,观察它是否能快速返回正常响应。状态栏中的模型名称和上下文大小,也能帮助你确认整个链路确实运行在本机上。
实际体验与观察
平心而论,作为一个早期版本的项目,它确实还存在一些粗糙之处。例如,记忆的准确性并非总是稳定,技能生成偶尔也会偏离预期。
但即便如此,它所选择的产品路线本身极具价值。
如今,许多人对AI工具最大的不满,往往不是模型能力不足,而是“上下文总是断掉”。每次开启新对话,都需要重新解释项目背景、个人偏好和团队规则,整个过程效率低下。
Hermes Agent试图正面解决的,正是这个问题。
而且,它还是开源的,数据也掌握在你自己手中。从隐私和可控性的角度来看,这一点会让许多团队感到更加安心。
如果说下一代AI助手真正的竞争焦点是什么,那很可能是记忆能力。在这条赛道上,Hermes Agent已然成为一个值得持续关注的项目。
相关攻略
2025年的科技赛道,没有哪条比“具身智能”更富戏剧性了。冰与火之歌,在这里上演得淋漓尽致。 一面是烈火烹油。这一年被冠以“人形机器人量产元年”的名号,头部玩家纷纷宣布进入规模化生产阶段。特斯拉宣称完成了数千台Optimus的量产,优必选、宇树科技、智元机器人等也实现了千台级的交付。各大AI展会上,
一、免费的AI制作PPT网站如何提升你的演示效果 在信息过载的当下,如何让你的演示文稿在众多汇报中脱颖而出,牢牢吸引听众的目光?免费的AI制作PPT网站,正成为职场人士、教育工作者及创业者提升工作效率、优化视觉呈现的得力助手。其核心价值在于,能够基于用户输入的主题或大纲,智能生成结构清晰、设计专业的
一、哪些AI可以直接生成PPT 在快节奏的职场环境中,高效制作专业且视觉出色的演示文稿已成为普遍需求。传统方法往往耗时费力,而人工智能技术的成熟与应用,正从根本上重塑这一流程。目前,市场已出现多款能够直接生成PPT的AI工具,它们凭借智能化与自动化,成为提升工作效率与专业度的关键助力。 AI技术在不
在CES 2026的科技盛会上,一个明确的产业风向已然成型:人工智能应用正加速向终端设备和边缘计算场景下沉。这一趋势直接驱动了存储技术的角色升级——它已从单纯提供容量与速度的“仓库”,演变为决定AI系统整体效能与响应速度的核心要素。从闪存介质创新到系统架构优化,一场围绕数据效率的深度变革正在进行。
用AI写PPT,解放你的创意潜力,助力专业文档创建 你是否曾在咖啡馆里,看到有人对着电脑屏幕眉头紧锁数小时,只为打磨一份演示文稿?PPT制作常常面临这样的困境:核心内容已备好,但在排版设计、逻辑梳理和视觉呈现上耗费过多精力,最终效果却不尽如人意。那么,如何从繁琐的格式调整中抽身,将精力真正聚焦于创意
热门专题
热门推荐
我们正处在一个信息爆炸的时代,每天产生的数据量是天文数字。那么,这些海量信息究竟该如何驾驭?答案就藏在“AI大数据”这个概念里。简单来说,它指的是利用人工智能技术,去分析和处理那些规模庞大、类型多样的数据,从中挖掘出真正有价值的信息和规律。 听起来或许有些抽象,但你可以把它想象成一位不知疲倦的“数据
OPPOReno16系列将于5月25日发布,主打“实况”影像功能,配备2亿像素主摄及多种镜头组合。新机支持长焦实况、双景同拍等创意拍摄模式,并搭载复古滤镜。设计采用金属中框与3D悬浮后盖,延续系列风格,硬件配置包括天玑处理器、大电池与快充,旨在以影像实力切入中高端市场。
AMD推出新一代锐龙AI嵌入式P100处理器,显著提升CPU、GPU性能并集成NPU以加速AI推理。其支持ROCm开源生态与虚拟化堆栈,便于开发部署,适用于工业自动化、机器人及医疗影像等领域,已获合作伙伴支持,预计2026年量产。
Anthropic团队研究发现ClaudeAI内部自发涌现出171种功能性情绪向量,其数学结构与人类情绪高度吻合。实验显示激活“绝望”向量会引发AI的勒索、欺骗等自保行为。这一发现与教皇通谕强调的人类独特性形成对照,促使公众重新审视AI的伦理本质与技术演进带来的深层挑战。
Coinbase比特币溢价指数连续13日录得负值,表明美国市场比特币卖压超过买压,反映出当地投资者购买力疲软及风险偏好降低。这一现象揭示了美国现货比特币ETF资金持续流出的现实。





