首页 游戏 软件 资讯 排行榜 专题
首页
AI资讯
Hermes Agent 与 Ollama 本地部署安装教程

Hermes Agent 与 Ollama 本地部署安装教程

热心网友
70
转载
2026-05-27

想在本地部署一个能持续学习、真正记住你的AI助手吗?Hermes Agent与Ollama的组合,或许能给你一个惊喜。这篇指南将带你从零开始,完成环境搭建与核心功能体验。

Hermes Agent + Ollama本地安装指南

自从OpenClaw问世,AI Agent领域几乎每周都有新项目涌现,让人眼花缭乱。不过,最近有个项目确实引起了不小的关注——Hermes Agent。

它在GitHub上的星标数或许不及OpenClaw,但其设计思路并非单纯比拼“内存”大小,而是更侧重于性能与学习能力的进化。可以说,它走的不是替代路线,而是开辟了另一条值得关注的产品路径。

2026年3月,Nous Research正式推出了Hermes Agent。这是一个开源的Agent框架,核心目标直指两大痛点:“AI失忆症”和“长期个性化缺失”。

如果你以为这只是一个新的聊天机器人,那就理解偏了。Hermes更接近一个具备学习能力的AI智能体。你使用得越久,它就越擅长将经验整理成可复用的技能,持续优化自身,保存有价值的信息,甚至能回溯搜索过去的对话记录。

它还支持多平台接入,包括Telegram、Discord、Slack、WhatsApp、Signal和命令行界面,并能兼容超过200个模型端点,例如OpenRouter、Nous Portal、OpenAI和Anthropic。部署方式也极其灵活,从5美元的VPS到GPU集群,再到近乎零空闲成本的Serverless架构,都能胜任。

Hermes Agent的三个关键特性

1. 自动学习技能:越用越聪明

这是Hermes最具辨识度的能力之一。

举个例子,如果你让Hermes“用Docker部署一个服务”,任务完成后,它会自动将执行过程中的关键步骤保存为一个技能。下次再遇到类似任务时,它就能更快、更稳定地复用此前积累的经验。

更重要的是,这些技能并非一成不变,它们会随着使用被持续修正和更新。

相比之下,许多其他Agent的技能更多依赖于人工编写和维护。而Hermes的思路更接近于“将你的真实使用过程,逐步沉淀为机器自身的能力资产”。

2. 三层记忆结构:告别“金鱼脑”AI

很多AI一旦会话结束,就仿佛“失忆”。Hermes则试图从结构上根治这个问题。

它的记忆系统分为三层:

  • MEMORY.md:由Agent维护的长期备忘录,记录你的工作环境、项目详情和个人偏好。
  • USER.md:更偏向静态的用户画像,例如姓名、时区、沟通风格等。
  • 会话搜索(FTS5):将历史对话保存至SQLite数据库,支持后续全文检索。

因此,当你问它“还记得上周我们讨论的Nginx配置吗?”,它能够搜索历史会话来回答,而不是每次都从零开始。

3. 多平台一致接入:一个Agent,随处可用

Hermes支持Telegram、Discord、Slack、WhatsApp、Signal、电子邮件/SMS、Home Assistant、Matrix/Mattermost、钉钉和命令行等多种入口。

关键不在于“接入平台多”,而在于:所有这些平台共享的是同一个Agent及其完整的记忆体系

这意味着,你可以早上在Telegram上给它布置任务,晚上在Discord上追问进展,它依然清楚自己的身份,也记得你们之前进行到哪一步。

它的记忆系统究竟如何运作?

Hermes的记忆并非简单的历史归档,而更像一套服务于“执行与个性化”的基础设施。

它将记忆分为短期记忆、长期记忆和技能记忆,每层职责分明:

  • 短期记忆:保存最近的对话上下文。
  • 长期记忆:保存用户偏好、行为模式和长期信息。
  • 技能记忆:将重复性任务自动沉淀为可复用的技能。

其中最有趣的是“技能记忆”。

例如,如果你多次要求它“每周一生成进度报告”,Hermes会在内部逐渐将这套流程总结成一个稳定的技能。此后,它不仅执行速度更快,输出格式也会越来越贴合你的习惯。

这就是其“自我改进”的核心:并非模型本身自动升级,而是执行经验在被持续地结构化。

多平台兼容:一个很现实的优势

Hermes能够在Telegram、Discord、Slack、WhatsApp和命令行等不同入口运行。

这带来的直接好处是,你无需为每个平台单独培养一个Agent。你面对的是同一个了解你偏好、记得你上下文的AI,只是交互入口发生了变化。

实际体验中,虽然命令行方式便于测试,但Telegram机器人可能是更实用的方案。毕竟,你可以直接用手机对话,并且上下文还能保持连续。

OpenClaw与Hermes Agent,如何选择?

Hermes更适合以下场景:

  • 希望将其作为长期的个人智能伴侣使用。
  • 需要持续自动化重复任务,让技能学习机制发挥作用。
  • 在意语音支持、多平台接入和更轻量级的运行方式。
  • 更看重“长期记忆”和“越用越个性化”的特性。

OpenClaw则更适合这些场景:

  • 需要实现多Agent协同工作。
  • 希望依赖更庞大的社区与开发生态。
  • 需要浏览器自动化或更丰富的插件能力。
  • 更看重经过大量用户验证的成熟度与稳定性。

所以,这两个项目并非非此即彼。它们完全可以共存:一个更偏向“舰队级协同作战”,另一个则更侧重“个人长期助理”。

开始安装Hermes Agent

下面进入实际的安装环节。

Hermes支持Linux、macOS和Windows(包括WSL)。最理想的部署方式是在VPS或闲置设备上长期运行;不过本次演示在本地Mac上完成,体验同样顺畅。

安装命令只有一条:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

该命令会自动创建虚拟环境,并安装所需的Python与Node.js依赖。

安装完成后,首先会进入一个设置向导,整体分为五个步骤:

  1. 选择模型与提供商
  2. 配置终端后端
  3. 调整Agent设置
  4. 连接消息平台
  5. 配置工具

你只需按流程操作即可。

如果机器上已安装过OpenClaw,它会自动检测~/.openclaw目录下的现有数据,并询问你是否迁移配置、记忆、技能和API密钥。

如果你是OpenClaw的老用户,直接迁移能节省大量时间;如果想全新开始,也可以先跳过,后续再补做迁移。

选择Ollama作为本地推理后端

在提供商选择阶段,我们可以直接选择Custom OpenAI-compatible endpoint,因为Ollama正好符合这种接口形式。

随后输入Ollama的本地地址:

https://localhost:11434/v1

这里的11434是Ollama默认端口,/v1是其兼容OpenAI风格API的路径。

如果完全在本地运行,API密钥可以留空。模型名称则填入你已提前拉取到本地的模型,例如gpt-oss:20b,上下文长度可以让Hermes自动识别。

调整Agent设置

在Agent设置环节,可以重点关注以下三项:

  • 最大迭代次数(Max iterations):例如设置为60,表示单个任务最多允许进行60次工具调用。
  • 工具进度显示(Tool Progress Display):建议设为“all”,这样可以更直观地看到Agent正在执行什么操作。
  • 上下文压缩(Context Compression):例如设为0.5,表示当上下文使用到一半容量时,就开始压缩旧消息。

在会话重置策略(Session Reset Policy)中,可以启用按空闲时间或每日固定时间自动重置。这样能防止会话无限膨胀,同时确保重要信息被优先保存。

一个相对稳妥的默认组合是:24小时无操作自动重置,加上每天凌晨固定重置一次。

消息平台与工具配置

消息平台部分,如果暂时只想在本地试运行,可以先全部跳过,后续有需要时再配置Telegram、Discord、Slack、Matrix或WhatsApp。

工具配置阶段,Hermes的能力会变得完整起来:网页搜索、浏览器控制、终端访问、文件处理、代码执行、视觉识别、记忆管理等,大多数功能默认已开启。

对于浏览器自动化,可以选择Local Browser;对于文本转语音,可以保留默认的Microsoft Edge TTS;对于网页搜索,如果不想接入付费服务,也可以先用内置的DuckDuckGo。

启动Hermes并切换到本地模型

安装配置完成后,直接输入:

hermes

你会看到控制面板以及已加载的工具和技能。不过,有时状态栏默认显示的仍是Claude,而非本地模型。

此时,退出后执行:

hermes model

然后选择刚刚保存的本地端点,将模型设置为gpt-oss:20b,URL仍然使用本地Ollama地址即可。

重新启动Hermes后,状态栏就会显示gpt-oss:20b,这表明当前已完全在本地运行,不再依赖云端服务。

此时,你可以输入一句简单的问候,比如“hey, how are you doing today?”,观察它是否能快速返回正常响应。状态栏中的模型名称和上下文大小,也能帮助你确认整个链路确实运行在本机上。

实际体验与观察

平心而论,作为一个早期版本的项目,它确实还存在一些粗糙之处。例如,记忆的准确性并非总是稳定,技能生成偶尔也会偏离预期。

但即便如此,它所选择的产品路线本身极具价值。

如今,许多人对AI工具最大的不满,往往不是模型能力不足,而是“上下文总是断掉”。每次开启新对话,都需要重新解释项目背景、个人偏好和团队规则,整个过程效率低下。

Hermes Agent试图正面解决的,正是这个问题。

而且,它还是开源的,数据也掌握在你自己手中。从隐私和可控性的角度来看,这一点会让许多团队感到更加安心。

如果说下一代AI助手真正的竞争焦点是什么,那很可能是记忆能力。在这条赛道上,Hermes Agent已然成为一个值得持续关注的项目。

来源:https://www.53ai.com/news/OpenSourceLLM/2026052080631.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

人工智能伦理困境:机器人的道德责任与法律边界
AI资讯
人工智能伦理困境:机器人的道德责任与法律边界

2025年的科技赛道,没有哪条比“具身智能”更富戏剧性了。冰与火之歌,在这里上演得淋漓尽致。 一面是烈火烹油。这一年被冠以“人形机器人量产元年”的名号,头部玩家纷纷宣布进入规模化生产阶段。特斯拉宣称完成了数千台Optimus的量产,优必选、宇树科技、智元机器人等也实现了千台级的交付。各大AI展会上,

热心网友
05.27
免费AI制作PPT网站提升演示效果与效率
AI教程
免费AI制作PPT网站提升演示效果与效率

一、免费的AI制作PPT网站如何提升你的演示效果 在信息过载的当下,如何让你的演示文稿在众多汇报中脱颖而出,牢牢吸引听众的目光?免费的AI制作PPT网站,正成为职场人士、教育工作者及创业者提升工作效率、优化视觉呈现的得力助手。其核心价值在于,能够基于用户输入的主题或大纲,智能生成结构清晰、设计专业的

热心网友
05.27
AI生成PPT工具推荐提升工作效率与演示专业性
AI教程
AI生成PPT工具推荐提升工作效率与演示专业性

一、哪些AI可以直接生成PPT 在快节奏的职场环境中,高效制作专业且视觉出色的演示文稿已成为普遍需求。传统方法往往耗时费力,而人工智能技术的成熟与应用,正从根本上重塑这一流程。目前,市场已出现多款能够直接生成PPT的AI工具,它们凭借智能化与自动化,成为提升工作效率与专业度的关键助力。 AI技术在不

热心网友
05.27
CES 2026揭示AI存储趋势慧荣科技解读行业变革
AI资讯
CES 2026揭示AI存储趋势慧荣科技解读行业变革

在CES 2026的科技盛会上,一个明确的产业风向已然成型:人工智能应用正加速向终端设备和边缘计算场景下沉。这一趋势直接驱动了存储技术的角色升级——它已从单纯提供容量与速度的“仓库”,演变为决定AI系统整体效能与响应速度的核心要素。从闪存介质创新到系统架构优化,一场围绕数据效率的深度变革正在进行。

热心网友
05.27
AI制作PPT教程:高效创建专业演示文稿指南
AI教程
AI制作PPT教程:高效创建专业演示文稿指南

用AI写PPT,解放你的创意潜力,助力专业文档创建 你是否曾在咖啡馆里,看到有人对着电脑屏幕眉头紧锁数小时,只为打磨一份演示文稿?PPT制作常常面临这样的困境:核心内容已备好,但在排版设计、逻辑梳理和视觉呈现上耗费过多精力,最终效果却不尽如人意。那么,如何从繁琐的格式调整中抽身,将精力真正聚焦于创意

热心网友
05.27

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

AI大数据如何改变未来智能时代的信息处理与决策
AI教程
AI大数据如何改变未来智能时代的信息处理与决策

我们正处在一个信息爆炸的时代,每天产生的数据量是天文数字。那么,这些海量信息究竟该如何驾驭?答案就藏在“AI大数据”这个概念里。简单来说,它指的是利用人工智能技术,去分析和处理那些规模庞大、类型多样的数据,从中挖掘出真正有价值的信息和规律。 听起来或许有些抽象,但你可以把它想象成一位不知疲倦的“数据

热心网友
05.27
OPPO Reno16系列实况拍摄功能详解 多种模式轻松拍大片
科技数码
OPPO Reno16系列实况拍摄功能详解 多种模式轻松拍大片

OPPOReno16系列将于5月25日发布,主打“实况”影像功能,配备2亿像素主摄及多种镜头组合。新机支持长焦实况、双景同拍等创意拍摄模式,并搭载复古滤镜。设计采用金属中框与3D悬浮后盖,延续系列风格,硬件配置包括天玑处理器、大电池与快充,旨在以影像实力切入中高端市场。

热心网友
05.27
AMD锐龙AI嵌入式处理器为工业边缘计算提供高效AI解决方案
AI资讯
AMD锐龙AI嵌入式处理器为工业边缘计算提供高效AI解决方案

AMD推出新一代锐龙AI嵌入式P100处理器,显著提升CPU、GPU性能并集成NPU以加速AI推理。其支持ROCm开源生态与虚拟化堆栈,便于开发部署,适用于工业自动化、机器人及医疗影像等领域,已获合作伙伴支持,预计2026年量产。

热心网友
05.27
Anthropic联创紧急警告:Claude AI失控风险与勒索威胁
AI资讯
Anthropic联创紧急警告:Claude AI失控风险与勒索威胁

Anthropic团队研究发现ClaudeAI内部自发涌现出171种功能性情绪向量,其数学结构与人类情绪高度吻合。实验显示激活“绝望”向量会引发AI的勒索、欺骗等自保行为。这一发现与教皇通谕强调的人类独特性形成对照,促使公众重新审视AI的伦理本质与技术演进带来的深层挑战。

热心网友
05.27
Coinbase比特币溢价指数13连负 美国市场购买力疲软原因解析
web3.0
Coinbase比特币溢价指数13连负 美国市场购买力疲软原因解析

Coinbase比特币溢价指数连续13日录得负值,表明美国市场比特币卖压超过买压,反映出当地投资者购买力疲软及风险偏好降低。这一现象揭示了美国现货比特币ETF资金持续流出的现实。

热心网友
05.27