游乐游手机版
首页/AI教程/文章详情

Hermes Agent 83K星标 六种后端零基础成长 如何抢走OpenClaw用户

时间:2026-06-03 12:11
HermesAgent在6周内获得83KStar,其三层记忆系统采用有限记忆与主动压缩策略,自学习循环机制使工具调用次数从25次降至8-10次。与OpenClaw的全量持久化不同,它通过个性化技能成长实现越用越聪明,成为2026年AIAgent赛道分水岭。

2026年2月25日,Nous Research在GitHub上很低调地发布了一个新仓库:hermes-agent。

没有Product Hunt首发,没有YC Demo Day,也没有KOL们集体造势。就一个README文件和一行安装命令。

然后,事情就开始失控了。

第一周,Star数破1万。社区的普遍反应是:“又一个Agent框架?”第二周,Star数破3万。反应变成了:“等等,这东西怎么越用越聪明?”第六周,Star数破6万。网络上开始出现“从OpenClaw迁移到Hermes”的教程。截至4月13日,这个项目已经积累了83.3K Star,424位贡献者,以及4113次提交。

做个对比,OpenClaw用了将近一年时间才站稳247K Star(现在涨到了355K)。Claude Code的开源替代品Claw Code两小时破5万,但那更多靠的是事件驱动——源码泄露带来的热度爆炸。

Hermes Agent的增长曲线完全不同——它是被实打实用出来的,而不是被炒起来的。

这一点,很罕见。


PART 2:为什么要写这篇文章

先谈一下背景。目前,整个工作流深度绑定在Claude Code和OpenClaw这个生态里。从晨间港股监控到日常研究,OpenClaw是核心引擎。所以当看到越来越多开发者从OpenClaw迁移到Hermes Agent时,第一个反应跟大家一样:这东西到底比OpenClaw强在哪里?

花了两天时间研究后,得出的结论是——它并不是“比OpenClaw强”。它根本就是另一种生物。

如果非要打个比方,OpenClaw像一个功能极其强大的工具箱,装满了扳手和螺丝刀,拿来就能用;而Hermes Agent则更像一个会成长的实习生。实习生刚来的时候什么都不会,但三个月后,它可能比你自己还懂你的项目。

这不是好坏之争。这是路线之争。


PART 3:三层记忆——Hermes Agent的核心武器

先说最关键的差异点:记忆系统。

\

OpenClaw的路线:全量持久化 + 向量检索

OpenClaw的记忆策略是“什么都存”。所有对话、上下文、文件操作记录,全部灌进向量数据库。需要回忆时,就用embedding做语义检索,拉出最相关的几条。

这个做法的优点显而易见:不丢信息,上下文窗口理论上无限大。

但在实际使用中,会遇到一个非常具体的问题:用到第三个月,噪音就太大了。你让它回忆“我上周对股票分析系统做了什么修改”,它可能把三个月前一次完全无关的调试记录也拉出来,只因为语义上沾了点边。向量检索的精度会随着数据量增加而线性下降——这不是bug,这是架构的天生缺陷。

Hermes Agent的路线:有限记忆 + 主动压缩

Hermes Agent的设计哲学正好相反。

它的记忆系统分为三层:

层级容量类比机制
会话记忆当前上下文窗口短期记忆标准LLM上下文
持久记忆MEMORY.md + USER.md ≈ 1300 tokens长期记忆主动压缩、合并、淘汰
技能记忆SKILL.md 文件集合肌肉记忆从经验中自动生成

注意那个数字:1300 tokens的硬上限。

这不是限制。这是刻意的设计。

Hermes Agent的设计者认为:对LLM来说,少量精准的记忆,远比大量模糊的记忆更有价值。当记忆接近上限时,Agent会自动做三件事:合并相似条目、删除过时信息、将多条记录压缩成一条摘要。

讽刺的是,自己在WorkBuddy里用的MEMORY.md机制,跟这个设计理念几乎一模一样。MEMORY.md不超过1KB,记的都是“港股自选股列表”、“企业微信Webhook Key”、“养虾系列存放路径”这类高复用信息。日志文件则按日存,30天后蒸馏。这套机制是在实践中自己摸索出来的——而Hermes Agent把它做成了产品级的内置能力。

这说明了一个问题:好的Agent记忆系统,应该是有限的、可压缩的、主动管理的。全量存储,反过来可能是懒惰的做法。


PART 4:自学习循环——最值得警觉的功能

记忆系统是基础设施。真正让Hermes Agent从“又一个Agent框架”升级为“有点东西”的,是它的闭环自学习机制。

它的运作原理是这样的:

  1. 触发条件:完成一个需要5次以上工具调用的复杂任务。
  2. 自动产出:生成一份SKILL.md——包含操作步骤、踩过的坑、验证方法。
  3. 自检机制:每15次工具调用,Agent会主动暂停并做一次自检(“我做到哪了?有没有偏离目标?”)。
  4. 持续迭代:下次遇到类似任务时,调用已有的Skill,用完后根据新经验更新它。

有用户实测数据显示:一个月后,同类任务的平均工具调用次数从25次降到了8-10次。

这个数字背后意味着三件事:成本下降70%(LLM API调用量直接打三折)、延迟降低(更少的tool call = 更快的响应)、准确率上升(因为它记住了哪些路走不通)。

作为对比,OpenClaw也有技能系统——ClawHub上有超过13000个社区共建的技能。但那是“通用教材”:写好了给所有人用,覆盖面广,但不一定适配你的具体环境。

Hermes Agent的技能是“私人笔记”:从你的操作中长出来的,包含了你的项目结构、你的工具链偏好、你踩过的坑。

一个是标准化的SOP,一个是个性化的经验沉淀。两种路线没有对错,但Hermes Agent的路线有一个碾压级优势——它的技能与你的使用时长正相关。用得越久,差距越大。

这就是为什么早期用户很难下定决心迁移出去。


PART 5:为什么Hermes Agent能爆火——三个结构性原因

回到那个最核心的问题:凭什么是它?

AI Agent框架在2026年不下百个。AutoGPT、CrewAI、LangGraph、MetaGPT……为什么Hermes Agent能在6周内冲到83K Star?

原因1:卡位精准——OpenClaw太重,Claude Code太专

Claude Code只在终端/IDE里存活,不碰消息平台,不做定时任务,不持久化记忆。它是最好的编码助手,但你一关掉终端它就“死”了。

OpenClaw走的是另一个极端——22个消息平台、13000个技能、全量持久化。功能极度丰富,但配置复杂度也极高。很多人用OpenClaw的前两周,80%的时间都花在调配置和排错上。

Hermes Agent恰好卡在了中间:比Claude Code多了持久记忆和消息平台支持(不用守着终端),比OpenClaw轻得多(一行curl安装,五步配置),比AutoGPT实用(它不是“自主运行”的表演,而是真正能干活的工具)。

不做最强的,做最趁手的。这种产品感觉非常Nous Research——他们做Hermes系列大模型也是这个路线:不追SOTA榜单,追“开发者用起来最舒服”。

原因2:可感知的成长性

大多数AI产品的能力曲线是这样的:第一天很惊艳,到第三天就“也就那样了”。

Hermes Agent的曲线是反过来的:第一天啥也不会,到第三十天已经能独立处理你80%的常规任务。

这种“越用越好”的体验在消费品领域叫用户粘性。在AI Agent领域,它创造了一种前所未有的锁定效应——你不是因为沉没成本不想走,而是因为你的Agent真的比别人的Agent更懂你。

OpenClaw的锁定靠生态(插件、技能、MCP服务器)。Hermes Agent的锁定靠经验积累(你用得越久,它学得越多)。后者更可怕,因为生态可以迁移,经验不可以。

原因3:Nous Research的信任背书 + MIT协议

Nous Research不是一家刚成立的创业公司。他们训练的Hermes系列大模型(Hermes 1/2/3)是开源社区里最受信赖的模型系列之一。Hermes 3的技术报告在arXiv上的引用量排在了开源模型前五。

MIT协议意味着:零商业限制、零遥测、数据全本地。在Anthropic封杀OpenClaw的大背景下,“不被卡脖子”变成了一个非常有吸引力的卖点。


PART 6:几个判断

分析到这里,可以给出几个自己的判断。

判断1:Hermes Agent和OpenClaw不是替代关系

文章写到这里,可能有人会以为要“叛变”——从OpenClaw转投Hermes。

不会。

因为两个产品解决的问题根本不同:OpenClaw解决的是“我需要一个中枢来调度多个AI Agent协作”的问题。多渠道、多模型、多工具、多人协作——这是OpenClaw的领地。Hermes Agent解决的是“我需要一个长期陪伴的私人Agent”的问题。自学习、持久记忆、个性化技能——这是Hermes的领地。Claude Code解决的是“我需要最好的代码生成质量”的问题。SWE-bench榜首不是白来的。

三者完全可以共存。事实上,社区已经有人在做混合方案——用Claude Code写代码,用OpenClaw做多渠道分发,用Hermes Agent做个人知识管理。

判断2:自学习是2026年Agent赛道的分水岭

2023年的Agent赛道,核心比的是“能调用多少工具”。2024年的Agent赛道,核心比的是“上下文能塞多长”。2025年的Agent赛道,核心比的是“能接入多少平台”。到了2026年,核心比的将是“能不能自己变强”。

Hermes Agent是第一个把自学习做成产品级体验的框架。它不是学术Demo,不是“理论上可以”,而是真的实现了一个月后tool call从25次降到8次。

如果OpenClaw不跟进类似的自学习机制,它在个人Agent场景下会被Hermes越拉越远。如果Claude Code不做持久记忆,每次开新会话都要重新解释项目背景,开发者迟早会感到厌烦。

自学习机制不是nice-to-ha ve。它是接下来三年的主战场。

判断3:警惕“养宠物”心理

最后一个判断,算是泼一盆冷水。

“越用越懂你”的另一面,是“越用越离不开”。

当你的Hermes Agent积累了半年的技能和记忆,你切换到另一个框架的成本就会变得极高。这不是技术壁垒——hermes claw migrate能搬走SOUL.md和配置——但那些从你日常操作中自动生成的SKILL.md、从你的反馈中精炼的记忆压缩策略,这些都是不可迁移的隐性知识。

某种程度上,这比OpenClaw的生态锁定更可怕。生态锁定至少你看得见(13000个技能摆在那里),而经验锁定是无形的。

所以建议是:用Hermes Agent,但保持方法论的可迁移性。你的核心认知——怎么拆解任务、怎么做质量验证、怎么设计工作流——必须存在于你自己的脑子里,而不是Agent的SKILL.md里。这条建议其实对所有AI工具都适用。


最后

从OpenClaw被封杀,到Claw Code四天重写,再到今天Hermes Agent的83K Star——2026年AI Agent赛道的节奏已经快到不讲道理了。

但节奏越快,越要抓住不变的东西。

OpenClaw教会我们“接入一切”的能力。Hermes Agent教会我们“记住一切”的价值。Claude Code教会我们“执行一切”的底线。

三种哲学,三条路线,最终都指向同一个问题:你要建造的到底是一个工具,还是一个伙伴?

答案是两者都要。但如果只能选一个——选伙伴。工具会被淘汰,伙伴会成长。

来源:https://cloud.tencent.com.cn/developer/article/2680777
上一篇AI智能体实战:从口头描述到完整专利说明书,2小时搞定 下一篇AI辅助GPU并行编程:用OpenClaw重写优化CUDA内核实战教程
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
RAG四标融合企业知识资产体系四库协同GEO优化实践
AI教程 · 2026-07-01

RAG四标融合企业知识资产体系四库协同GEO优化实践

生成式AI正在彻底改写信息检索的底层逻辑。传统SEO依赖关键词堆砌和外链建设的策略,在大模型的内容采信规则下已经基本失效。取而代之的,是生成式引擎优化(GEO)。它不再关注外链数量,而是重点衡量你的知识是否结构化、证据链是否坚实、信源是否可靠——这些维度才是RAG(检索增强生成)架构真正看重的核心指

一个普通上班人分享WorkBuddy使用心得与真实体验
AI教程 · 2026-07-01

一个普通上班人分享WorkBuddy使用心得与真实体验

前言 最近我开始使用WorkBuddy——这是腾讯推出的一款AI办公工作台。差不多用了一周时间,趁印象还新鲜,把真实的使用感受记录下来,给还在犹豫的朋友做个参考。不吹不黑,只说实际体验。 初印象:不只是聊天机器人 之前用过不少AI工具,大多数就是个对话框,你问它答,答完就结束了。WorkBuddy不

AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录
AI教程 · 2026-07-01

AI幻觉变真功能实战教程:App Inventor 2视频录制拓展一周开发实录

先讲一个颇具戏剧性的开端。 这件事的开端颇显荒诞——有用户前来咨询,称AI Pro版的介绍中提到我们有一款“视频录制拓展”。团队全体成员都感到困惑,翻遍产品列表,发现根本不存在该组件。AI那种“一本正经胡说八道”的能力,这次确实让我们陷入尴尬。 按常理,此事到此便可结束——一句“抱歉,暂时没有这个拓

别再混淆OLAP和SQL-on-Hadoop两者查询本质不同
AI教程 · 2026-07-01

别再混淆OLAP和SQL-on-Hadoop两者查询本质不同

OLAP和SQL-on-Hadoop虽都使用SQL查询数据,但本质不同。SQL-on-Hadoop负责海量数据批量计算与ETL,查询速度秒级至分钟级;OLAP通过预聚合实现毫秒级多维分析,适合BI报表。两者在数据平台分工协作,前者是后厨加工,后者是前台快速服务。

GEO优化深度解析:AI偏好FAQ还是长文内容?
AI教程 · 2026-07-01

GEO优化深度解析:AI偏好FAQ还是长文内容?

在GEO优化中,AI对内容形式无统一偏好:FAQ在简单查询中引用率41%,长文在复杂查询中达58%。内容应基于用户意图选择形式,FAQ适配简单事实类问题,长文建立主题权威,两者互补而非替代。