先说几个核心判断。
如果你仅仅将AI当作聊天助手使用,那么Codex的项目功能其实已经足够。但若你想构建一个能够长期稳定运行的AI Agent CEO,仅靠项目级别的对话空间,恐怕远远不够。它需要一个更接近“主体”的载体——既要拥有灵魂文件,也要具备真实的执行能力。这才是问题的关键所在。
最近我花了些时间安装了Hermes,真正想测试的并非它好不好用,而是想弄清楚:Agent CEO究竟应该由什么样的载体来承载。
核心判断图
1. Codex 项目能控制行为,但缺乏主体感
Codex的项目功能我已经用了不短的时间。它的局限不在能力本身,而在于形态。
你可以通过项目里的AGENTS.md文件来设定Agent的行为边界——规范、工作方式、约束条件,写清楚之后,确实能影响模型在调用时的系统行为。
但客观来说,项目终究只是项目。
它更像一个对话空间,远未达到“一个可以长期倾诉、可以彼此互为延伸的主体”那种程度。在设计AI Agent CEO时,核心理念就是“互为延伸”的关系:Agent CEO是我在数字世界的延伸,我则是它在物理世界的延伸。一旦这个设定成立,Agent就不能仅仅是一个项目文件夹里的对话对象。它必须拥有自己的主体感。
2. SOUL.md 解决的不是功能,而是身份认同
在Claw系列中,有一个我很在意的设计:SOUL.md。
从技术层面看,AGENTS.md 和 SOUL.md 最终都可能影响大模型调用时的系统行为,能力上存在重叠。但命名本身会直接改变使用方式。
AGENTS.md更像一份工作规范;而SOUL.md更像是一份身份确认书、使命宣言与长期性格的锚点。一个告诉Agent怎么干活,另一个更接近于告诉它“你是谁”。这绝非玄学。在长期运行的Agent系统里,身份文件会直接影响它如何理解任务、如何做取舍、以及如何保持行为的一致性。
所以这次测试Hermes,目标很明确——用Hermes的SOUL.md给Agent CEO注入灵魂,再通过ACP来控制电脑上的Codex,补齐执行能力这一环。
架构图
3. 新架构:Hermes 承载主体,Codex 负责执行
设想的架构非常直接:
第一层,由Hermes来承载Agent CEO的主体,SOUL.md负责定义身份、目标、风格和长期的行动倾向。
第二层,ACP作为控制通道,确保Hermes不仅能思考,还能控制电脑上的各类工具。
第三层,Codex命令行负责具体的执行环节。写代码、修改文件、运行命令、验证结果,这些仍然交给Codex这类工具去完成。
第四层,我自己在另一台Mac上使用Codex桌面应用。AI Agent CEO与人类操作入口分开,各司其职。
这样拆分的关键在于:主体感、工具调用、人类操作,这三者不能混为一谈。
4. 这不是“换个工具试试”
大多数人看桌面Agent,首先会问功能:能不能控制电脑?能不能写代码?能不能接MCP?能不能记忆?
这些当然重要,但并非需要优先解决的问题。
第一个问题应该是:这个Agent到底“是谁”?
如果它只是一个可以调用工具的聊天窗口,那再强大也只是一个助手。但如果它有稳定的身份、长期的执行目标,并拥有独立的执行通道,它才有可能真正成为数字世界里的工作主体。这也正是我对Hermes的官方桌面应用格外关注的原因。官方维护的桌面应用,至少有机会降低安装和维护带来的隐性成本。
分工图
工具理应为人类提效,而不是让人每次升级都去折腾配置文件。这个教训,在OpenClaw上已经不想再经历第二次了。
5. 我会推荐谁尝试
结论是:谨慎推荐。
如果你正在做个人Agent、数字分身、AI Agent CEO、公司工作流自动化,那么Hermes这条路值得尝试。尤其是当你已经意识到,“提示词”和“项目规则”已经不足以承载一个长期主体时,SOUL.md这个设计本身就值得仔细研究。
但如果你只是想要一个更好用的AI编程工具,建议先别折腾。先把Codex、Claude Code、Cursor这套工作流跑顺,比换一堆桌面Agent重要得多。
这套架构真正要验证的,是下面三件事:
- SOUL.md能否让Agent CEO的身份保持长期稳定。
- ACP控制Codex的执行链路是否足够顺畅。
- Hermes的官方桌面应用能否真正减少维护负担,而不是制造新的配置麻烦。
6. 下一步:长期测试,不急于下结论
现在我不会说Hermes一定比OpenClaw好,也不会断言它就是Agent CEO的终极载体。
目前能确认的只有:我已经安装了Hermes,并准备将它作为新的架构实验对象。
接下来要看的不是宣传页面,而是真实的工作成果:它能不能持续组织资料、知识、Agent和任务;能不能让AI Agent CEO在数字世界里完成公司运营的大部分工作;能不能让人类只去处理物理世界中那些不可避免的事务。
如果这条链路跑通,Agent CEO就不再只是一个概念。它将变成一个拥有灵魂文件、控制通道和执行工具的、真实在运行的工作主体。
这,才是安装Hermes真正想要验证的事情。
长期测试图
