TL;DR
快到年中了。回头看,这半年我换掉的不只是云上的主力 Agent,也把入口从聊天窗口换成了工作台:Hermes 在云上做中枢,OpenCode 留在本地做 coding,Discord 则第一次让多 session 工作流真正成立。

背景
回头看,这半年真正变的不是某个 Agent,而是人和 Agent 协作的整体结构。
开年那阵子,主力还是 OpenClaw。当时写过两篇相关的博客,一篇是《我让龙虾替我工作了 38 天,它做了什么?》,盘它到底替我干了什么;另一篇是《Agent 装 Agent:用 OpenClaw 安装 Hermes,顺手验证自我进化》,让 OpenClaw 去安装 Hermes,顺手看看它所谓的自我进化到底是不是一回事。
那时候,Hermes 更像一个值得研究的新对象,还不是来接管 OpenClaw 的主力。
但这几个月下来,情况慢慢变了。现在云上的主力 Agent,已经从 OpenClaw 完全迁到了 Hermes。部署仍然在云上,只是机房从香港换到了新加坡,原因也很现实:Claude 在不同地区的使用政策并不一样,大陆和香港这边就用不了。真正写代码这层没有跟着一起迁走,还是继续交给本地的 OpenCode。变化最大的,反而是入口:几乎完全从 Telegram 转向了 Discord。
所以这次变化,看起来像是在换工具,实际上更像是整套 Agent 工作流换了一代。
从尝鲜到接管
当初装 Hermes,主要还是想看看它到底值不值得用。吸引人的,不是它能不能替代 OpenClaw,而是它对 Skill 生命周期和自我进化的理解:不是把 Skill 当静态说明书,而是让 Agent 在任务里自己总结、自己沉淀、自己迭代。
但后来真正让人迁过去的,不是某一个单点功能,而是它越来越贴近日常真正需要的那个位置:长期跑在云上,稳定接入口,能把会话组织起来,能接工具,能查资料,也能接住想法继续往下推。
到这一步,Hermes 就不再是 OpenClaw 旁边的实验品了,而是正式接管了云端主力的位置。
Agent 的交互容器,决定了它能不能真正变成工作流
后来把云上 Agent 的主要入口从 Telegram 切到了 Discord。原因不是 Telegram 不能用,而是它更像一个单线聊天入口。
Telegram 倒也不是没有多会话能力,而是多会话组织得不自然。普通私聊里,同一个 bot 基本只有一个主会话;想并行开多个任务,通常得额外建多个 group,或者再借助 topic。想找回、继续过去的某个会话,也总归有点费劲。
Discord 则天然是另一种结构。Hermes 本身支持 Discord,OpenCode 通过 Kimaki 接进去。现在的习惯很简单:一个 thread 开一个任务。thread 在这里不是聊天分叉,而是 session 的边界。任务被隔开了,上下文不再糊成一团,多条线并行往前推也自然得多。
所以这次迁移真正改变的,不只是换一个平台发消息,而是 Agent 第一次有了一个适合承载工作流的容器。PC 端更宽的展示区域只是表面,更关键的是,Discord 让 Agent 不再只是“回消息”,而是真正开始在一个有结构的空间里工作。
Hermes 做中枢,OpenCode 留本地
云端主力虽然已经迁到 Hermes,但 coding 这层没有一起迁走,还是继续交给本地 OpenCode。
Hermes 更像中枢:长期跑在云上,接 Discord,接工具,接住讨论,也负责把任务组织起来。OpenCode 则更像贴着仓库干活的本地执行器,真正进入项目目录,把实现往前推。
进入 coding 之后,一般还是会尽量用 OpenSpec 和 addyosmani/agent-skills 这套组合,把实现放进 Harness Engineering[1] 的约束里。它们很重要,不是因为能让 Agent 更放飞,而是因为能让实现少一点无约束的发挥,少一点“先写出来再说”的冲动。
但即便这样,对这件事还是很慎重。原因很简单:工程化流程可以补强执行,却替代不了判断。正如最近那篇《Loop Engineering 的边界与悖论》里写的,Loop Engineering 的边界,换成 LLM coding 一样成立。
所以变化并不是“越来越依赖 Agent”,而是用得越来越多,判断也越来越重。Agent 参与得更深了,但真正该自己扛的判断,并没有因此变轻,反而更重了。
不是摘要器,而是第二轮讨论对象
另一个很明显的变化,是人越来越喜欢跟 Agent 聊天、讨论,甚至 battle。
但这不是把文章丢给它让它替人读。相反,通常是自己先读,觉得某篇文章、某个观点、某个开源项目值得继续深挖,才把它转发给 Agent。而且很少只丢一个链接过去,往往会顺手带上自己的判断:觉得它哪里说得对,哪里站不住,或者真正想验证的点是什么。
这样一来,Agent 就不是摘要器,而成了第二轮讨论对象。它接住的不是原始材料,而是已经开始成形的想法,然后再配合搜索、抓取这类工具把这条线继续往下推:补资料,找原文,拆论证,找反例,必要时直接 battle 一轮。它更像一个带工具的讨论对象,而不是一个负责替人读材料的助手。某种意义上说,Agent 现在不只是进入了执行流,也开始进入思考流。
结尾
回头看,这次变化不是把 OpenClaw 换成 Hermes,也不是把 Telegram 换成 Discord 这么简单。更准确地说,是在把 Agent 从“聊天机器人”往“工作流基础设施”那个方向再推一步。
Hermes 现在是云上的中枢,OpenCode 仍然守在本地的 coding 现场,Discord 则把它们放进了一个终于适合多 session 生长的容器里。
工具当然还会继续换,模型也还会继续变。但至少到现在,这半年走下来,对这套结构的判断已经很明确了:Agent 的交互容器,决定了它能不能真正变成工作流。
参考资料
[1] Harness Engineering: https://atbug.com/harness-engineering-sdlc/
