Harness：Claude Code先组队再开工

时间：2026-06-19 14:12

Harness作为ClaudeCode的团队架构工厂，通过领域描述自动生成领域化Agent团队和技能，提供流水线、并行探索、专家池、生产-审查、监督者、层级委托六种架构模式，适用于复杂编程任务，将分工固化至 claude目录。

当 AI 编程任务逐渐变得复杂，单人通用助手往往被迫同时扮演产品分析师、架构师、实现者、测试工程师、审查者以及文档作者等多重角色。在短期简单任务中这种模式尚可应对，但一旦任务跨越模块、涉及多个领域并需要持续多轮沟通，单一 Agent 的上下文窗口和判断力就会明显不足。revfactory/harness 的解决思路相当直接：不要试图让一个 Agent 包揽全部工作，而是先为项目设计一支领域化的 Agent 团队。

它将自己定位成 Claude Code 的“团队架构工厂”。你只需描述项目所在的领域，或者表达诸如 “build a harness for this project” 这样的意图，它就能自动生成适合该项目的 agents 和 skills，并从预设的架构模式中挑选出最匹配的团队组织方式。换句话说，Harness 并非直接帮你编写某个功能代码，而是帮你搭建一支“更适合完成这个项目的 AI 团队”。

它为什么不是普通插件

普通 AI 编程插件通常只提供一组固定的命令：写代码、查 bug、做 review、生成测试等等。Harness 的抽象层级更高——它试图根据你的项目类型生成一套完整的团队结构，然后将团队成员及其技能写入 .claude/agents/ 和 .claude/skills/ 目录。简单来说，它不是一个具体的技能，而是“生成技能以及装技能的容器”。

README 将其放在 L3 Meta-Factory 层，虽然表述有些抽象，但核心意图很实在：L1 可能是具体工具，L2 是跨工具流程，而 L3 则是生成流程和团队架构的系统。Harness 关注的重点是“如何为某个领域构造 Agent 团队”，而非“如何解决某一个固定任务”。

六种团队架构模式

那么，具体有哪些团队模式可供选择？项目提到了六种预设架构，深入理解它们才能真正看懂 Harness。

Pipeline 适用于顺序明确的任务，好比一条流水线：需求分析 → 设计 → 实现 → 测试 → 文档，每个阶段清晰，输出逐步传递。

Fan-out/Fan-in 适用于并行探索场景，让多个 Agent 各自研究不同方案，最后汇总择优，能有效避免单一思维路径。

Expert Pool 适用于领域复杂的项目，比如金融系统需要安全、数据、后端、合规、前端等不同领域的专家协同工作。

Producer-Reviewer 适用于强调质量的任务，一个 Agent 负责产出，另一个 Agent 负责审查，从而减少自我确认偏差。

Supervisor 适用于需要统一协调的任务，监督者负责拆解任务、分配工作、检查进度以及处理异常情况。

Hierarchical Delegation 则更适合大规模任务，将复杂目标逐级拆解成子任务，让不同层级的 Agent 承担不同粒度的判断责任。

工作流：从领域描述到团队落地

工作流程大致分为六个阶段，每个阶段都有明确的用意。

第一阶段：领域分析。系统需要摸清项目背景、任务复杂程度、常见风险点以及需要哪些专业角色。

第二阶段：团队架构设计。它会判断该采用何种团队模式，或者如何组合多种模式。例如，前端重构任务可能更适合 Producer-Reviewer，而研究型任务则可能更匹配 Fan-out/Fan-in。

第三阶段：生成 Agent 定义。将“安全审查者”“后端实现者”“测试策略师”等角色转化为 Claude Code 可识别的 agent 文件。

第四阶段：生成 Skills。只有角色还不够，Agent 还需明确何时触发、如何工作、读取哪些上下文以及输出什么格式。

第五阶段：编排。多个 Agent 之间要能够传递数据、处理错误、合并结果，否则团队只会是一堆孤立角色。

第六阶段：验证。项目强调要进行 dry-run、触发验证，以及 with-skill 与 without-skill 的对比测试。这一步相当关键，因为生成的团队必须证明自己确实比默认方式表现更优。

适合的使用场景

Harness 适用于任务复杂、角色分工自然存在的项目，例如：

大型代码库重构。
多模块产品开发。
安全审计与修复计划。
数据平台或后端系统设计。
游戏、前端、移动端等需要多角色协作的项目。
需要将团队经验沉淀为 Claude Code agents 和 skills 的长期项目。

如果你的团队已经习惯反复对 AI 说“先让架构师看一下，再让实现者写，再让 reviewer 检查”，那么 Harness 的概念就非常自然——它正是要把这种分工固化下来。

不适合的场景

如果只是修改一个小 bug、编写一个简单脚本、或者补一段文案，那么 Harness 可能显得过于笨重。因为团队架构本身是有成本的：需要生成、理解、维护，还要确保触发正确。

另外，它明显围绕 Claude Code 生态设计。如果你的主要工作环境不是它，就需要先评估兼容性，或者寻找类似概念的移植方案。README 中也提到了它与 Archon、ECC、meta-harness 等邻近项目的关系，这说明它处于一个快速演进的 AI 编程工具生态之中。

安装与使用路线

README 提供了市场（marketplace）安装方式，也支持直接作为全局 skill 安装。最佳上手方式不是直接扔进生产项目，而是找一个中等复杂度的试验项目运行一次，让它生成 agents 和 skills，然后仔细审查输出内容。

建议上手步骤：

选择一个你熟悉的小型或中型项目。
运行 Harness 生成团队。
查看生成的 .claude/agents/ 和 .claude/skills/ 目录。
让默认的 Claude Code 与 Harness 团队分别处理同类任务。
比较任务分解、输出质量、审查深度以及上下文使用情况。

如果生成结果过于复杂，就收窄团队；如果角色过于泛化，就补充领域描述；如果触发不稳定，就调整 skill 描述。

二次开发可以看哪里

仓库本身不大，README、docs/quickstart.md、docs/experimental-dependency.md 是理解项目的入口。真正值得研究的是它生成的 agent 和 skill 结构，以及六种架构模式如何映射到不同任务。

如果你想把这个思路迁移到其他 AI 编程环境，重点不是复制文件，而是复制方法论：领域分析、团队模式选择、角色定义、技能生成、编排协议、验证对比。

读完后的判断

Harness 代表了 AI 编程的一个明显趋势：从“一个大模型助手”走向“可配置的 AI 工程组织”。任务简单时，单个助手最快；任务复杂时，结构本身就是一种能力。Harness 值得仔细阅读，正因为它将这种结构显式化了。

来源

仓库：github.com/revfactory/…

来源：https://juejin.cn/post/7647876527113486371

Claude

上一篇Temporal工作流替换串行Agent管道效率提升3倍 下一篇AI自动化领域ClaudeCode智能编程工具上线

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。