多Agent框架设计方法及划分依据详解
时间:2026-06-24 12:00
多Agent架构适用于复杂系统,划分依据包括领域专长、功能角色、工具权限、上下文隔离及任务粒度。常见模式有层级式、对等式、中枢路由式和图编排式,设计时需平衡专注与成本,遵循职责单一与权限最小化原则。

首先需要明确一个基本判断:当系统复杂程度超出单个 Agent 的能力上限时,采用多 Agent 架构几乎是必然之举。但真正的挑战在于——如何拆分?按照什么标准拆分?拆分后怎样协调工作?这些才是值得深入思考的关键所在。
一、为什么需要多 Agent?
单一 Agent 天然存在若干明显瓶颈,简单列举几条便可看出:
- **上下文过载**:一个 Agent 需要同时兼顾代码、业务逻辑和部署环境,导致上下文窗口被严重稀释,细节信息难以完整保留。
- **指令冲突**:不同任务对 system prompt 的要求相互矛盾,例如既要“严格审查”又要“大胆创作”,Agent 会在执行中产生逻辑冲突。
- **权限不可分离**:单一 Agent 拥有全部工具权限,安全性难以保障,一旦出现漏洞可能造成系统性风险。
- **无法并行处理**:单 Agent 只能串行决策,遇到独立子任务时只能排队等待,整体效率受限。
多 Agent 的本质核心在于用拆分换取专注。每个 Agent 只聚焦于自己负责的局部领域,思路更清晰,最终效果自然更优。
二、多 Agent 框架的架构模式
1. 层级式(Manager-Worker)
┌──────────────┐
│ Manager │← 拆解任务、分配、汇总
└──────┬───────┘
┌─────────────┼─────────────┐
▼ ▼ ▼
┌──────────┐ ┌──────────┐ ┌──────────┐
│ Coder │ │ Reviewer │ │ Tester │
└──────────┘ └──────────┘ └──────────┘
- Manager 不参与具体执行,只负责编排——将任务拆解、分配、并汇总结果。
- Worker 之间没有直接通信,各自完成工作,统一将结果返回给 Manager。
- **适用场景**:任务可以被清晰地分解,存在明确的主从关系。例如一个软件需求可以拆为前端、后端、测试三个模块,Manager 按照清单指挥协调。
2. 对等式(Peer-to-Peer / Debate)
┌──────────┐ ┌──────────┐
│ Agent A │◄────►│ Agent B │
└──────────┘ └──────────┘
▲ ▲
└────────┬────────┘
│
┌──────────┐
│ Agent C │
└──────────┘
- 每个 Agent 地位平等,通过消息相互协作,没有指挥与被指挥的关系。
- 通过辩论或协商达成共识——例如让两个 Agent 分别提出方案,然后相互评价。
- **适用场景**:需要多方视角共同校验的决策,如代码审查、方案评审。让一个 Agent 编写代码,另一个 Agent 进行审查,通过讨论得出最优结果。
3. 中枢路由式(Hub-and-Spoke / Router)
┌──────────────┐
│ Router │← 意图识别 → 路由
└──────┬───────┘
┌─────────────┼─────────────┐
▼ ▼ ▼
┌──────────┐ ┌──────────┐ ┌──────────┐
│ 前端Agent │ │ 后端Agent │ │ 运维Agent │
└──────────┘ └──────────┘ └──────────┘
- Router 根据识别到的用户意图,将请求分发给对应的专业 Agent。
- Agent 之间通常不直接通信,各自独立处理任务。
- **适用场景**:按业务领域划分,请求之间相互独立、无需协作。例如客服系统中,用户咨询订单问题→订单 Agent,咨询物流问题→物流 Agent。
**与层级式的核心区别**:Router 的角色是调度员,只负责指引“你应该去找谁”;Manager 则像项目经理,负责规划“我来安排具体怎么执行”。
| 中枢路由式 | 层级式 |
| 顶层角色 | 调度员(仅做意图识别与分发) | 管理者(制定计划、分配任务、做决策) |
| 是否参与执行 | 不参与,分发后即完成 | 全程参与,可动态调整计划 |
| 子节点关系 | 平行,互不感知 | 从属,向管理者汇报 |
| 是否有“计划”概念 | 无,收到请求即分发 | 有,先拆解再分配 |
| 典型类比 | 电话总机接线员 | 公司经理带领团队 |
4. 图编排式(Graph / DAG)
┌──────────┐
│ Entry │
└────┬─────┘
▼
┌──────────┐
│ Planner │
└────┬─────┘
▼
┌──────────────────┐
│ Parallel Fork │
├────────┬─────────┤
▼ ▼ ▼
┌─────┐ ┌─────┐ ┌─────┐
│Agent│ │Agent│ │Agent│
│ A │ │ B │ │ C │
└──┬──┘ └──┬──┘ └──┬──┘
└───────┼────────┘
▼
┌──────────┐
│ Merger │ ← 条件路由/循环
└────┬─────┘
▼
┌──────────┐
│ Exit │
└──────────┘
- 使用有向图定义 Agent 的执行流程,支持并行执行、条件分支、循环等操作。
- 典型实现:LangGraph、CrewAI Flow。
- **适用场景**:复杂的多步骤流水线作业,需要精细控制执行顺序。例如数据处理流程:先清洗、再转换、最后加载,中间可能包含分支与循环。
三、划分 Agent 的依据
这是多 Agent 设计中最为核心的问题。以下从几个维度帮助判断。
1. 按领域/专业知识划分
| 维度 | 说明 | 示例 |
| 技术栈 | 不同技术领域需要独立的专业 prompt | 前端 Agent(React) vs 后端 Agent(Go) |
| 业务领域 | 不同业务逻辑无法共享上下文 | 订单 Agent vs 支付 Agent vs 物流 Agent |
| 数据源 | 不同数据源需要不同的解析能力 | SQL Agent vs 日志 Agent vs API Agent |
**判断标准**:如果需要为同一个 Agent 编写两套完全不同的 system prompt,那就该拆分了。
2. 按功能角色划分
这是经典的“三段式”拆分:
Planner ──→ Executor ──→ Reviewer
│ │
└────── 反馈循环 ──────────┘
| 角色 | 职责 | 特点 |
| Planner | 理解需求、拆解子任务、制定执行计划 | 偏重推理能力,较少调用工具 |
| Executor | 执行具体的子任务,调用工具 | 偏重工具调用,较少参与规划 |
| Reviewer | 检验结果、发现问题、反馈修正 | 偏重批判性思维,较少参与创造 |
**判断标准**:如果一个 Agent 既要“思考”又要“执行”还要“检查”,三个阶段互相干扰,效果必然不佳。
3. 按工具/资源边界划分
| 维度 | 说明 |
| 权限隔离 | 部署 Agent 拥有生产权限,代码生成 Agent 则没有 |
| 资源绑定 | 每个 Agent 只挂载自身所需的工具,避免 prompt 膨胀 |
| 安全边界 | 敏感操作(如删库、退款)仅由特定 Agent 执行 |
**判断标准**:如果两个操作所需的权限级别不同,就应该分配到不同的 Agent。
4. 按上下文隔离需求划分
这是最容易被忽略但极其重要的依据:
Agent A: 处理用户 A 的请求(上下文包含用户 A 的敏感数据)
Agent B: 处理用户 B 的请求(上下文包含用户 B 的敏感数据)
→ 如果合并为一个 Agent,存在上下文泄露风险
同样的原则也适用于:
- 不同代码库(代码 Agent A 不应看到代码 Agent B 的项目上下文)
- 不同客户/租户
**判断标准**:如果上下文中包含不应互通的信息,必须拆分。
5. 按任务粒度划分
| 粒度 | 示例 | 优缺点 |
| 粗粒度 | 一个 Agent 负责完整的“用户注册”流程 | 简单,但上下文较长 |
| 细粒度 | 校验 Agent → 存储 Agent → 通知 Agent | 灵活可复用,但通信开销增加 |
**判断标准**:子任务之间是否需要频繁交换中间结果?
- 需要频繁交换 → 合并为一个 Agent(减少通信开销)
- 交换很少 → 拆分为多个 Agent(实现独立并行)
四、Agent 间通信机制
| 方式 | 说明 | 适用场景 |
| 共享内存/状态 | 所有 Agent 读写同一个状态对象 | 简单场景,强调强一致性 |
| 消息队列 | Agent 之间通过消息异步通信 | 解耦、便于扩展 |
| 回调/事件 | Agent 完成某个阶段后触发回调 | 流水线式处理 |
| 直接输出传递 | Agent A 的输出直接作为 Agent B 的输入 | 简单直连 |
| 黑板模式 | 所有 Agent 在共享空间读写中间产物 | 协作探索型任务 |
五、设计决策框架
面对一个系统,可以按以下顺序做决策:
1. 任务是否可并行?
├─ 是 → 考虑多个 Executor Agent 并行
└─ 否 →
2. 是否需要专业分工?
├─ 是 → 按领域/功能拆分
└─ 否 →
3. 上下文是否包含隔离信息?
├─ 是 → 必须拆分
└─ 否 → 单 Agent 即可,不要过度设计
**原则:能用单 Agent 解决的问题,就不要引入多 Agent。**
多 Agent 的隐性成本:
- **通信开销**:Agent 之间传递信息会消耗 token
- **协调复杂度**:出错时难以定位问题出自哪个 Agent
- **延迟累积**:串行 Agent 的延迟会叠加
六、总结
> **划分 Agent 的核心原则 = 职责单一(Single Responsibility)× 上下文隔离 × 权限最小化**
推荐的起步架构:
用户请求 → Router(意图识别)
│
┌─────────┼─────────┐
▼ ▼ ▼
Planner Executor Reviewer
│ │ │
└─────────┼─────────┘
▼
共享状态 / 黑板
- Router 决定采用哪个流程
- Planner 拆解任务
- Executor 执行(可多实例并行)
- Reviewer 校验,若不通过则回退到 Planner/Executor
说到底,设计多 Agent 系统并非越复杂越好,而是要在“专注”与“成本”之间寻找平衡。先划定清晰的边界,再确定好通信规则,剩下的交给 Agent 自主运行即可。