MiMo Code 的任务编排与协作 Agent,不是简单地把多个模型或工具堆在一起,而是通过工程化设计让不同角色的 Agent 各司其职、彼此接力,最终形成稳定可控的编程协同流。
任务自动拆解与阶段化调度
当用户抛出一个模糊需求(比如“做个能查天气的微信小程序”)时,主 Agent 并不会立刻撸起袖子写代码,而是先启动一个专门的规划子 Agent 来做结构化拆解:明确技术栈、接口来源、UI 层级、测试边界。拆解的结果会被转化为可执行的任务节点,存入调度队列。每个节点都绑定了对应的能力模型(比如 UI 生成用 MiMo-V2.5,API 调用走 DeepSeek-R1),这样一来,就避免了单一大模型去硬扛全链路的重任——这是很多协作方案容易忽略的工程陷阱。
- 任务节点支持手动干预:用 /edit step2 修改某环节的输出,其他已执行的步骤不受影响。
- 失败节点自动降级:如果某个模型调用超时了,调度器会切换到备用模型,或者启用本地缓存逻辑来兜底,不至于整个流程卡死。
- 节点间带状态快照:上一环节生成的 mock 数据、API schema,会自动注入到下一环节的上下文中,无需重复传递。
多 Agent 协同记忆共享机制
真正的协作,不是靠反复复述背景信息来达成的,而是靠一个统一的记忆空间。MiMo Code 的持久记忆系统,为整个 Agent 群体提供了一个项目级的“共享大脑”:
- 项目记忆库负责记录架构决策,比如“选用 Taro 而非原生开发”、“后端用 FastAPI”这类关键判断。
- 会话检查点会在每次关键交互后自动存档。万一中断了,恢复时直接加载最近的检查点,不需要重跑一遍历史流程。
- 任务进度追踪器实时标记各 Agent 的当前状态,例如“UI 设计完成|API 接口待联调|单元测试未覆盖”。
所有 Agent 读取的是同一份记忆简报,不需要重复解释上下文,也不需要用户手动粘贴历史对话来“同步信息”,这大大降低了协作过程中的沟通摩擦。
Compose 模式下的轻量协作入口
按 Tab 键切换到 Compose 模式后,背后的协作逻辑对用户是完全透明的。你只需要说清楚目标,系统就会自动分配角色:
- 设计 Agent 负责输出组件结构图和状态流转说明。
- 编码 Agent 则基于设计稿生成带注释的源码,并同步更新项目记忆。
- 测试 Agent 自动生成 Jest 或 Pytest 用例,一旦测试失败,会触发审查 Agent 回溯定位问题。
- 审查 Agent 不只检查语法,还会比对当前代码与项目记忆中的架构约束,比如“禁止使用 localStorage”这类规则。
整个流程默认是串行推进的,但支持用 /parallel auth, ui 指令让认证模块与 UI 模块并行开发,由调度器来协调资源和合并冲突,灵活性相当高。
语音驱动的跨 Agent 指令中转
语音输入在这里不只是替代键盘打字,而是打通协作链路的一个关键触点:
- 说一句“回滚登录页的样式修改”,语音引擎识别意图后,版本 Agent 就会去执行 git checkout。
- 说“把地图组件换成高德 SDK”,调度 Agent 会自动替换依赖、更新配置,并通知测试 Agent 补充地理围栏相关的测试用例。
- 问“上次讨论的权限模型是什么”,记忆 Agent 会直接从项目记忆中提取会议摘要和决策依据。
语音指令经 ASR 引擎转为文本后,先由意图解析 Agent 进行分类,再路由到对应的职能 Agent,整个过程不经过主模型中转,响应更快,意图解析也更精准。
