MiMo Code 通过主 Agent 统一调度、多个子 Agent 协同执行(涵盖测试、采集、分析、报告环节),实现性能评估的自动化流程。其核心在于借助 Compose 模式将目标精确拆解,配合四层记忆体系保障历史数据可比对,并通过 /dream 机制沉淀过往经验,从而让用户只需专注于问题定义和最终结论确认。

初次接触 MiMo Code 进行性能评估协作时,许多人习惯性地想到编写自动化脚本。但真正的关键在于,让多个子 Agent 各司其职、协同推进,同时共享上下文信息——主 Agent 担任指挥官角色,子 Agent 则分别执行测试、采集数据、分析结果、生成报告等任务。
明确性能评估目标,进入 Compose 模式
首先需要清晰定义评估目标:是某个函数的吞吐量表现?API 接口的 P99 延迟指标?还是检查整套微服务在压力测试下的内存泄漏趋势?目标越具体,Agent 的编排精度和协作效率就越高。确认目标后,按下 Tab 键 切换至 Compose 模式,输入自然语言指令,例如“对 service-auth 模块实施 1000 QPS 条件下的 CPU 占用率与响应延迟评估,输出对比分析图表并给出性能瓶颈优化建议”,后续的工作将交由系统自动处理。
系统自动拆解任务,分发子 Agent
目标一经明确,系统便会自动拆解任务,生成一组具备专属工具和共享上下文的协作子 Agent:
- Test Runner 子 Agent:调用 wrk 或 k6 工具启动压力测试,实时上报原始性能指标。
- Profiler 子 Agent:在相同时间窗口内连接进程,采集火焰图(flame graph)与 GC 日志。
- Analyzer 子 Agent:拉取 Prometheus 数据与日志片段,识别延迟峰值及线程阻塞模式。
- Reporter 子 Agent:汇总三方结果,生成包含图表链接、根因推导与优化建议的 Markdown 报告。
最为关键的是,所有子 Agent 共享同一份项目记忆与当前会话的 Checkpoint,在执行过程中可随时取消某一子任务,不影响其他流程的持续运行。这就像一个配合默契的团队,个别环节出现问题时,其余成员依然能够正常推进工作。
持久记忆保障跨轮评估一致性
多次性能评估并非相互孤立的事件。MiMo Code 的四层记忆体系(涵盖项目级、会话级、任务级、工具级)会自动记录每次评估的 baseline 数据、环境配置(如 JVM 参数、容器资源限制),甚至包括你之前标注的“已知干扰项”。当后续再次运行同类评估时,系统能主动比历史趋势,并在报告中生成具有上下文和决策价值的结论,例如“本次 GC pause 相比上周升高 42%,建议检查缓存淘汰策略”。
利用 Dream 沉淀长期评估经验
每七天自动触发的 /dream 功能,会启动一个独立 Agent 对所有历史性能评估会话进行去重、压缩与关联建模。举例来说,如果系统反复遇到“Spring Boot 应用在 -Xmx2g 配置下频繁出现 Full GC”的情景,它便会将此提炼为一条项目记忆规则。后续若遇到相似的堆配置与 GC 日志特征,系统会提前发出预警,而无需等待压力测试结束才反馈结果。这正是体系化能力的体现。
操作流程本身并不复杂,但容易忽略的是:真正释放协作价值的并非单次流程的顺利通过,而是使每次评估都成为下一次的“认知跳板”。MiMo Code 将用户从紧盯监控指标、频繁切换终端、粘贴截图等重复性劳动中解放出来,让人只专注于定义问题和确认结论。
