MiMo Code 所宣称的“无限上下文”并非真正无限制,但其实现方式并非简单堆叠海量 token,而是依靠三层记忆结构结合主动压缩的协同策略。具体而言,Writer 子 Agent 在触发 checkpoint 时,会提取并结构化存储 11 类关键字段,存入 SQLite FTS5 数据库以支持语义检索;当上下文接近满载时,系统自动执行 clean rebuild,仅将相关性最强的片段重新加载;同时提供 /dream 命令用于生成 current-state.md 并归档冗余信息;Compose 模式则支持 @memory、@task 等语法,实现对上下文内存的定向调用与精准激活。

因此,对于 AI 程序员而言,高效检索历史上下文的核心并非“记住所有内容”,而在于“精准召回关键片段”——这一目标正是通过上述三层记忆结构与主动压缩机制得以实现的。
持久记忆系统:项目级信息自动沉淀
项目根目录下会自动生成一个 MEMORY.md,请注意,这并非简单的聊天记录备份,而是由 Writer 子 Agent 主动提取并结构化存储的成果。具体运作机制如下:
- 每次对话占用上下文容量达到 20%、45%、70% 时,自动触发 checkpoint 操作。
- Writer 从中识别并提取出 11 类固定字段:例如接口约定、命名规范、未完成的 TODO、已验证失败的方案、模块职责边界等。
- 这些字段存入 SQLite FTS5 数据库,支持全文检索与语义搜索的混合查询——比如搜索“支付回调超时处理”,系统会直接命中相关的设计决策和错误日志记录。
Checkpoint + rebuild:长会话不中断的底层逻辑
当主窗口资源接近饱和时,MiMo Code 并不会强行截断对话或采用模糊压缩,而是执行一次 clean rebuild。具体执行步骤如下:
- 首先切断当前上下文流,但所有 checkpoint 文件(checkpoint.md、task-tree.json、notes.md)均完整保留。
- 然后基于最新状态重建一份轻量级上下文摘要——只加载与当前任务紧密相关的记忆片段,而非将整段历史全部拉入。
- 重建完成后继续执行任务,整个过程用户完全无感知,也不会出现“中间遗忘”的问题。
/dream 命令:一键整合与状态压缩
这一功能堪称最实用的主动检索入口之一。运行 /dream 后,系统将执行以下操作:
- 扫描所有 checkpoint 和 MEMORY.md,合并其中重复或冲突的设计决策。
- 生成一份紧凑的 current-state.md,包含当前项目共识、待办清单以及已验证的约束条件。
- 将冗余的中间过程——例如多次尝试的调试命令、废弃的分支思路——统一归档到 archive/ 目录,避免干扰主上下文。
- 后续提问可直接引用 current-state.md 中的内容,例如:“按照 current-state.md 中约定的鉴权方式,补全 login.tsx”。
Compose 模式下的上下文定向调用
当将 Tab 切换到 Compose 模式后,开发者可以显式声明希望激活哪类记忆:
- @memory:auth —— 仅加载与鉴权模块相关的所有历史片段。
- @task:2026-06-18-003 —— 精准召回某次完整任务的全部输入、输出与错误信息。
- @git:main —— 结合当前 Git 分支状态,动态过滤记忆范围。
这种语法让上下文不再是被动的容器,而成为可编排、可寻址的开发资产,极大提升了 AI 程序员在复杂项目中的检索效率与上下文利用质量。
