话说回来,让AI理解人类的需求,这事儿说简单也简单,说难是真难。你费劲巴拉说了一大堆,AI跟你来来回回问上十几轮,最后产出的东西可能还不是你想要的。MiMo Code 的做法,说白了就是不走“靠反复问答来碰运气”的老路,而是用一套成体系、可回溯的工程化机制,在第一次交互时就尽可能把需求给锚定住。

这套机制分了四个层面,一环套一环,咱们分别拆开看看。
需求理解层:语音+自然语言双入口触发结构化解析
无论你是在电脑前随口说了句“帮我整个能查天气的微信小程序”,还是直接在终端里输入了类似的文字,MiMo Code 二话不说,立马启动一个两段式解析流程。
- 语义切片:把你的话拆成能吃的“小颗粒”。比如“做个查天气的小程序”,它会识别出功能主体是“天气查询”,交付形态是“微信小程序”,并且能推断出你可能需要定位权限、需要一个用户界面、还得调用外部API接口。
- 上下文锚定:它不是光听你说什么,还会看你在做什么。自动扫描当前的项目目录、历史文件,甚至是你最近三次对话里用过的技术栈。如果你上次用的Vue框架,这次它大概率会默认保持一致,免得你再去强调一遍。
对齐确认层:Compose 模式下的可视化任务蓝图
消化完需求之后,就算进到了关键环节——Compose 模式。这个模式一激活(按 Tab 键),它不会直接坐下来写代码,而是先生成一份带节点依赖关系的执行蓝图。这其中的门道在于:
- 规划先行:它会清晰罗列出具体需要做什么,比如是否要申请高德天气API、需不需要配置小程序的appid、要不要考虑iOS和Android的渲染差异。
- 验证点标注:在每个关键决策旁边,都设好了「确认/跳过/修改」按钮。你可以直接拍板,也能用语音说“权限申请先跳过,用Mock数据顶一下”,非常灵活。
- 检查点:你的每一次选择,都会被实时存入会话检查点。这意味着,后续任何一步出了问题,都可以一键回退到这个蓝图状态重新调整,而不是从头开始向AI解释你的需求。
持续校准层:持久记忆驱动的跨会话一致性保障
需求对齐不是一次性的买卖。MiMo Code 用了三层记忆机制,保证你在这个项目里的积累能持续发挥作用:
- 项目记忆:同一个代码仓库内,所有历史任务中关于“天气”、“小程序”、“mock数据”这些关键词的偏好会被自动聚类。下次再有类似需求,它自己就记住了。
- /dream 自动沉淀:系统每7天会自动运行一次梳理,把散落在各次对话里的各种小修小改(比如“不要弹窗提示”、“默认深色模式”)整合成全局偏好,直接在下次对话里生效。
- 错误反哺:更厉害的是,如果你手动删改过它生成的代码,系统会默默记下这个位置和上下文,下次遇到相似的任务,它会主动避开导致你手动修改的那类结构。
开发者可控层:无需信任黑箱,所有对齐过程可查看、可干预
整个过程完全是透明的。右侧的状态看板就像个实时仪表盘,让你对对齐状态心里有数:
- 蓝色图标:“需求已结构化,正等你确认”
- 绿色图标:“蓝图已锁定,开始码代码了”
- 红色图标:“发现歧义项了(比如没指定用哪个城市查天气),请补充一下”
- 想深入了解?按 Ctrl+M 调出记忆地图,就能看到这次对齐依赖的所有上下文来源,比如哪段语音被转成了文字、参考了哪个文件、上次类似任务是怎么处理的,一目了然。
