先说几个关键判断。最近使用 AI Coding 打造了一个工业级的 KG-RAG 项目,先后消耗了数亿 Token,一个深刻的心得是:真正让项目翻车的,从来不是 AI 能力不够,而是上下文管理和需求把控这两个方面出了问题。
不妨这样来想——你现在是一个包工头,手下有一群极其聪明、干活也麻利的工人。但问题是,这群人的记忆力只有 7 秒,做事全凭直觉,而且你一转头,他们可能就给你搞出些乱子。如果你直接甩给他们一张大楼的设计图让他们动手,结果大概率是建出一个四不像,中途还会因为忘了图纸,把墙砌到不该砌的位置。
没错,这些工人就是 AI。
为了管好这群“超级工人”,总结下来,一共需要七种手段。

1. 多 AI 分工协作
项目里的角色分配是这样的:项目经理和产品经理由我亲自担任,同时搭配 Gemini 3.1 Pro 和 GPT-5;架构师用的是 Claude Opus 4.6 Plan Mode 或者 Gemini 3.1 Pro AI Studio,二选一;方案评审委员会则是我加上 Claude Opus 4.6、Gemini 3.1 Pro、GPT 5.3 Codex 一起参与;高级程序员是 Codex 5.3 ExtraHigh;普通程序员交给 Claude Sonnet 4.6、Gemini 3 Flash、GLM 4.7;UI/UX 设计师是 Gemini 3.1 Pro;测试工程师由 GLM 4.7、DeepSeek V3.2 和我本人共同承担;DevOps 工程师则是我和 Gemini 3.1 Pro 两人分担。
在 AI Coding 时代,人的角色已经发生了根本变化。以前需要一行行手动编写代码,现在 AI 是无所不能的全栈能手,而人变成了那个统筹全局的包工头。

2. 先审核,再执行
传统开发模式——写代码、运行、报错、改代码——放到 AI 时代,代价非常高。不仅浪费 Token,更浪费时间,而且极易陷入死循环无法脱身。因此,把反复修改的环节前移,移动到纯文本阶段。关键原则是:不要让 AI 上来就写代码。
具体怎么做?让能力最强的一个 AI 先撰写一份施工方案,然后换其他 AI 去当质检员,专门挑剔这个方案的毛病。几个 AI 互相辩论、反复修改,等方案打磨到完美无缺,再照着写代码。这就好比建房子之前,先让设计师和施工单位在图纸上把问题讨论清楚,确认没问题了再让工人去绑钢筋。
用了这个方法之后,代码几乎都能一次性通过,后期 Debug 的工作量减少了至少 90%。

3. 分形文档与强制同构
文档和代码是同一事物的两面,必须保持实时一致。具体来说,采用分形设计:L1 根目录是全局地图,涵盖项目架构、技术栈等;L2 模块级包含成员清单、接口说明等;L3 文件级则记录头部声明的依赖([IN])、职责([POS])和输出([OUT])。
同时推行强制回环检查:每次代码变更后,必须强制检查文件头依赖是否正确、模块清单是否需要更新,任务结束时自动更新全局地图。这样一来,AI 从任意文件进入,只需读取三层(L1-L3)即可获得完整上下文。
这样做是因为 AI 本质上是个“路痴”。它每次干活前,必须先看说明书了解背景——也就是上下文。如果代码改了,说明书没改,AI 就会拿着旧地图去找新路,不仅找不到,还会一本正经地瞎编。因此,要给整个项目准备三本说明书:第一本是全国地图(整体架构),第二本是省份地图(模块说明),第三本是街道地图(单个文件说明)。而且规定,代码只要改了一行,地图必须立刻跟着改。就像导航软件不仅要有完整的地图,哪里修路了、哪里封校了,必须立刻在地图上标出来,否则司机会把车开进沟里去。

4. Hook 自动拦截
AI 没有记忆力,但 Hook 有。与其在 System Prompt 里反复写“不要做”,不如直接在代码里设个钩子,让它“不能做”。你用嘴劝它一万次,不如在工程上直接设个卡子拦它一次。它被拦截报错之后,自己就会乖乖改好。这就好比在草坪上插个牌子写“禁止踩踏”,总有人会无视;但如果你直接建一堵两米高的铁丝网,它就绝对进不去了。

5. Plan 文件持久化
文件系统是唯一可靠的状态源。使用 Claude Code 时,可以修改配置,将 Plan Directory 指向项目内部文件夹。在 Plan 中加入 Checklist,完成一项回写一项。因为 AI 的对话窗口非常脆弱,如果你和 AI 聊了很长时间,或者突然断网,AI 的脑子就清零了。但如果你把进度写成了实体文件,下次重新打开,AI 只要读一下文件:“哦,原来前三步做完了,我现在该做第四步了”,马上就能接着干。好记性不如烂笔头,去超市采购时把购物清单写在纸上揣兜里,就算中间接了电话分心,拿出纸条一看就知道接下来该买什么。

6. 质量红线必须量化
AI 对文字理解模糊,但对数字执行很稳定。人类的审美必须降维成 AI 可判定的数字。总结下来,这些硬性指标很实用:一般模型单文件不超过 400 行(比如 GLM 4.7、DeepSeek V3.2),顶级模型单文件不超过 800 行(比如 Claude Opus 4.6、Gemini 3.1 Pro),单函数不超过 30 行,嵌套层级不超过 3 层,分支数量不超过 3 个。
永远不要对 AI 说“代码要写得简洁一点、函数尽量短一点”。你得对它说:“一个文件绝对不能超过 800 行,一个函数绝对不能超过 30 行。”AI 不懂什么叫简洁、什么叫好看,这些是人类审美,对它来说太模糊了。你给它定死的数字指标,它执行起来非常稳。打个比方,你对司机说“开慢点,注意安全”,每个人对慢的理解不一样;但如果你在路边立个牌子限速 60,他就知道不能超速了。

7. 渐进式上下文加载
信息过载和信息不足一样有害。要像设计数据库索引一样设计 AI 的检索路径。虽然现在 AI 能一次性阅读几十万字,但千万不要每次提问都把整个项目的代码全扔给它。修大门的锁,就只给它看大门的图纸。信息太多和信息太少一样有害,你把整个项目的代码扔给它,它会在海量信息里迷失,浪费计算资源不说,还容易被其他不相关的代码干扰思路。改 Bug 只加载目标模块的文档,做架构决策时才加载全局地图。这就好比考试范围是第一章,你就让学生只复习第一章;如果你把大学四年的书全堆在桌上让他找答案,他反而考不及格。
