AI工程的三层进化：从提示到上下文再到驾驭

时间：2026-06-09 15:24

AI工程历经三层进化：2023年Prompt工程通过角色设定、分步引导优化模型输出；2024-2025年Context工程借助RAG、压缩等技术治理信息环境；2026年Harness工程通过编排、护栏、持久化状态等构件构建自主系统，将不确定性关进笼子。

2023年那会儿，大家基本都在琢磨一件事：怎么把提示词写得更好。

到了2025年，风向就变了——大家发现，提示词不过是冰山浮出水面的那一角，真正的功夫在水面之下，那个叫“上下文”的东西才是关键。

而站在2026年往回看，行业里已经形成了一个共识：真正的竞争力，既不在模型本身，也不在提示词技巧，而在于那个包裹着模型、让它能稳定运行的“机械外壳”——Harness。

所以这篇文章，就想把这三年三层演进的路子，一层层拆开来看。每一层到底解决了什么问题，又捅出了什么新篓子。

让大模型给出更好的回答。在只有ChatGPT一个文本框的年代，你能做的全部操作，就是把那几句话写好。

这个阶段的局限性其实相当明显：

大家的注意力从单次prompt，切换到了对模型所能“看见”的全部信息环境进行系统治理。

关键就在于，模型每次推理时吃到嘴里的东西，远不止你敲进去的那段话：

这一层的进步是实打实的，但新的问题也随之而来：

模型能回答好问题了，上下文也能治理好了。但这一切都还差最后一公里：怎么让模型变成一个能自主完成任务的系统？Harness的出现，就是直接回答了这个根本性问题。

Harness这个词，直译是“马具”——套在马身上的那套缰绳、嚼子和鞍具。马提供动力，控制方向、速度和安全的，是马具。在AI的语境里，这个类比非常贴切。

这些不是纸上谈兵，市场上已经有一手案例了：

Anthropic的Claude Code：它本身就是一套Harness，完整管理循环、工具调用、状态持久化和人工介入。
OpenAI Codex团队：用Harness Engineering的理念，工程师不写代码，只设计Harness，最终产出了100万行生产级代码。
LangChain：通过改进Harness（不换模型），把编码Agent的基准分从52.8%拉到了66.5%。
Terraform创始人Mitchell Hashimoto的评论值得细品：“Agent每次犯错，你不用去跟它说‘下次注意’，你只需要让这类错误在系统结构上变得不可能。”

时代	年份	解决的问题	核心手段	遗留问题
Prompt	2023	让模型输出更好	角色设定、分步引导、少样本	完全依赖模型，不可编程
Context	2024-25	治理信息环境	RAG、压缩、多Agent共享	不能自主行动，状态不持久
Harness	2026	构建自主系统	编排、护栏、持久化、验证	复杂度陡增，调试成本高

眼看2026年，已经有一些新方向露出了苗头：

Meta Context Engineering（ICML 2026）—— 把“怎么设计上下文”这件事本身变成AI可学习的技能，让AI自己进化自己的context策略。
Intent Engineering—— 从定义“怎么做”，走向定义“要什么”，让Agent理解组织的目标、价值观和约束。
Specification Engineering—— 把企业策略写成机器可读的规范，让Harness能自动理解和执行。