智能体创业护城河何在 Harness 与 Environment 深度解析_AI热点日报

智能体创业护城河何在 Harness 与 Environment 深度解析

类型：热点整理2026-05-21

AI领域的概念更新速度，有时快得让人眼花缭乱，甚至有点“术语通胀”的味道了。不妨简单回顾一下这令人眩晕的加速度：从2022年底ChatGPT发布到2024年，业界研究的焦点还是提示词工程（prompt engineering），大家四处探寻那句能“点石成金”的咒语。到了2025年6月，随着Shop

AI领域的概念更新速度，有时快得让人眼花缭乱，甚至有点“术语通胀”的味道了。

不妨简单回顾一下这令人眩晕的加速度：从2022年底ChatGPT发布到2024年，业界研究的焦点还是提示词工程（prompt engineering），大家四处探寻那句能“点石成金”的咒语。到了2025年6月，随着Shopify CEO Tobi Lütke提出“上下文工程”（context engineering）并得到Andrej Karpathy的赞同，如何为模型提供恰到好处的上下文信息，开始成为新的焦点。

仅仅五个月后，Anthropic在报告《Effective harnesses for long-running agents》中引入了“harness”（驾驭/控制层）的概念，探讨如何通过上下文管理、工具调用等方法提升智能体的长期运行成功率。八个月后，今年2月，HashiCorp联合创始人Mitchell Hashimoto正式提出了“驾驭工程”（harness engineering）的概念，OpenAI和Anthropic也紧接着发布了相关研究，这似乎成了智能体圈的新共识。

然而，当本土开发者还在热烈讨论驾驭工程时，硅谷已经传来一种截然不同的声音——“Harness将死，未来属于环境工程（environment engineering）。”

这种观点的依据在于：一方面，底层大模型正通过API快速“吞噬”开发者辛苦编写的许多基础编排逻辑；另一方面，像Anthropic MCP和Claude Code这样的实践表明，只要将系统的“环境接口”重构成对智能体友好的结构化形态，模型本身可能并不需要特别复杂的“驾驭”就能展现出强大能力。

这些不断涌现的新词汇，本质上都在探讨一个更根本的问题：在AI原生时代，一家新兴公司的价值究竟该如何构建？能做的事情很多，但关键的是，什么才是“该做”的事——也就是那些具有长期价值、能形成壁垒、甚至具备未来扩展性的事。

尽管概念的快速更迭让人有些应接不暇，但尝试去理解和构建一种面向未来的“世界观”，确实有其意义。因为这种世界观，将决定宝贵的资源——创始人的时间、团队的精力、投资人的资本——最终流向何方。

所以，我们不妨花点时间，把这条演进脉络梳理得更清楚一些。

正在发生的未来，与一个危险的错觉

对Harness的唱衰，并非空xue来风，其背后有两股清晰的推力。

向下看，底层模型正在无情地“基建化”。

过去，开发者可能需要写几百行代码来实现重试机制、JSON格式约束或长文本的上下文压缩。而今天，OpenAI提供的结构化输出、上下文缓存、原生工具调用乃至推理长度控制，直接把这些复杂机制变成了API请求里的几个参数。那些仅仅封装了“提示词链”和“基础执行循环”的套壳框架，确实正在被底层模型的能力升维打击。

向上看，环境工程展现出了可观的杠杆率。

Anthropic的一个实验颇具启发性：他们将Claude置于一个高度结构化的数字环境中，只提供有限且定义清晰的API工具。结果发现，在这种“友好”环境里，智能体的表现远超在真实终端混乱环境中的发挥。这揭示了一个关键点：很多时候，智能体表现不佳，未必是“脑子”不够好，而是“世界”太难懂。重塑环境接口（相当于“修路”）的收益，看上去可能大于单纯打磨驾驭工程（相当于“训练司机”）。

如果推演仅仅到此为止，得出的结论似乎很明确：拥抱模型厂的API，放弃自研控制层，转而投身于环境工程的建设。

但，驾驭工程真的就此失去长期价值了吗？

概率系统与确定性商业的矛盾

将驾驭工程类比为“终将被吞掉的中间件”，只说对了一部分。如果因此推导出现实的商业世界只需要“模型API + 环境”，则是一种极其危险的技术线性外推。它忽略了大模型时代最根本的工程悖论：

大语言模型本质上是一个基于概率的非确定性系统，而真实的商业世界要求的却是确定性结果。

企业需要可观测性，需要知道某个智能体为何做出特定决策，其推理轨迹能否被完整回溯和审计。企业需要成本与路由网关，以把握如何在几十个模型间动态调度，保证既聪明又经济。企业更需要系统级的容错能力，当API不稳定或模型产生“幻觉”时，系统能够进行确定性的干预并完成闭环。

这些商业世界的铁律，注定了Harness的本质从来不是“封装逻辑的中间件”，而是复杂系统的“控制平面”与“策略层”。

API可以吞噬“机制”，但替代不了“策略”。

API或许能包揽工具该如何调用、记忆格式该如何存储、基础的推理与行动循环该如何运行。但API无法决定：什么时候该触发降级方案、如何在有限的Token预算下动态切分任务、当多个不同能力的智能体发生决策冲突时该听谁的、以及如何保证输出结果符合特定行业的合规性要求。

在概率与确定性的鸿沟之间，Harness不仅是智能体的方向盘，更是防止AI系统在商业环境中造成灾难的“安全气囊与刹车”。

环境工程的“乌托邦边界”

那么，沿着环境工程一路狂奔，把全世界重构成“智能体友好”的接口，是一门好生意吗？

在代码开发、本地文件管理等“天然数字化且高度结构化”的场景中，收益无疑是可观的。这也是为什么编程领域进展最快。

然而，一旦进入传统商业场景，环境工程就会撞上一堵名为“隐性知识与遗留系统”的叹息之墙。

企业协作、供应链流转、法律审查中的海量判断依据，往往散落在非结构化的邮件、历史长文本，甚至人类专家的直觉中，它们无法被简单地改写成完美的API。

想象一下，让AI优化一家工厂的供应链。它需要理解的“环境”可能包括：一套运行了20年、文档不全的ERP系统；几位老师傅基于“听机器声音”判断故障的隐性经验；以及分散在无数Excel表格和邮件里、充满歧义的订单备注。将这种混乱的现实“重构”成AI友好的API接口，其成本和难度足以劝退大多数工程师和客户。

同时，商业世界具有极强的惯性。大多数企业不可能为了让智能体跑得更顺畅，就轻易重构耗资千万、运行了十年的核心业务系统。

这意味着，环境工程在商业落地上存在明显的局限性——它是局部的、垂直的，很难形成统一的标准平台。绝大多数时候，不是世界去适应智能体，而是智能体必须学会在充满噪音、混乱且非结构化的现实泥沼中生存。而这，会再次将聚光灯拉回到驾驭工程的系统架构能力上。

AI产业价值阶段推演

既然驾驭工程的价值不会清零，环境工程虽极具价值但也有其挑战和局限，那么AI创业公司该如何看待产业演进，并找到自己的位置？价值链的重构可能会分三个阶段上演。

第一阶段：模型为王（2023-2025）

这是AI的“蛮荒时代”。每次模型的技术突破（SOTA）直接定义了AI能力的天花板。在这个阶段，价值公式极为简单：AI应用能力 ≈ 模型能力。OpenAI、Anthropic等模型厂手握核心生产资料，拥有最高话语权。每次模型更新，就可能抹平应用层的一大片探索。

第二阶段：Harness为王（2025-2028，大幕方启）

我们正处在这一阶段的初期。随着基础模型能力趋于稳定，业界痛苦地发现：仅靠调用强大的模型API，无法直接构建出达到企业级可用标准的智能体。任务成功率的瓶颈凸显，成本和安全问题成为重要卡点。

此时，价值公式演变为：AI应用能力 = 模型能力 × Harness效率。这个乘数效应是惊人的。同一个基座模型，在粗糙的脚本驱动下，面对复杂任务的成功率可能只有20%；但在一个为特定任务深度优化的Harness驱动下，成功率可以跃升至70%以上。

此前被简单扣上“套壳产品”帽子的Devin、Cursor和Manus这类项目，其核心壁垒恰恰在于那个被低估的“壳”——也就是今天我们所说的驾驭工程。它们未必拥有独家的超级模型，但构建起了一套精密的Harness系统，包含了任务规划与分解、代码执行与沙箱、持续学习与反思、以及针对性的错误修正逻辑。

在这个阶段，竞争的焦点会从“谁的模型更强”转向“谁的控制层更优”。

第三阶段：数据与环境为王（2028+，终局之战）

当模型成为水电煤，各种高阶的Harness系统也逐渐成熟并趋于标准化后，终极护城河才会成形。届时，AI的能力公式将会演进为：AI终极能力 = (模型能力 × Harness效率) ^ (数据 × 环境)。

环境工程，其实是在提前押注这第三阶段。最强大的AI系统，将是那些能将模型和控制层深度嵌入到真实业务场景，并重构了环境交互接口的公司。

智能体在被重构的真实环境中执行任务，会产生独一无二的交互数据——成功的捷径、失败的教训、人类的微调修正。这些闭环数据反过来不仅可以用于微调模型，还能够优化Harness的决策逻辑，从而形成一个自我进化的飞轮。

例如微软的Microsoft 365 Copilot，它依托Office全场景生态，打通并掌控了个人与企业最核心的业务环境——从Outlook邮件、Teams会话到文档、表格、会议等全链路数据与操作接口。Copilot底层的orchestrator，本质就是面向办公场景的标准化Harness系统，在高度结构化的真实环境中调度模型能力，完成总结、撰写、分析等复杂任务。

用户每一次采纳、修改、反馈，都会形成高价值的闭环数据，持续反哺orchestrator的策略优化与模型迭代，让（模型 × Harness）与（数据 × 环境）形成指数级放大的正向循环。这正是第三阶段核心竞争力的完整体现。届时，拥有海量真实场景和闭环数据流的企业，将拥有指数级优势。

由此看来，如果你的团队还在花费大量时间手写基础的提示词或设计基础的记忆存储模块，或许可以考虑将这些工作交给模型厂。不要在注定会成为基础设施的地方，构建名存实亡的壁垒。

智能体时代的下一场战役，既不单纯属于逐渐基建化的大模型API，也不完全属于理想化的环境接口重构。

当下及未来的两到三年，做深特定领域的Harness系统架构，会是一个极具价值的创业切入点。回想云计算时代，AWS吞掉了许多底层技术，但提供可观测性的Datadog和Snowflake依然成长为千亿巨头，正是因为他们掌握了企业的“运营控制层”。这同样是AI时代的财富密码。

环境工程是值得追求的长期目标，而非短期捷径。可以提前布局，但不要幻想能一步到位。今天构建的强大Harness，正是未来撬动环境改造、构建数据飞轮的唯一杠杆。

可做的事很多，但弄清楚“该做什么”才是关键。在新概念的浪潮中形成你自己的原生世界观，然后，扎进去，把该干的事干到最好，这或许就是当下最值得做的事情。

来源：https://www.geekpark.net/news/362022

Agent

延伸阅读

补充最近整理过的热点入口。