AI编程智能体六大核心组件深度解析

时间：2026-06-17 15:13

编程Agent的强大之处不在于模型本身，而在于围绕模型的AgentHarness软件框架。它由实时代码库上下文、提示词缓存、工具调用、上下文压缩、会话记忆及子智能体委托六大组件构成，在模型能力趋同的当下成为体验差异的关键。

你有没有好奇过，为什么 Claude Code 或 Codex CLI 用起来，比在聊天界面直接调用同一个模型要强大得多？

很多人直觉上会觉得，这是“模型更强”或“做了特殊优化”。但 Sebastian Raschka 博士的最新文章点出了关键：真正的差异在于 Agent Harness——那个围绕模型的软件框架。

Raschka 是《Build a Large Language Model From Scratch》和《Build a Reasoning Model From Scratch》的作者。这篇文章把编程 Agent 的核心架构拆解得相当清晰，特别适合用来理解 Claude Code、Codex CLI 这类工具到底是怎么工作的。

一、核心概念：LLM、推理模型与 Agent

在深入技术细节之前，先理清几个容易混淆的概念。

1. LLM（大语言模型）
这是最底层的“下一词预测”引擎，是所有智能体系统的发动机。

2. 推理模型
推理模型本质上还是 LLM，但经过特殊训练，在推理时会投入更多计算资源进行中间推理、验证和搜索。你可以把它理解成升级版引擎——更强，也更贵。

3. Agent（智能体）
Agent 是架在模型之上的控制层。给定目标后，它需要决定：下一步检查什么？调用哪些工具？如何更新状态？何时停止？

4. Agent Harness
这是围绕 Agent 的软件脚手架，负责管理上下文、工具使用、提示词、状态和控制流。

5. Coding Harness
Agent Harness 的特化版本，专门针对软件工程任务——管理代码上下文、工具、执行和迭代反馈。

概念关系图

二、一个形象的比喻

Raschka 用了一个相当直观的比喻：

LLM 就像汽车引擎
推理模型 就是升级版引擎，更强但更耗油
Agent Harness 则像是驾驶系统，帮你把车真正开起来

这个比喻不算完美——LLM 也可以独立使用——但它抓住了核心：模型决定“能跑多快”，Harness 决定“能开多远”。

更重要的是，在各大模型能力逐渐拉近的今天，Harness 往往成为体验差异的决定性因素。Raschka 甚至推测，如果把 GLM-5 放进类似 Claude Code 的 Harness 里，它的实际体验很可能不输给 GPT-5.4。

三、编程 Agent 的六大核心组件

Raschka 把编程 Agent 拆解为六个核心组件：

六大组件总览

组件一：实时代码库上下文

这是最显而易见，也最关键的一层。

当用户说“修复测试”时，模型需要知道：这是不是一个 Git 仓库？当前在哪个分支？项目有什么结构？有没有 AGENTS.md 或 README 说明？

为什么这么重要？因为“修复测试”不是一个自包含的指令。如果 Agent 看到了项目文档，就能知道该运行哪个测试命令；如果了解了仓库布局，就能在正确的位置查找，而不是盲目猜测。

实现要点通常是：在开始工作前先收集一组稳定事实，包含 Git 状态、分支、最近提交，而且这些信息不需要每次都从零重建。

组件二：提示词形状与缓存复用

编程会话往往是重复性的：Agent 规则基本不变，工具描述基本不变，工作区摘要基本不变。真正在变的，主要是用户请求、对话历史和短期记忆。

聪明的设计不会每次都重建一个巨大的提示词。

提示词与记忆分层

核心洞见在于：收集仓库事实，和打包缓存事实，是两个独立的步骤。

组件三：工具访问与使用

这是从“聊天”变成“智能体”的关键一步。

普通模型只能用自然语言给你建议命令，而编程 Agent 会实际执行命令、获取结果，并将结果反馈到下一轮推理中。

当然，也不是让模型完全放飞。实际流程更接近这样：

工具调用流程

安全边界一般包括：预定义的允许工具列表、路径检查（只在仓库内操作）、用户审批机制。这些看似限制的规则，实际上是提高可靠性和可用性的关键。

组件四：最小化上下文膨胀

上下文膨胀是 LLM 的通病，而编程 Agent 尤其容易遇到：重复的文件读取、冗长的工具输出、大量的日志信息……如果保留所有内容，上下文窗口很快就会被耗尽。

这里有两种核心压缩策略：

截断：缩短长文档、截断大输出、压缩记忆笔记
对话压缩：将历史转为摘要，保持最近事件更详细

额外技巧还包括：对旧文件读取去重，避免重复看到同一内容；保持最近事件更详细；对旧事件做更激进的压缩。

原文有一句话很值得记住：很多看似模型能力的问题，本质上其实是上下文质量问题。

组件五：结构化会话记忆

这一层与上一组件紧密相关，但关注点不同。

压缩对话历史与工作记忆

两层状态管理可以概括为：

完整对话记录：存储所有请求、输出、响应，只追加，不修改，支持会话恢复
工作记忆：小型、精炼的状态，记录当前任务、重要文件、最近笔记，会被修改和压缩

组件六：委托与有界子智能体

为什么要委托？原因很实际：并行化子任务，避免单一循环承载所有工作——比如查找符号、检查配置、诊断测试失败。

核心挑战是如何绑定子智能体。子智能体需要继承足够的上下文才能工作，但同时必须有边界：

只读模式：子智能体不能修改文件
递归深度：限制子智能体再启动子智能体
工作范围：限制操作的目录或文件

原文对这一点的总结很到位：继承足够上下文才能有用，但必须设置约束边界防止失控。

四、完整架构总览

把这六个组件整合起来，大致是这样一个分层结构：

完整架构图

这张总览图最重要的信息在于：它把 harness 放在了模型外面整整一层。也就是说，用户请求不是直接扔给模型，而是先经过代码库上下文、稳定提示词前缀、工具访问与使用、上下文管理、会话记忆、子智能体委托，最后才会进入 LLM 或推理模型。

五、编程 Agent vs 通用 Agent 平台

Raschka 还对比了编程 Agent（如 Claude Code）与通用 Agent 平台（如 OpenClaw）：

编程 Agent 与通用 Agent 平台

核心差异在于：编程 Agent 优化的是“一个人在仓库中工作”的场景，而 OpenClaw 优化的是“跨多个聊天、通道、工作区运行多个长期 Agent”。编程只是其中一种工作负载。

六、核心洞见总结

1. 模型不是全部

在很多实际应用中，围绕模型的系统和模型本身同样重要。这也是为什么同一个模型放进 Claude Code 后，体验会和聊天界面相差甚远。

2. Harness 是差异化因素

在模型能力逐渐拉近的背景下，Agent Harness 往往就是体验差异的来源。一个设计良好的 Harness，能让模型的能力更稳定地释放出来。

3. 上下文质量 = 模型表现

很多看起来像模型能力的问题，最后都会落到上下文质量上。

4. 边界即自由

预定义工具、路径检查、审批机制——这些边界看起来像限制，实际上却能提高可靠性和实用性。

七、实践建议

如果你想构建自己的编程 Agent，或者想更深入地理解现有系统：

从最小实现开始
重视上下文管理
工具设计要有边界
会话记忆要分层
提示词缓存尽量复用

来源：https://cloud.tencent.com.cn/developer/article/2689467

核心组件

上一篇AI产品图如何嵌入真实桌面或货架场景 下一篇Agent驱动开发：让AI成为代码库主要贡献者

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。

同类最新

继续查看同栏目最近更新的文章。

AI教程 · 2026-06-29

Windows Docker Desktop RabbitMQ生产级部署完整指南

前言在 Windows 本地开发环境中，直接安装 RabbitMQ 确实颇为周折：需要单独配置 Erlang 运行环境、手动管理环境变量、服务启停全凭手工操作。更令人困扰的是，版本兼容冲突、端口占用、环境不一致等问题层出不穷。笔者见过不少开发者为搭建环境就得耗费整整半天时间。相比之下，借助 Do

AI教程 · 2026-06-29

AI搜索重构制造业采购逻辑的阿里云企业级GEOCMS优化实践

先分享一个切实感受。过去两年，我们与福建制造企业合作较为频繁，发现一个非常突出的现象：超过80%的企业官网，产品参数仍然存放在PDF或图片中。AI爬虫？根本无法抓取。这些企业技术实力不弱、资质证照齐全、应用案例也丰富，但在AI搜索这一全新战场上，它们几乎处于隐身状态。一、一个正在发生的行业变化 A

AI教程 · 2026-06-29

阿里云Token Plan团队版功能价格与省钱购买指南

阿里云百炼近期推出了名为“Token Plan 团队版”的全新服务，这一服务专为企业与开发者量身打造，定位为AI大模型订阅平台。通过引入Credits作为统一计量单位，将文本生成、图像生成等多模态AI能力纳入单一计费体系，同时无缝兼容主流AI编程工具及智能体（Agent）生态系统。其核心亮点包括：全

AI教程 · 2026-06-29

阿里云物联网.NET Core客户端位置信息上报

阿里云物联网平台的位置服务并非一个完全独立的功能模块。位置信息可包含二维坐标与三维坐标，而位置数据的来源本质上是借助设备属性进行上传。换言之，若要让设备上报位置，您需先将其视为一个普通属性进行处理。 1）添加二维位置数据操作过程十分简洁。进入数据分析 → 空间数据可视化 → 二维数据，点击添加，将

AI教程 · 2026-06-29

年阿里云服务器选型配置与网站部署全攻略

2026年，阿里云服务器生态已高度成熟，形成了清晰的轻量应用服务器与ECS云服务器两大产品阵营。无论你是计划搭建个人博客、企业官网，还是运营电商平台、进行应用开发，基本都能找到理想的解决方案。本指南将从服务器选型、配置选择、部署流程到安全运维，系统梳理2026年最实用的操作要点，帮助你少走弯路，让网