Harness Agent 上下文管理策略解析 OpenClaw 与 Claude Code 对比_AI热点日报

Harness Agent 上下文管理策略解析 OpenClaw 与 Claude Code 对比

类型：热点整理2026-05-18

无论是OpenClaw还是Claude Code，它们都不会把完整的父级对话历史一股脑儿塞给sub-agent。换句话说，sub-agent普遍与父会话是相互隔离的。所有Agent框架都会面临同一个天花板：上下文窗口的空间是有限的，装不下模型运行过程中产生的所有信息。随着对话越拉越长、读取的文件越

无论是OpenClaw还是Claude Code，它们都不会把完整的父级对话历史一股脑儿塞给sub-agent。换句话说，sub-agent普遍与父会话是相互隔离的。

所有Agent框架都会面临同一个天花板：上下文窗口的空间是有限的，装不下模型运行过程中产生的所有信息。随着对话越拉越长、读取的文件越来越多、调用的sub-agent越来越频繁、工具返回的结果不断堆积，框架就必须做出取舍：哪些内容得留在工作集里，哪些可以压缩一下，哪些又能等会儿再调取。

不管是ChatGPT还是DeepSeek，只要会话时间一长，模型都难免会“忘掉”最初的任务目标；冗余的模板内容可能吃掉近半的上下文窗口；各类工具的输出结果又挤占了真正有效的对话空间。

如今，核心问题已经不再仅仅是“该往提示词里塞什么”，而是演变成了“框架如何长期、动态地管理上下文”。一个优秀的系统，不会把上下文窗口当成一个被动的文本垃圾桶，而是会主动进行管控：让核心的高价值状态信息常驻，按需调取数据，建立索引以便快速检索（这思路和文本检索工具 grep 异曲同工），同时用合理的截断方式保留线索，提示用户或模型“这里还有更多内容可以调取”。

Image

OpenClaw、Claude Code 这些 Agent 在处理这个问题上，具体做法各有不同，但思路正逐渐靠拢，形成了一套相似的底层逻辑。上下文不再仅仅是能塞进对话记录里的那点东西，而是变成了一种需要系统主动管理的资源。真正的设计核心其实在于：多少管理逻辑应该由Agent框架自己扛起来，又有多少可以放心交给模型去自主处理。

核心思路：交由模型自主管理上下文

每一项上下文管理策略，背后都暗含着对模型行为的某种预设。关键的分歧点在于：框架是否需要主动出手，限制上下文的占用？还是说，应该信任模型，让它自己学会合理分配上下文这块“蛋糕”？

Image

文件读取就是一个很直观的例子。当模型需要读取的文件体积，超出了上下文窗口的容纳上限时，总得有一方来决定：保留哪部分，舍弃哪部分。OpenClaw和Claude Code都支持通过偏移量和限制条数这两个参数，来实现分页读取。

OpenClaw

OpenClaw 在读取文件时设定了硬性上限：最多2000行，或者50千字节，哪个条件先达到就按哪个来。也就是说，即便模型没有主动要求分段读取，系统也会强制进行限制。内容会从文件开头开始截断，并且在工具输出的末尾，会附上一个明确的续读提示，比如：【当前展示 1–2000 行，共 50000 行。可使用 offset=2001 继续读取】。它的工具说明里也写得清清楚楚：输出内容将被截断至2000行或50千字节；对于大文件，请使用偏移量和条数限制参数。

除此之外，它对启动文件（也就是会话初始时一次性加载的上下文文件）还有额外的限制：单个文件上限是12000字符，所有启动文件加起来总计不能超过60000字符。如果启动文件超出了这个总配额，系统会采用“前75% + 后25%”的拆分策略：保留文件的开头和结尾部分，删减中间的段落。

工具返回的结果也有独立的配额限制：16000字符，或者上下文窗口容量的30%，取两者中较小的那个值。如果系统识别到文件尾部存在关键内容（比如报错信息、JSON的闭合符号、总结类的关键词），它会自动切换成“首尾保留”模式；否则，就只保留文件的开头部分。

可以说，OpenClaw 采用了一套多层防护方案：以截断规则作为第一层防护，额外限制启动文件的注入内容作为第二层，再叠加工具输出配额管控作为第三层。

Claude Code

Claude Code 对文件读取设置的是双层防护机制。第一层是读取前的校验：在打开文件之前，会先通过文件状态检测，设置一个256千字节的大小上限；如果文件超标，系统会直接拒绝读取，并返回错误提示，引导模型改用分页参数或者检索指令。第二层是读取后的校验：统计输出的token数量，上限是25000 token，这一层主要用于拦截那些体积合规但文本密度过高的文件。这两项限制都可以通过GrowthBook功能标签进行远程调整，不需要更新客户端版本。

即便文件没有超出限制，工具默认也只会返回开头的2000行，而且单行字符如果超过2000也会被截断。模型必须手动填写偏移量和条数参数，才能读取到更多内容。

它的工具说明是多段落的完整提示词，详细讲解了分页规则、大小限制，适配图片、PDF、笔记类文件，并且支持多文件并行读取。偏移量、限制条数这些参数都配有独立的说明，明确指出适用于超大文件的分段读取。同时，系统可以根据功能标签，选择性地在提示词中直接展示256KB的限制规则。

它的文件去重机制也极具实用价值：如果模型重复读取同一文件的相同区间，并且文件没有被修改过，系统将返回一个精简的摘要，从而避免在上下文中产生重复的token冗余。

总体来看，Claude Code 是一个典型的、可远程调控的“框架优先”方案：包含了读取前的字节校验、读取后的token校验、行数与单行长度限制、引导式报错、详尽的工具说明、读取去重，以及服务端动态可调的功能配置。

真正的工程难点所在：会话精简

随着对话不断进行，变得越来越长，所有Agent框架都必须面对一个抉择：哪些内容要留存，哪些内容得舍弃。这正是设计差异最关键、也最体现功力的地方，因为内容压缩策略的好坏，直接决定了长期运行的Agent是能保持逻辑连贯、稳定输出，还是会逐步出现能力劣化，甚至“失忆”。

OpenClaw 采用的是基于大模型摘要的压缩机制，这个机制由一个token阈值来触发执行。

触发条件：当对话历史占用的空间超过了上下文窗口的50%（这是最大历史占比，默认值是0.5）。

保留内容：系统会将历史记录按照token数量均匀地分成若干块；丢弃最旧的那个分块，保留剩余的内容，并且会修复工具调用与返回结果之间的配对关系。

内容摘要：被丢弃的内容会经过多阶段、多轮的大模型摘要处理，然后执行内容合并。

摘要存放：生成的摘要消息会被放到保留的后续对话内容的开头。

工具调用安全：通过 `repairToolUseResultPairing` 来修复分块删除后可能出现的、孤立的工具返回数据；借助 `splitMessagesByTokenShare`，避免在工具调用和结果配对的中间位置截断内容。

压缩前状态留存：在执行压缩前，系统会先运行一次静默的Agent轮次，将运行状态持久化到记忆文件中。

第二层机制：对工具结果进行无损的内存精简（先进行软截断，再强制清空），缓存有效期是五分钟；这样可以在保障完整对话记录不被破坏的同时，为当前的请求释放出上下文空间。

Claude Code 则依靠“查询前优化”与“大模型摘要压缩”这双重方式来管理上下文。

查询前优化（每次调用模型都会执行，不受上下文压力影响）：每次发起模型调用前，Claude Code 都会运行一套处理流程。这个流程仅优化工具返回的内容，而保留原始的对话文本不变。超大的工具结果会被存入本地磁盘，会话中只保留2KB的预览内容；单类工具的输出上限是50000字符，单条消息的总内容上限是200000字符。举个例子，一个60KB的检索结果，在会话的第一轮就可能被转移存储，从而释放上下文空间。

大模型摘要压缩

触发条件：当预估的token用量超出了有效上下文窗口，并且预留了13000 token作为缓冲（对于200K上下文的模型，通常在用到大约167K token时触发压缩）。

摘要范围：完整的对话会被传入模型，同时搭配一个结构化的九段式提示词，这个提示词涵盖了核心需求、关键技术概念、涉及的文件与代码、报错及修复方案、问题解决过程、全部的用户消息、待办任务、当前的工作进度以及可选的下一步计划。

摘要呈现：以一条用户消息的形式告知模型，当前的会话是接续上一轮（因上下文耗尽而中断的）对话。

压缩后恢复：压缩完成后，系统会在token配额范围内，自动重新挂载最多5个近期读取过的文件。

摘要质量保障：模型会分别输出分析草稿和最终摘要，并用标签进行区分；系统只保留最终摘要并写入上下文，剔除草稿内容，这样兼顾了精简度和信息质量。

超长提示兜底方案：如果压缩操作本身触发了上下文上限，系统将执行确定性的头部裁剪，移除最早的多轮交互记录（删减20%的交互分组，或者删减到允许的token占用长度）。

sub-agent上下文管理

无论是OpenClaw还是Claude Code，它们均不会把完整的父级对话历史复制到sub-agent中。也就是说sub-agent普遍与父会话相互隔离。

OpenClaw和Claude Code的核心差异在于：sub-agent到底会继承父会话工作空间中的哪些上下文。

OpenClaw 默认会给sub-agent分配一个全新的、隔离的会话，不继承任何父对话记录。它提供一种“分支复制”模式，仅在同类型Agent派生的场景下，才会将父会话记录同步给sub-agent；工作空间的上下文会经过过滤，只保留一个最小白名单内的文件（比如AGENTS.md、TOOLS.md、SOUL.md）。

Claude Code 则包含两种运行模式。默认的 `typed-agent` 模式会创建一个空白对话：委派指令作为唯一的用户消息，没有任何父级历史。而新增的“分支派生”模式，则会把完整的父会话消息同步给sub-agent，实现提示缓存的复用，同时还会附带一条合成的助手消息与占位的工具返回结果。工作agent会重新初始化拥有独立权限的工具；异步agent则拥有明确的白名单权限（例如读取、检索、路径匹配、终端命令、编辑、写入、网页搜索等）。在agent配置中引用的能力模块会被提前预加载，完整的技能文档会以用户消息的形式注入初始会话，而不是按需加载。

写在最后：趋同之处

其实，最关键的结论并非它们彼此之间的差异，而是两者展现出的高度共识。OpenClaw和Claude Code都对文件读取设置了硬性上限、都支持偏移/分页读取、都限制了工具输出的体积、都隔离了sub-agent的会话、都基于token阈值来触发大模型摘要压缩、都能实时估算上下文占用并识别资源压力。这并非巧合，而是面对同一个工程难题时，自然演化出的趋同解法：目标都是在有限的、固定的上下文空间里，实现近乎无限的良好使用体验。

这种趋同不止停留在功能层面，核心的设计思路也高度契合：Claude Code 与 OpenClaw 都会将超大的工具结果持久化到本地；OpenClaw和Claude Code在进行压缩精简时，都会严格保证工具调用与返回结果的边界完整；它们也都支持将父会话记录分支同步给sub-agent。尽管OpenClaw和Claude Code是彼此独立研发的，但最终却形成了一致的最优方案。

计算机发展五十年的历史早已证明：最优的内存管理，是让程序完全无感的管理。从寄存器、缓存行、页表到交换分区，每一层都由系统自主调度，对上层应用完全透明。程序要做的，只是正常运行而已。

Agent框架也正朝着这个方向演进。其终极目标，并非是把所有信息全盘丢给模型，让模型自己焦头烂额；而是在最恰当的时机，为模型提供一份恰到好处的“工作集”，并且让模型能够在此基础上，自主动态地决策、管理它自己的上下文。这才是智能体框架设计的精妙所在。

来源：https://www.51cto.com/article/841856.html

OpenClaw

延伸阅读

补充最近整理过的热点入口。