Harness Agent 上下文管理策略解析 OpenClaw 与 Claude Code 对比
无论是OpenClaw还是Claude Code,它们都不会把完整的父级对话历史一股脑儿塞给sub-agent。换句话说,sub-agent普遍与父会话是相互隔离的。
所有Agent框架都会面临同一个天花板:上下文窗口的空间是有限的,装不下模型运行过程中产生的所有信息。随着对话越拉越长、读取的文件越来越多、调用的sub-agent越来越频繁、工具返回的结果不断堆积,框架就必须做出取舍:哪些内容得留在工作集里,哪些可以压缩一下,哪些又能等会儿再调取。
不管是ChatGPT还是DeepSeek,只要会话时间一长,模型都难免会“忘掉”最初的任务目标;冗余的模板内容可能吃掉近半的上下文窗口;各类工具的输出结果又挤占了真正有效的对话空间。
如今,核心问题已经不再仅仅是“该往提示词里塞什么”,而是演变成了“框架如何长期、动态地管理上下文”。一个优秀的系统,不会把上下文窗口当成一个被动的文本垃圾桶,而是会主动进行管控:让核心的高价值状态信息常驻,按需调取数据,建立索引以便快速检索(这思路和文本检索工具 grep 异曲同工),同时用合理的截断方式保留线索,提示用户或模型“这里还有更多内容可以调取”。
Image
OpenClaw、Claude Code 这些 Agent 在处理这个问题上,具体做法各有不同,但思路正逐渐靠拢,形成了一套相似的底层逻辑。上下文不再仅仅是能塞进对话记录里的那点东西,而是变成了一种需要系统主动管理的资源。真正的设计核心其实在于:多少管理逻辑应该由Agent框架自己扛起来,又有多少可以放心交给模型去自主处理。
核心思路:交由模型自主管理上下文
每一项上下文管理策略,背后都暗含着对模型行为的某种预设。关键的分歧点在于:框架是否需要主动出手,限制上下文的占用?还是说,应该信任模型,让它自己学会合理分配上下文这块“蛋糕”?
Image
文件读取就是一个很直观的例子。当模型需要读取的文件体积,超出了上下文窗口的容纳上限时,总得有一方来决定:保留哪部分,舍弃哪部分。OpenClaw和Claude Code都支持通过偏移量和限制条数这两个参数,来实现分页读取。
OpenClaw
OpenClaw 在读取文件时设定了硬性上限:最多2000行,或者50千字节,哪个条件先达到就按哪个来。也就是说,即便模型没有主动要求分段读取,系统也会强制进行限制。内容会从文件开头开始截断,并且在工具输出的末尾,会附上一个明确的续读提示,比如:【当前展示 1–2000 行,共 50000 行。可使用 offset=2001 继续读取】。它的工具说明里也写得清清楚楚:输出内容将被截断至2000行或50千字节;对于大文件,请使用偏移量和条数限制参数。
除此之外,它对启动文件(也就是会话初始时一次性加载的上下文文件)还有额外的限制:单个文件上限是12000字符,所有启动文件加起来总计不能超过60000字符。如果启动文件超出了这个总配额,系统会采用“前75% + 后25%”的拆分策略:保留文件的开头和结尾部分,删减中间的段落。
工具返回的结果也有独立的配额限制:16000字符,或者上下文窗口容量的30%,取两者中较小的那个值。如果系统识别到文件尾部存在关键内容(比如报错信息、JSON的闭合符号、总结类的关键词),它会自动切换成“首尾保留”模式;否则,就只保留文件的开头部分。
可以说,OpenClaw 采用了一套多层防护方案:以截断规则作为第一层防护,额外限制启动文件的注入内容作为第二层,再叠加工具输出配额管控作为第三层。
Claude Code
Claude Code 对文件读取设置的是双层防护机制。第一层是读取前的校验:在打开文件之前,会先通过文件状态检测,设置一个256千字节的大小上限;如果文件超标,系统会直接拒绝读取,并返回错误提示,引导模型改用分页参数或者检索指令。第二层是读取后的校验:统计输出的token数量,上限是25000 token,这一层主要用于拦截那些体积合规但文本密度过高的文件。这两项限制都可以通过GrowthBook功能标签进行远程调整,不需要更新客户端版本。
即便文件没有超出限制,工具默认也只会返回开头的2000行,而且单行字符如果超过2000也会被截断。模型必须手动填写偏移量和条数参数,才能读取到更多内容。
它的工具说明是多段落的完整提示词,详细讲解了分页规则、大小限制,适配图片、PDF、笔记类文件,并且支持多文件并行读取。偏移量、限制条数这些参数都配有独立的说明,明确指出适用于超大文件的分段读取。同时,系统可以根据功能标签,选择性地在提示词中直接展示256KB的限制规则。
它的文件去重机制也极具实用价值:如果模型重复读取同一文件的相同区间,并且文件没有被修改过,系统将返回一个精简的摘要,从而避免在上下文中产生重复的token冗余。
总体来看,Claude Code 是一个典型的、可远程调控的“框架优先”方案:包含了读取前的字节校验、读取后的token校验、行数与单行长度限制、引导式报错、详尽的工具说明、读取去重,以及服务端动态可调的功能配置。
真正的工程难点所在:会话精简
随着对话不断进行,变得越来越长,所有Agent框架都必须面对一个抉择:哪些内容要留存,哪些内容得舍弃。这正是设计差异最关键、也最体现功力的地方,因为内容压缩策略的好坏,直接决定了长期运行的Agent是能保持逻辑连贯、稳定输出,还是会逐步出现能力劣化,甚至“失忆”。

OpenClaw 采用的是基于大模型摘要的压缩机制,这个机制由一个token阈值来触发执行。
触发条件:当对话历史占用的空间超过了上下文窗口的50%(这是最大历史占比,默认值是0.5)。
保留内容:系统会将历史记录按照token数量均匀地分成若干块;丢弃最旧的那个分块,保留剩余的内容,并且会修复工具调用与返回结果之间的配对关系。
内容摘要:被丢弃的内容会经过多阶段、多轮的大模型摘要处理,然后执行内容合并。
摘要存放:生成的摘要消息会被放到保留的后续对话内容的开头。
工具调用安全:通过 `repairToolUseResultPairing` 来修复分块删除后可能出现的、孤立的工具返回数据;借助 `splitMessagesByTokenShare`,避免在工具调用和结果配对的中间位置截断内容。
压缩前状态留存:在执行压缩前,系统会先运行一次静默的Agent轮次,将运行状态持久化到记忆文件中。
第二层机制:对工具结果进行无损的内存精简(先进行软截断,再强制清空),缓存有效期是五分钟;这样可以在保障完整对话记录不被破坏的同时,为当前的请求释放出上下文空间。
Claude Code 则依靠“查询前优化”与“大模型摘要压缩”这双重方式来管理上下文。
查询前优化(每次调用模型都会执行,不受上下文压力影响):每次发起模型调用前,Claude Code 都会运行一套处理流程。这个流程仅优化工具返回的内容,而保留原始的对话文本不变。超大的工具结果会被存入本地磁盘,会话中只保留2KB的预览内容;单类工具的输出上限是50000字符,单条消息的总内容上限是200000字符。举个例子,一个60KB的检索结果,在会话的第一轮就可能被转移存储,从而释放上下文空间。
大模型摘要压缩
触发条件:当预估的token用量超出了有效上下文窗口,并且预留了13000 token作为缓冲(对于200K上下文的模型,通常在用到大约167K token时触发压缩)。
摘要范围:完整的对话会被传入模型,同时搭配一个结构化的九段式提示词,这个提示词涵盖了核心需求、关键技术概念、涉及的文件与代码、报错及修复方案、问题解决过程、全部的用户消息、待办任务、当前的工作进度以及可选的下一步计划。
摘要呈现:以一条用户消息的形式告知模型,当前的会话是接续上一轮(因上下文耗尽而中断的)对话。
压缩后恢复:压缩完成后,系统会在token配额范围内,自动重新挂载最多5个近期读取过的文件。
摘要质量保障:模型会分别输出分析草稿和最终摘要,并用标签进行区分;系统只保留最终摘要并写入上下文,剔除草稿内容,这样兼顾了精简度和信息质量。
超长提示兜底方案:如果压缩操作本身触发了上下文上限,系统将执行确定性的头部裁剪,移除最早的多轮交互记录(删减20%的交互分组,或者删减到允许的token占用长度)。
sub-agent上下文管理
无论是OpenClaw还是Claude Code,它们均不会把完整的父级对话历史复制到sub-agent中。也就是说sub-agent普遍与父会话相互隔离。
OpenClaw和Claude Code的核心差异在于:sub-agent到底会继承父会话工作空间中的哪些上下文。
OpenClaw 默认会给sub-agent分配一个全新的、隔离的会话,不继承任何父对话记录。它提供一种“分支复制”模式,仅在同类型Agent派生的场景下,才会将父会话记录同步给sub-agent;工作空间的上下文会经过过滤,只保留一个最小白名单内的文件(比如AGENTS.md、TOOLS.md、SOUL.md)。
Claude Code 则包含两种运行模式。默认的 `typed-agent` 模式会创建一个空白对话:委派指令作为唯一的用户消息,没有任何父级历史。而新增的“分支派生”模式,则会把完整的父会话消息同步给sub-agent,实现提示缓存的复用,同时还会附带一条合成的助手消息与占位的工具返回结果。工作agent会重新初始化拥有独立权限的工具;异步agent则拥有明确的白名单权限(例如读取、检索、路径匹配、终端命令、编辑、写入、网页搜索等)。在agent配置中引用的能力模块会被提前预加载,完整的技能文档会以用户消息的形式注入初始会话,而不是按需加载。
写在最后:趋同之处
其实,最关键的结论并非它们彼此之间的差异,而是两者展现出的高度共识。OpenClaw和Claude Code都对文件读取设置了硬性上限、都支持偏移/分页读取、都限制了工具输出的体积、都隔离了sub-agent的会话、都基于token阈值来触发大模型摘要压缩、都能实时估算上下文占用并识别资源压力。这并非巧合,而是面对同一个工程难题时,自然演化出的趋同解法:目标都是在有限的、固定的上下文空间里,实现近乎无限的良好使用体验。
这种趋同不止停留在功能层面,核心的设计思路也高度契合:Claude Code 与 OpenClaw 都会将超大的工具结果持久化到本地;OpenClaw和Claude Code在进行压缩精简时,都会严格保证工具调用与返回结果的边界完整;它们也都支持将父会话记录分支同步给sub-agent。尽管OpenClaw和Claude Code是彼此独立研发的,但最终却形成了一致的最优方案。
计算机发展五十年的历史早已证明:最优的内存管理,是让程序完全无感的管理。从寄存器、缓存行、页表到交换分区,每一层都由系统自主调度,对上层应用完全透明。程序要做的,只是正常运行而已。
Agent框架也正朝着这个方向演进。其终极目标,并非是把所有信息全盘丢给模型,让模型自己焦头烂额;而是在最恰当的时机,为模型提供一份恰到好处的“工作集”,并且让模型能够在此基础上,自主动态地决策、管理它自己的上下文。这才是智能体框架设计的精妙所在。
相关攻略
2026年的开源AI Agent领域,正清晰地分化出两条截然不同的技术路线。一条追求确定性、可审计的企业级自动化,另一条则押注于自主性、自我优化的概率式进化。今天,我们就来深入拆解这两个最具代表性的框架——OpenClaw与Hermes Agent,看看它们在设计哲学、技术架构与适用场景上的根本分野
许多用户在使用传统AI助手时都曾遇到过这样的困扰:每次对话都像是初次见面,助手无法记住之前的交流内容、个人偏好或工作习惯,导致每次互动都需要重新开始。这种缺乏连续性的体验,往往降低了工作效率和交互的深度。 OpenClaw为解决这一问题,提出了一个直接而巧妙的方案:利用本地文件实现持久化记忆。它将A
火山引擎日志服务(TLS)为Agent助手或xClaw企业的开发和运维团队,提供了一套开箱即用的全方位OpenClaw运维观测方案。只需一键安装插件,就能实现对OpenClaw日志、指标和链路数据的零侵入、全量采集,并自动生成覆盖成本、运维、性能、安全四大核心场景的观测大盘。 概述 当一个OpenC
为AI智能体补上企业级基础设施的关键一课。 进入2025年,大模型应用的角色正经历根本性重塑。它们已超越简单的对话助手,迅速进化为能够自主调用工具、执行复杂工作流的“数字员工”。在这一进程中,以OpenClaw为代表的开源框架,扮演了至关重要的催化角色。 然而,当各行各业满怀期待地将这些框架引入企业
今天将OpenClaw升级到了最新的2026 04 09版本,在此记录升级后遇到的主要变化和关键注意事项,帮助大家顺利完成配置迁移。 首先,请通过命令行确认版本号是否更新成功: PS C: Users xxxxxx> openclaw --version OpenClaw 2026 4 9 (051
热门专题
热门推荐
微星PRO MAX系列ATX 3 1全模组电源现已于京东平台全面上市。该系列精心规划了850W、1000W与1200W三档功率规格,全线产品均严格通过80PLUS白金能效认证,为用户带来高效节能的供电体验。首发期间,850W版本售价579元,1000W版本679元,1200W版本799元,参与晒单活
行业首款集成视觉能力的AI智能耳机即将面世。光帆科技近日正式宣布,其创新产品“光帆全感AI耳机”定于5月15日全面发售。这款耳机以“全感知、主动式、个性化”为核心定位,旨在彻底革新用户与可穿戴音频设备之间的交互模式。 本质上,它颠覆了传统耳机的被动响应模式。根据官方介绍,这款AI耳机能够主动感知并理
止损是交易中控制风险的关键手段,在币安等交易平台设置止损时,主要参考市场波动率、技术分析关键位以及个人风险承受能力。合理的止损应基于对价格走势的客观判断,而非情绪化决策,同时需结合仓位管理,避免因单次止损过大而影响整体资金安全。动态调整止损位以适应市场变化,是提升交易纪律性的重要环节。
过去两年,要问大模型最习惯用什么格式交付内容,答案多半是Markdown。 原因不难理解:Markdown足够干净,没有冗余格式,复制到文档、知识库、GitHub,甚至直接粘贴到微信公众号后台,基本都不会出问题。某种程度上,它已经被公认为AI时代最理想的标记语言。 不过,随着Agent时代的到来,M
距离2026-2027年度旗舰手机的大幕拉开,大约还有四个月时间。按照惯例,届时在全球舞台上率先亮相的主流旗舰,很可能依然是苹果的iPhone 18 Pro系列。 就在昨天(5月8日),知名爆料人Jon Prosser发布了iPhone 18 Pro Max的视频渲染图,与此同时,关于该系列手机的七





