首页 游戏 软件 资讯 排行榜 专题
首页
AI
LangChain重磅更新:AI自主决定何时压缩记忆

LangChain重磅更新:AI自主决定何时压缩记忆

热心网友
35
转载
2026-03-13

对于正在构建长时间运行或交互式Agent的开发者而言,这个功能值得一试。它本身不算庞大,但它所指向的方向——让模型更主动地管理工作记忆——可能会成为下一代Agent框架的标准配置。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

AI Agent在执行长任务时有一个绕不开的问题:上下文窗口是有限的。

当对话历史、工具调用结果、文件内容不断堆积,模型的注意力会被稀释,关键指令被淹没,决策质量随之下滑——这种现象被称为“上下文腐烂”(context rot)。

LangChain的Deep Agents SDK此前已经实现了自动压缩:当上下文使用量达到模型窗口的85%时,系统会自动触发摘要化,将旧消息替换为结构化摘要。

这套机制能用,但不够聪明——它不知道现在是不是压缩的好时机。

最新发布的版本做了一件有意思的事:把“何时压缩”这个决定权交给了模型本身。

压缩上下文这件事,有好时机,也有坏时机。

如果模型正在进行一次复杂的代码重构,中途突然压缩,很可能丢失关键的中间状态,导致后续步骤出错。

但如果一个阶段性任务刚刚完成,用户准备开启新话题,这时候压缩就非常合适——旧的上下文已经没什么用了,清掉反而能让模型更专注。

很多交互式编程工具(比如Claude Code)提供了/compact这样的手动命令,让用户自己决定什么时候清理上下文。但这要求用户理解上下文窗口的概念,并且在合适的时机主动操作——对大多数人来说这个门槛并不低。

Deep Agents的新方案是:把这个工具暴露给模型,让它自己判断。

LangChain在系统提示中为模型提供了判断指引,总结下来大致有这几类场景:

• 任务边界:用户明确表示要切换到新任务,或者当前交付物已完成并得到确认
• 信息提取完毕:模型从大量上下文中得出了结论、摘要或关键事实,原始内容已不再需要
• 即将消耗大量新内容:生成长文档,或者要读入大量新文件
• 进入复杂多步流程前:大型重构、迁移、多文件编辑等任务开始之前,或者计划已制定、即将进入执行阶段
• 旧上下文已被新决策覆盖:新需求推翻了之前的方向,或者存在大量无效的探索路径需要清理

这些场景的共同特点是:历史上下文的边际价值已经很低,而接下来的任务需要更清晰的工作记忆。

这个工具的实现复用了Deep Agents已有的摘要化中间件逻辑:保留最近10%的可用上下文作为近期消息,对更早的内容生成结构化摘要。

触发压缩的工具调用本身及其响应,也会被保留在近期上下文中。

图片

值得一提的是,Deep Agents会把完整的对话历史保存在虚拟文件系统中,即便压缩之后,原始内容依然可以通过文件系统检索找回。这在一定程度上降低了误触发压缩的风险。

在SDK中,这个功能作为独立中间件提供,需要手动加入到create_deep_agent的中间件列表:

from deepagents import create_deep_agent from deepagents.backends import StateBackend from deepagents.middleware.summarization import ( create_summarization_tool_middleware, ) backend = StateBackend() model = "openai:gpt-5.4" agent = create_deep_agent( model=model, middleware=[ create_summarization_tool_middleware(model, backend), ], )

在Deep Agents CLI中,这个功能默认开启。用户也可以继续使用/compact命令手动触发。

LangChain在调优时刻意让这个功能偏保守。

他们用三种方式进行了测试:

基于自家LangSmith追踪记录构建的评估集(注入后续prompt,判断是否应该触发压缩)Terminal-bench-2基准测试(未观察到任何自主压缩行为)团队内部在Deep Agents CLI上的日常编码任务。

结果是:模型触发压缩的频率不高,但每次触发都发生在比较合理的节点,而且确实改善了后续的工作流。

这背后有一个更大的设计哲学:Agent框架应该尽量“让开”,把更多控制权交给底层推理模型本身,而不是靠手工调参来打补丁。这是“苦涩的教训”(bitter lesson)在Agent设计上的一次具体实践——与其精心设计触发规则,不如让模型自己学会判断。

对于正在构建长时间运行或交互式Agent的开发者来说,这个功能值得一试。它本身不算大,但它所指向的方向——让模型更主动地管理工作记忆——可能会成为下一代Agent框架的标准。

来源:https://www.51cto.com/article/838062.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

LangChain重磅更新:AI自主决定何时压缩记忆
AI
LangChain重磅更新:AI自主决定何时压缩记忆

对于正在构建长时运行或交互式 Agent 的开发者来说,这个功能值得一试。它本身不算大,但它所指向的方向——让模型更主动地管理自己的工作记忆——可能会成为下一代 Agent 框架的标配。​ AI A

热心网友
03.13
LangChain应对长任务挑战:Deep Agents上下文管理方案解析
AI
LangChain应对长任务挑战:Deep Agents上下文管理方案解析

Deep Agents SDK 的完整代码已在 GitHub 开源。随着 AI Agent 承担的任务越来越复杂,上下文管理将成为决定 Agent 能力边界的关键因素。这套方案提供了一个很好的起点。

热心网友
02.03
LangChain赋能Agent开发:边构建边部署的实战指南
AI
LangChain赋能Agent开发:边构建边部署的实战指南

LangChain 表示这只是开始,后续会持续扩展模板库。如果你构建了自己满意的 Agent——无论是用于销售外联、生产监控还是研究分析——可以在社区 Slack 的 ​​ agent​​-buil

热心网友
01.28
LangChain之外,为何还需关注Spring AI?
AI
LangChain之外,为何还需关注Spring AI?

如果面试官问你这个问题,你可以这样总结:LangChain功能繁多、反应迅速,是探索 AI 前沿的最佳工具,而 Spring AI 更像是一套工业级的生产线。对于企业而言,我们不仅需要调用大模型,更

热心网友
01.07
LangChain文件系统上下文工程:团队优化实践完整拆解
AI
LangChain文件系统上下文工程:团队优化实践完整拆解

无论是在企业内部搭建客服代理,还是构建工程效率工具,文件系统方式都为“可控上下文”提供了工程化抓手。只要遵循“写入-检索-复用”的闭环,代理就能在大规模信息中保持稳定表现。 LangChain 团队

热心网友
11.25

最新APP

恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26
锦绣商铺
锦绣商铺
模拟经营 03-26

热门推荐

Intel RAID配置与创建超详细步骤指南
电脑教程
Intel RAID配置与创建超详细步骤指南

惠普部分型号支持主板集成RAID功能,用户可在系统启动阶段进入RAID配置环境,完成磁盘阵列的创建与维护操作。1、 开机过程中,根据屏幕提示,同时按下 Ctrl + I 组合键,即

热心网友
03.29
CISA警告:F5 BIG-IP漏洞正遭活跃利用,需立即防护
科技数码
CISA警告:F5 BIG-IP漏洞正遭活跃利用,需立即防护

F5公司已发布解决方案指南,强烈建议各组织立即遵循最新缓解步骤。 美国网络安全和基础设施安全局(CISA)已将新披露的F5 BIG-IP系统漏洞纳入其已知已利用漏洞(KEV)目录,警告该漏洞正在真实

热心网友
03.29
Helium10插件安装指南:Chrome扩展简单3步搞定
手机教程
Helium10插件安装指南:Chrome扩展简单3步搞定

helium10 chrome插件怎么安装?helium10浏览器扩展安装故障排查解答在电商运营的世界里,helium10可是一款相当强大的工具。而它的chrome插件安装,对于很

热心网友
03.29
85万豪车发动机被4S店偷换,车主6年后维权索赔
编程语言
85万豪车发动机被4S店偷换,车主6年后维权索赔

3月29日消息,据报道,此前,许先生以所在公司名义花费85万元购置了一辆玛莎拉蒂,后续在苏州某玛莎拉蒂4S店完成维保及延保办理。2019年5月,该车行驶中突发熄火故障,送至该4S店检修后,店方告知需

热心网友
03.29
幻兽帕鲁帕鲁农场下载安装教程:快速获取与完整指南
游戏攻略
幻兽帕鲁帕鲁农场下载安装教程:快速获取与完整指南

幻兽帕鲁中的帕鲁农场充满了奇幻与趣味,吸引了众多玩家想要体验。那么,它该如何下载安装呢?接下来为大家详细介绍。首先,要确定你的设备系统是否支持。幻兽帕鲁目前支持多种主流移动设备系统

热心网友
03.29