腾讯开源Agent记忆方案大幅降低Token消耗达61%
5月14日,腾讯云正式开源其核心AI智能体记忆管理技术——TencentDB Agent Memory。该方案精准解决了当前AI智能体(Agent)在执行长周期、多步骤任务时面临的关键瓶颈:记忆膨胀与Token成本失控。通过创新的“外存内精”架构,它能显著优化上下文使用效率,提升复杂任务的成功率与执行连贯性。

随着AI智能体在代码生成、自动化研究、深度数据分析等领域的应用日益深化,任务流程变得冗长而复杂。每一次工具调用(如网页搜索、代码执行)都会产生海量的中间结果、日志和原始数据,迅速挤占有限且昂贵的模型上下文窗口。这不仅导致Token消耗激增、成本高涨,更可能因关键信息被挤出窗口而造成任务状态丢失或逻辑混乱,影响最终输出质量。
行业常见的应对方案,如单纯扩大上下文窗口或进行简单的文本摘要,在应对复杂的多轮交互与长链条任务时往往捉襟见肘。上下文信息过载、关键细节丢失等问题依然普遍存在,制约了智能体的实际应用效能。
腾讯云数据库团队开源的TencentDB Agent Memory,提供了一套系统性的解决方案。其核心理念是“外存内精”:将完整、冗长的原始数据卸载到外部存储中管理,而在执行上下文中仅保留任务的核心状态骨架与结构化关系图谱,从而在保证任务连续性的前提下,最大化压缩Token占用。
该方案主要依托两大核心技术模块实现高效记忆管理。
首先是“Mermaid任务画布”功能。这一模块将整个Agent的任务执行过程动态可视化为一个结构化的任务图谱,类似于智能体的“思维导图”或“项目路线图”。图中清晰定义了每个子任务步骤的状态、摘要以及步骤间的依赖关系。Agent仅需在上下文中维护这张轻量级的“任务地图”,即可时刻掌握整体进度、当前所处位置以及后续行动路径,确保了长任务执行的方向性与逻辑清晰度。
其次是“上下文卸载”机制。当Agent调用外部工具并获取到原始结果(如大段网页内容、代码日志)后,这些庞杂的细节信息不会持续占用宝贵的上下文空间。它们会被自动摘要并索引,随后完整内容被存储到外部文件系统中。上下文里仅保留精炼的摘要和快速检索键。只有当Agent在后续步骤中需要回溯特定细节时,才按需将相关部分精准加载回上下文。这相当于为Agent配备了一个智能的“外部记忆库”,有效释放了主工作内存的压力。
该方案的实际效果如何?腾讯云公布的基准测试数据提供了有力证明。启用TencentDB Agent Memory记忆优化方案后:
- 在自动化网页搜索与信息整合场景中,Token消耗最高可降低61%,同时任务成功率相对提升52%;
- 在自动化代码调试与修复场景中,Token消耗最高降低33%,任务完成率相对提升10%;
- 在复杂长文档分析与总结场景中,Token消耗最高降低31%,关键信息分析准确率相对提升8%。
除了优化单次任务的短期记忆管理,该项目还集成了一个长期个性化记忆模块。该模块支持Agent在跨对话会话中持续学习并记忆用户的个性化偏好、历史背景与行为模式。在PersonaMem基准测试中,该模块将Agent对用户画像的理解准确率从48%显著提升至76%。据悉,此长期记忆能力此前已作为一项免费服务对外开放试用。
目前,TencentDB Agent Memory项目已在GitHub上全面开源,并兼容OpenClaw、Hermes等主流Agent开发框架。其对开发者极为友好,仅需一行安装命令即可快速集成,无需额外配置数据库或依赖外部服务。所有Agent的任务历史与记忆内容均以标准文件格式本地化存储,方便开发者直接查看、分析与调试,提供了极高的操作透明度和可控性。
值得注意的是,这是腾讯近期在AI智能体技术生态布局中的又一重要举措。就在上月,腾讯云刚刚开源了高性能Agent执行底座“Cube”,其在GitHub上迅速获得了超过5000颗星标。这一系列连贯动作清晰地表明,腾讯正在持续加大对AI智能体底层基础设施的研发投入与开源开放,旨在为构建更复杂、更可靠、更实用的下一代AI应用奠定坚实的技术基础。
相关攻略
腾讯云开源TencentDBAgentMemory技术,针对AI智能体长任务记忆管理痛点,通过“外存内精”思路降低Token消耗。其核心包括动态结构化任务状态的“Mermaid任务画布”,以及将详细结果卸载至外部存储、仅保留摘要索引的“上下文卸载”功能。测试显示,该方案在网页搜索等场景中最高降低61%的Token消耗,并显著提升任务成功率与准确率。
4月9日,腾讯旗下的本地AI助手QClaw迎来了一次重磅更新。V2大版本正式上线,一口气带来了多Agent协作、应用连接器以及名为“龙虾管家”的原生安全防护三大核心能力。这标志着AI助手正从单打独斗的“工具人”,向一个分工明确、能力互补且自带安全防护的“智能团队”进化。 作为基于OpenClaw打造
腾讯混元联合多家机构推出Chronicles-OCR视觉感知评测基准,构建覆盖汉字七种字体、跨越三千年的评测体系,包含2800张高质量图像,采用阶段自适应标注与四大核心任务,专门评估视觉大模型对汉字形态演变的感知鲁棒性,旨在系统性诊断模型能力边界,推动古文数字化与相关研究。
你是否也曾有过这样的瞬间——脑海中闪过一个绝佳的App创意,却因为不懂编程,只能眼睁睁看着灵感消散? 最近,腾讯悄然上线了一款名为“吐司”的产品,似乎正是为了解决这个问题而来。 它的定位非常直白:“应用生成及灵感共创平台”。说得更通俗些,就是你动动嘴描述,AI来帮你写代码、做界面,最后打包成一个可安
今天,腾讯云正式向公众开放了其自研的AI设计智能体平台——Ardot。按照官方的说法,这不仅仅是一个设计工具,更是一个旨在打通产品、设计与研发环节的AI驱动协作平台。 这个平台最吸引人的能力,恐怕是“一句话生成可编辑设计稿”。无论是App页面、官网、海报、插画还是PPT,用户只需输入简单的描述,AI
热门专题
热门推荐
苹果MacStudio库存见底,预示新款即将发布。外观预计延续经典紧凑设计,接口布局不变。核心升级为M5Max和M5Ultra芯片,性能大幅提升,但内存供应可能受限。固态硬盘速度有望翻倍。作为苹果专业桌面新旗舰,其起售价可能小幅上调,WWDC大会可能是发布窗口。
对于使用尼康Z卡口APS-C画幅(DX格式)相机(如Z fc、Z30、Z50)的摄影爱好者而言,在套机镜头之外选择一支定焦镜头,是提升创作自由度和画面质量的关键一步。尼克尔 Z DX 24mm f 1 7正是这样一款专为轻量化与大光圈设计的定焦镜头,目前京东售价1899元,为追求便携与画质平衡的用户
自动驾驶技术的分级标准正面临行业内部的深度反思与重构。在2026北京车展上,小马智行联合创始人兼CEO彭军发表的观点,将行业关注的焦点从技术参数转向了更为根本的责任归属议题。 彭军明确指出,当前广泛采用的L1至L5自动驾驶分级体系已显得“极其无厘头”。他认为,这些层级划分并非衡量自动驾驶商业化前景的
4月28日,《商业内幕》发布的一篇深度报道,揭示了特斯拉自动驾驶承诺背后日益凸显的信任危机。多年来,“未来将实现完全自动驾驶”是特斯拉吸引消费者的核心卖点,但对于众多早期支持者而言,这一愿景正变得愈发渺茫。 图1:马斯克确认HW3车型无法升级至无监督版FSD 问题的根源在于硬件代际差异。在近期举行的
当AI智能体不仅能说会道,还能帮你订餐、写报告,甚至用周杰伦的风格唱首歌时,汽车行业的竞争焦点,已经悄然从硬件参数转向了软件生态。这届北京车展,就是最好的证明。 “你能让它用周杰伦那种吐字不清的风格,唱首歌吗?”在火山引擎的展台,一位体验者向工作人员提出了这个有趣的要求。指令下达后,座舱里的“豆包”





