腾讯开源Agent记忆方案大幅降低Token消耗达61%

首页

AI资讯

热心网友

转载

2026-05-20

5月14日，腾讯云正式开源其核心AI智能体记忆管理技术——TencentDB Agent Memory。该方案精准解决了当前AI智能体（Agent）在执行长周期、多步骤任务时面临的关键瓶颈：记忆膨胀与Token成本失控。通过创新的“外存内精”架构，它能显著优化上下文使用效率，提升复杂任务的成功率与执行连贯性。

腾讯开源 Agent 记忆技术方案，Token 消耗最高降低 61%

随着AI智能体在代码生成、自动化研究、深度数据分析等领域的应用日益深化，任务流程变得冗长而复杂。每一次工具调用（如网页搜索、代码执行）都会产生海量的中间结果、日志和原始数据，迅速挤占有限且昂贵的模型上下文窗口。这不仅导致Token消耗激增、成本高涨，更可能因关键信息被挤出窗口而造成任务状态丢失或逻辑混乱，影响最终输出质量。

行业常见的应对方案，如单纯扩大上下文窗口或进行简单的文本摘要，在应对复杂的多轮交互与长链条任务时往往捉襟见肘。上下文信息过载、关键细节丢失等问题依然普遍存在，制约了智能体的实际应用效能。

腾讯云数据库团队开源的TencentDB Agent Memory，提供了一套系统性的解决方案。其核心理念是“外存内精”：将完整、冗长的原始数据卸载到外部存储中管理，而在执行上下文中仅保留任务的核心状态骨架与结构化关系图谱，从而在保证任务连续性的前提下，最大化压缩Token占用。

该方案主要依托两大核心技术模块实现高效记忆管理。

首先是“Mermaid任务画布”功能。这一模块将整个Agent的任务执行过程动态可视化为一个结构化的任务图谱，类似于智能体的“思维导图”或“项目路线图”。图中清晰定义了每个子任务步骤的状态、摘要以及步骤间的依赖关系。Agent仅需在上下文中维护这张轻量级的“任务地图”，即可时刻掌握整体进度、当前所处位置以及后续行动路径，确保了长任务执行的方向性与逻辑清晰度。

其次是“上下文卸载”机制。当Agent调用外部工具并获取到原始结果（如大段网页内容、代码日志）后，这些庞杂的细节信息不会持续占用宝贵的上下文空间。它们会被自动摘要并索引，随后完整内容被存储到外部文件系统中。上下文里仅保留精炼的摘要和快速检索键。只有当Agent在后续步骤中需要回溯特定细节时，才按需将相关部分精准加载回上下文。这相当于为Agent配备了一个智能的“外部记忆库”，有效释放了主工作内存的压力。

该方案的实际效果如何？腾讯云公布的基准测试数据提供了有力证明。启用TencentDB Agent Memory记忆优化方案后：

在自动化网页搜索与信息整合场景中，Token消耗最高可降低61%，同时任务成功率相对提升52%；
在自动化代码调试与修复场景中，Token消耗最高降低33%，任务完成率相对提升10%；
在复杂长文档分析与总结场景中，Token消耗最高降低31%，关键信息分析准确率相对提升8%。

除了优化单次任务的短期记忆管理，该项目还集成了一个长期个性化记忆模块。该模块支持Agent在跨对话会话中持续学习并记忆用户的个性化偏好、历史背景与行为模式。在PersonaMem基准测试中，该模块将Agent对用户画像的理解准确率从48%显著提升至76%。据悉，此长期记忆能力此前已作为一项免费服务对外开放试用。

目前，TencentDB Agent Memory项目已在GitHub上全面开源，并兼容OpenClaw、Hermes等主流Agent开发框架。其对开发者极为友好，仅需一行安装命令即可快速集成，无需额外配置数据库或依赖外部服务。所有Agent的任务历史与记忆内容均以标准文件格式本地化存储，方便开发者直接查看、分析与调试，提供了极高的操作透明度和可控性。

值得注意的是，这是腾讯近期在AI智能体技术生态布局中的又一重要举措。就在上月，腾讯云刚刚开源了高性能Agent执行底座“Cube”，其在GitHub上迅速获得了超过5000颗星标。这一系列连贯动作清晰地表明，腾讯正在持续加大对AI智能体底层基础设施的研发投入与开源开放，旨在为构建更复杂、更可靠、更实用的下一代AI应用奠定坚实的技术基础。

来源:https://www.qbitai.com/2026/05/417753.html

免责声明：游乐网为非赢利性网站，所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系youleyoucom@outlook.com。

上一篇：AIGC2026峰会参会指南明日520正式发布下一篇：海信视像发布会无电视产品揭示第二增长曲线战略

相关攻略

AI资讯

腾讯开源Agent记忆方案大幅降低Token消耗达61%

腾讯云开源TencentDBAgentMemory技术，针对AI智能体长任务记忆管理痛点，通过“外存内精”思路降低Token消耗。其核心包括动态结构化任务状态的“Mermaid任务画布”，以及将详细结果卸载至外部存储、仅保留摘要索引的“上下文卸载”功能。测试显示，该方案在网页搜索等场景中最高降低61%的Token消耗，并显著提升任务成功率与准确率。

热心网友

05.20

AI资讯

腾讯QClaw V2发布多智能体协同与安全连接应用详解

4月9日，腾讯旗下的本地AI助手QClaw迎来了一次重磅更新。V2大版本正式上线，一口气带来了多Agent协作、应用连接器以及名为“龙虾管家”的原生安全防护三大核心能力。这标志着AI助手正从单打独斗的“工具人”，向一个分工明确、能力互补且自带安全防护的“智能团队”进化。作为基于OpenClaw打造

热心网友

05.20

业界动态

腾讯联合高校推出视觉感知评测基准ChroniclesOCR

腾讯混元联合多家机构推出Chronicles-OCR视觉感知评测基准，构建覆盖汉字七种字体、跨越三千年的评测体系，包含2800张高质量图像，采用阶段自适应标注与四大核心任务，专门评估视觉大模型对汉字形态演变的感知鲁棒性，旨在系统性诊断模型能力边界，推动古文数字化与相关研究。

热心网友

05.19

AI资讯

腾讯吐司App三分钟教你零基础开发应用

你是否也曾有过这样的瞬间——脑海中闪过一个绝佳的App创意，却因为不懂编程，只能眼睁睁看着灵感消散？最近，腾讯悄然上线了一款名为“吐司”的产品，似乎正是为了解决这个问题而来。它的定位非常直白：“应用生成及灵感共创平台”。说得更通俗些，就是你动动嘴描述，AI来帮你写代码、做界面，最后打包成一个可安

热心网友

05.19

科技数码

腾讯Ardot公测AI设计工具一键生成可编辑稿并转代码

今天，腾讯云正式向公众开放了其自研的AI设计智能体平台——Ardot。按照官方的说法，这不仅仅是一个设计工具，更是一个旨在打通产品、设计与研发环节的AI驱动协作平台。这个平台最吸引人的能力，恐怕是“一句话生成可编辑设计稿”。无论是App页面、官网、海报、插画还是PPT，用户只需输入简单的描述，AI

热心网友

05.19

热门推荐

iphone

Mac Studio M5性能深度解析五大关键信息助你全面了解

苹果MacStudio库存见底，预示新款即将发布。外观预计延续经典紧凑设计，接口布局不变。核心升级为M5Max和M5Ultra芯片，性能大幅提升，但内存供应可能受限。固态硬盘速度有望翻倍。作为苹果专业桌面新旗舰，其起售价可能小幅上调，WWDC大会可能是发布窗口。

热心网友

05.20

业界动态

尼克尔Z DX 24mm f/1.7镜头适合C画幅人文扫街售1899元

对于使用尼康Z卡口APS-C画幅（DX格式）相机（如Z fc、Z30、Z50）的摄影爱好者而言，在套机镜头之外选择一支定焦镜头，是提升创作自由度和画面质量的关键一步。尼克尔 Z DX 24mm f 1 7正是这样一款专为轻量化与大光圈设计的定焦镜头，目前京东售价1899元，为追求便携与画质平衡的用户

热心网友

05.20

业界动态

彭军直言L3自动驾驶本质仍是L2，现有分级体系亟待重构

自动驾驶技术的分级标准正面临行业内部的深度反思与重构。在2026北京车展上，小马智行联合创始人兼CEO彭军发表的观点，将行业关注的焦点从技术参数转向了更为根本的责任归属议题。彭军明确指出，当前广泛采用的L1至L5自动驾驶分级体系已显得“极其无厘头”。他认为，这些层级划分并非衡量自动驾驶商业化前景的

热心网友

05.20

业界动态

特斯拉FSD无法升级引车主不满马斯克承诺遭质疑

4月28日，《商业内幕》发布的一篇深度报道，揭示了特斯拉自动驾驶承诺背后日益凸显的信任危机。多年来，“未来将实现完全自动驾驶”是特斯拉吸引消费者的核心卖点，但对于众多早期支持者而言，这一愿景正变得愈发渺茫。图1：马斯克确认HW3车型无法升级至无监督版FSD 问题的根源在于硬件代际差异。在近期举行的

热心网友

05.20

业界动态

龙虾车圈热潮来袭现象深度解析

当AI智能体不仅能说会道，还能帮你订餐、写报告，甚至用周杰伦的风格唱首歌时，汽车行业的竞争焦点，已经悄然从硬件参数转向了软件生态。这届北京车展，就是最好的证明。 “你能让它用周杰伦那种吐字不清的风格，唱首歌吗？”在火山引擎的展台，一位体验者向工作人员提出了这个有趣的要求。指令下达后，座舱里的“豆包”

热心网友

05.20