首页 游戏 软件 资讯 排行榜 专题
首页
AI
腾讯云开源Agent Memory技术大幅降低61%的Token消耗

腾讯云开源Agent Memory技术大幅降低61%的Token消耗

热心网友
17
转载
2026-05-15

近日,腾讯云数据库团队正式开源了TencentDB Agent Memory,这是一套专为AI Agent长周期任务设计的分层记忆引擎,采用MIT协议开放。该项目创新性地运用“上下文卸载”与“Mermaid任务画布”两大核心技术,旨在解决传统Agent记忆方案在长会话中的效率瓶颈。在多任务连续会话的实测中,该方案最高可降低61.38%的Token消耗,同时将任务成功率相对提升51.52%。目前,项目已适配OpenClaw、Hermes等主流AI Agent框架,支持开发者一键集成,快速提升AI智能体性能。

腾讯云开源Agent Memory:Token消耗最高降低61%

长周期任务中,传统记忆方案的三大核心痛点

当前,主流AI Agent的记忆管理方案,普遍采用将对话历史压缩成摘要并注入后续上下文的方式。这种方法在简短对话中尚可应对,但一旦面临真实的长周期、多步骤任务场景,三大核心痛点便暴露无遗。

首先是跨会话记忆断裂。Agent在每次新会话中难以继承历史信息,导致用户昨天反复确认的需求或规范,今天需要重新沟通,任务无法连贯执行。

其次是信息价值混淆。用户陈述的事实性偏好(如“使用TypeScript开发”)与临时性指令(如“查询天气”)被同等对待并压缩,致使关键长期信息被大量瞬时信息稀释,影响决策准确性。

最后是上下文窗口膨胀。随着任务周期拉长,堆砌的历史信息不断占用宝贵的上下文Token,不仅导致API调用成本攀升,更会分散模型对当前任务的注意力,严重影响执行效率与效果。

两大核心技术:从“模糊摘要”到“结构化可执行地图”

TencentDB Agent Memory旨在系统性地攻克上述难题。其核心突破在于两项关键技术,它们从根本上重塑了AI Agent记忆的存储、组织与调用方式。

Mermaid任务画布:实现记忆的结构化与可视化

第一项核心技术是“Mermaid任务画布”。该系统能够将Agent执行任务的完整过程,动态组织成一张结构清晰的可视化任务图谱。这张图谱基于Mermaid Flowchart语法,将任务状态、步骤摘要及执行依赖关系直观呈现。

这意味着,Agent无需再记忆冗长的原始对话文本,而是掌握了一张“可执行的任务地图”。重要信息被锚定在任务图的特定节点,既可折叠收纳以节省空间,也能按需展开回溯细节。记忆从此不再是不可逆的模糊摘要,其保真度与可用性获得质的提升。

上下文卸载:实现分层存储与精准回溯

第二项核心技术是“上下文卸载”。在每次工具调用(如网页抓取、代码执行)结束后,产生的大量原始结果(如完整网页内容、日志、代码块)将不再持续占用上下文窗口。它们会被完整持久化存储至外部,而在上下文中仅保留一行精炼摘要和一个索引路径。

当Agent需要回顾细节时,可通过清晰的四层递进结构进行精准回溯:从高层级的轻量摘要(L2-L3),到结构化的JSONL记录(L1),最终可直达底层存储的完整原始证据(L0)。这种分层机制确保了任何压缩操作都是可追溯的,关键信息无一丢失。

实测数据:效率与准确率实现双重飞跃

理论优势需要数据支撑。在针对超长会话的专项评测中,将TencentDB Agent Memory作为插件接入OpenClaw框架后,效果极为显著:Token消耗最高降低61.38%,任务整体通过率相对提升51.52%。

更值得关注的是,在衡量Agent记忆用户长期偏好的PersonaMem指标上,准确率从基准的48%大幅跃升至76%,优化幅度接近60%。这直接印证了该方案在理解和持久化用户个性化需求方面的强大能力。

另一项关键发现是:单独使用“上下文卸载”技术,可实现约15%的Token节省;而当结合“Mermaid任务画布”共同使用时,节省率跃升至31%-33%。这充分证明,任务画布带来的结构化记忆能力,对消除上下文噪声、聚焦模型注意力具有独立且显著的贡献。

清晰四层架构与灵活部署选项

为支撑上述高级能力,TencentDB Agent Memory设计了清晰的四层递进式记忆架构:

  • 底层(L0):完整保留所有原始对话与执行证据,确保百分之百可追溯性。
  • 中间层(L1-L2):对原始信息进行逐步提炼,形成场景化归纳与原子记忆单元。
  • 顶层(L3):抽象并生成持续演进的用户画像与长期偏好。

各层职责单一,通过提取、聚合、蒸馏的管道有序连接。这种模块化设计使得任一层次均可独立优化或替换,保证了系统良好的可演进性与维护性。

在部署层面,项目充分考虑了易用性与扩展性。默认采用本地SQLite作为存储后端,实现零外部API依赖,且所有中间产物均输出为人类可读的Markdown和Mermaid文件,极大降低了调试与审计门槛。对于有更高性能需求的场景,可无缝接入腾讯云向量数据库TCVDB,实现BM25与向量检索的混合查询,以提升复杂记忆的检索效率与准确度。系统同时支持跨Agent、跨框架、跨设备的记忆导入导出与实时迁移,为团队协作与记忆持久化提供了极大便利。

从内部实践到全面开源

事实上,TencentDB Agent Memory的长期记忆核心能力已于今年4月初在腾讯云内部上线并免费开放。彼时,在PersonaMem测试集上,已成功将OpenClaw的回答准确率从48%提升至76.10%。

此次于5月14日的正式开源,则重点聚焦于短期记忆的智能压缩与管理能力,旨在将腾讯云内部经过大规模实践验证的产品级解决方案,完整贡献给全球开发者社区。目前,项目在GitHub上已迅速获得超过1300个Star。开发者可通过OpenClaw插件或Hermes Gateway轻松一键接入,极简安装通常仅需一行命令即可完成,助力快速构建更高效、更经济的AI Agent应用。

来源:https://www.elecfans.com/d/7932800.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

腾讯云开源Agent Memory技术大幅降低61%的Token消耗
AI
腾讯云开源Agent Memory技术大幅降低61%的Token消耗

腾讯云开源了TencentDBAgentMemory分层记忆引擎,采用MIT协议。该引擎通过“上下文卸载”和“Mermaid任务画布”两项核心技术,在多任务连续会话中最高可降低61 38%的Token消耗,并将任务成功率相对提升51 52%。它解决了长周期任务中记忆跨会话断裂、事实与偏好混淆以及上下文膨胀三大痛点。项目已适配主流Agent框架,支持一键集成与

热心网友
05.15
SAP统一AI平台整合构建与部署全套能力
AI
SAP统一AI平台整合构建与部署全套能力

SAP推出统一AI平台,整合业务技术、数据云与AI能力,为企业提供集成底座。同时发布自动化套件,通过超50个AI助手调度近200个智能体,驱动业务流程自动化。平台基于近期收购的数据管理公司构建,并与多家云服务商合作,确保AI结果准确合规,以提升效率、节约成本。

热心网友
05.15
AI资产合理化战略推行指南与落地实施步骤
AI
AI资产合理化战略推行指南与落地实施步骤

企业AI部署应避免盲目投入,转向精细运营。AI资产合理化通过系统评估资源,识别浪费与错配,聚焦业务贡献与成本效益,淘汰低效资产并优化有效资源。企业需建立评估框架,在应用早期及时调整,以提升投资回报,避免未来高昂修正成本。

热心网友
05.15
香港科技大学如何让AI学会公平预测避免答案趋同
AI
香港科技大学如何让AI学会公平预测避免答案趋同

香港科技大学团队提出CCC-GRPO训练框架,通过将“单次比较”改为“批量比较”,并利用一致性相关系数评估预测分布与真实分布的吻合度,迫使AI均衡学习长尾数据中的所有数值区间。该框架在年龄预测、电影评分和医学骨龄估算等任务中,显著提升了模型在稀少样本上的表现,且无需改变模型架构。

热心网友
05.15
2026年Recraft AI注册教程 手把手教你申请账号
AI
2026年Recraft AI注册教程 手把手教你申请账号

RecraftAI注册需通过官网进行,提供邮箱与Google账户两种方式。邮箱注册需填写有效邮箱并设置强密码,提交后须在24小时内完成邮件验证以激活全部功能。使用Google账户登录则更为快捷,授权后即可直接进入工作台开始创作。

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

吉港航天科技合作成果丰硕 两地深度融合促发展
科技数码
吉港航天科技合作成果丰硕 两地深度融合促发展

香港科技大学牵头研制的“天韵相机”随天舟十号升空,该项目由内地与香港科研团队合作完成,体现了双方优势互补的高效能。香港科研正深度融入国家发展大局,从“参与”转变为“不可或缺”的一部分。项目不仅激励更多机构参与国家重大工程,还积极推动成果转化,相关企业正将监测数据转化。

热心网友
05.15
英伟达股价突破236美元创历史新高 市值接近6万亿美元
科技数码
英伟达股价突破236美元创历史新高 市值接近6万亿美元

英伟达股价5月14日创下236 54美元历史新高,收盘涨4 39%至235 74美元,盘后交易继续微涨,公司总市值攀升至约5 71万亿美元。

热心网友
05.15
PENGU代币机制解析:Pudgy Penguins生态亮点与赛道定位全攻略
web3.0
PENGU代币机制解析:Pudgy Penguins生态亮点与赛道定位全攻略

PudgyPenguins生态代币PENGU采用创新的质押与销毁机制,旨在平衡价值捕获与社区激励。其定位超越了传统NFT项目,致力于构建一个融合实体商品、游戏与社交的综合性IP生态。通过独特的“灵魂绑定”特质和多元化的应用场景,PENGU力图在竞争激烈的Web3赛道中,探索出一条可持续的IP价值实现路径。

热心网友
05.15
马斯克起诉OpenAI案最新进展结案陈词阶段
科技数码
马斯克起诉OpenAI案最新进展结案陈词阶段

马斯克起诉OpenAI案进入结案陈词阶段。马斯克指控OpenAI背离非营利初衷,违反信托义务并转向营利,其律师质疑奥特曼信誉并指责微软协助不当行为。OpenAI律师反驳称马斯克证词矛盾,且其本人也曾试图控制公司获利。诉讼结果可能取决于是否在法定时效内提起,并将影响OpenAI未来发展与IPO进程。

热心网友
05.15
苹果与OpenAI合作破裂或将面临法律诉讼
科技数码
苹果与OpenAI合作破裂或将面临法律诉讼

彭博社报道,OpenAI对与苹果的合作现状非常失望,ChatGPT集成未达预期增长。OpenAI正评估法律选项,可能向苹果发出违约通知。双方于2024年宣布深度合作,但功能入口较深、收入低于预期。苹果则关注OpenAI隐私标准及硬件动向。科技公司与苹果合作历来复杂,历史案例包括谷歌地图、AdobeFlash及Spotify纠纷。

热心网友
05.15