首页 游戏 软件 资讯 排行榜 专题
首页
AI
大模型告别记忆压缩:细节不失,GAM算法深度解析

大模型告别记忆压缩:细节不失,GAM算法深度解析

热心网友
63
转载
2025-11-28

GAM最核心的贡献在于对记忆本质的重新诠释。传统方法将记忆视为数据压缩,而GAM则提出记忆其实是动态的检索过程——就像人类回忆起某件事时,往往先进行模糊搜索,再进行细节联想。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

传统AI记忆系统存在一个根本缺陷:为了节省存储空间,系统总是试图将冗长的思维链条和工具调用记录压缩成简短的摘要。这就像把一本百科全书压成便利贴,当你需要具体信息时,系统无法提供足够的细节支撑,因为关键内容都在压缩过程中丢失了。

北京通用人工智能研究院近期发表重要论文《通用智能体记忆与深度探索》,创新性地提出了GAM(通用智能记忆)框架,采用"即时编译"策略。该框架的核心逻辑是:搜索才是记忆的本质,预设存储的记忆只是为了支持检索过程。该系统同时维护两种数据:微型备忘录(约50词)和完整对话记录的搜索库。只有当AI需要回溯时,记忆检索组件才会启动搜索。这套机制就像一位档案管理员,能够根据当前需求动态重建上下文。

双组件设计

图片

GAM框架包含两大核心模块:

记忆编码器:将智能体的历史轨迹按每页2048个token进行分割,为每页生成轻量级摘要,同时完整保留原始信息。该流程参考BGE地标检索思路,为每个页面添加语义明确的标题,确保后续检索的准确性。

研究引擎:接收查询后执行三步循环——规划、检索、反思。系统配备三种检索工具:向量搜索处理语义相似性,BM25负责关键词匹配,ID访问则直接定位特定页面。默认最多进行3轮反思,每轮检索5个页面,系统会根据任务复杂度动态调整循环次数。

值得注意的是,研究引擎对模型规模变化更为敏感。当使用0.5B参数模型时,记忆编码器尚能保持48.83的F1分数,但研究引擎的表现就直接跌至9.08了。原因很直观:信息提取相对简单,而迭代规划推理则复杂得多。

实验数据

在文档问答测试中,该方法比长上下文提示准确率提升37%,比基础检索增强生成高出28%。

图片

具体数据进一步证实了该方法的有效性:

LoCoMo对话记忆测试:单跳任务F1从48.62%提升至57.75%,多跳推理从35%跃升至42% HotpotQA多跳问答:在448K token文档库中F1达到59.81%,而传统方法普遍低于50% RULER长本文理解:多跳追踪任务准确率93.2%,而RAG方法接近0%

其中最引人深思的发现是"上下文稀释"现象。即使使用128K窗口的长文本模型,面对大量干扰信息时性能仍然不佳。简单地扩展窗口容量并非根本解决方案。

工具组合效应

单独使用检索工具效果有限,但组合使用则威力倍增。BM25最稳定(F1=48.64%),向量搜索次之(32.31%),ID访问相对较弱(28.96%)。三者结合达成最佳性能。

图片

研究团队还验证了"测试时计算缩放"效应,即增加反思轮数和检索页面数都能持续提升性能。这是传统固定流程无法实现的弹性优势。

效率平衡

GAM处理1000页历史记录的平均响应时间为1.2秒。

详细性能表现: 56K文档:在线响应12.43秒 224K文档:16.65秒 448K文档:18.49秒

虽然比传统方法慢10-50倍,但准确率从20-30%提升至50-60%。这样的性价比完全值得。

图片

有学者指出,这种即时检索机制解决了AI工作流的调试难题。"决策路径比最终状态更重要"。不过也有观点认为,这不过是将人类档案管理的老办法用在了AI系统上。

小结

GAM框架的核心突破在于对记忆本质的重新定义。传统方法把记忆当作数据压缩,而GAM则认为记忆是动态搜索过程——就像人类回忆时先进行模糊检索,再逐步重建具体细节。

这套设计带来三大优势:保真度高(完整保留原始信息)、适应性强(按需定制上下文)、可优化(支持端到端强化学习)。

论文:https://arxiv.org/abs/2511.18423

来源:https://www.51cto.com/article/830608.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

大模型告别记忆压缩:细节不失,GAM算法深度解析
AI
大模型告别记忆压缩:细节不失,GAM算法深度解析

GAM的核心贡献是重新定义了记忆的本质。传统方法把记忆当数据压缩,GAM认为记忆是动态搜索过程,想象一下人类,也是一个粗略检索,再具体回想情节的过程。 传统AI记忆系统有个致命伤:为了节省空间,它们

热心网友
11.28
Levi退役:越南打野之神告别赛场,十冠传奇落幕
游戏资讯
Levi退役:越南打野之神告别赛场,十冠传奇落幕

最新消息,LCP官推宣布GAM打野选手Levi正式退役,而今天正好也是Levi的28岁的生日。“作为越南LOL电竞史上最成功的选手,Levi拥有10座冠军奖杯、5次世界

热心网友
11.20
G2险胜GAM晋级MSI正赛 越南战队再演
游戏资讯
G2险胜GAM晋级MSI正赛 越南战队再演"抗中奇侠"剧本未果

MSI败者组决赛,G2有惊无险击败GAM,拒绝被让二追三定在耻辱柱。此前GAM从未在BO5上击败过四大赛区的队伍,而第一次赢下四大赛区,还要追溯到S12的小组赛,击败TES。

热心网友
08.11
2025MSI战报:BLG 3-0横扫GAM晋级胜者组 北川首秀斩获MVP
游戏资讯
2025MSI战报:BLG 3-0横扫GAM晋级胜者组 北川首秀斩获MVP

BLG轻取GAM迎MSI开门红 LPL终结国际赛七连败2025年6月28日·温哥华——在今日结束的MSI入围赛中,LPL二号种子BLG以3-0

热心网友
08.11
2025MSI入围赛收视破纪录:G2对决GAM海外峰值110万创历史新高
游戏资讯
2025MSI入围赛收视破纪录:G2对决GAM海外峰值110万创历史新高

根据Esports Charts最新数据显示,G2与GAM在2025MSI入围赛的BO5对决海外峰值观众达110万,成为赛事首个突破百万观赛的场次。该数据超越同期其他电竞赛事(如C

热心网友
08.11

最新APP

你说我猜
你说我猜
休闲益智 04-01
律动轨迹
律动轨迹
休闲益智 04-01
归离九阙
归离九阙
棋牌策略 04-01
一念通天
一念通天
角色扮演 04-01
恶魔秘境
恶魔秘境
角色扮演 04-01

热门推荐

以太坊(ETH)价格预测:ETH 上涨 8%,一文分析
web3.0
以太坊(ETH)价格预测:ETH 上涨 8%,一文分析

市场情绪与技术指标双重支撑看涨趋势 当前的市场情绪,用一个词概括就是“贪婪”。加密货币恐惧与贪婪指数已经攀升至72的高位,这可不是普通的乐观,而是市场信心正在加速累积的明确信号。 那么,支撑这种乐观情绪的,仅仅是感觉吗?当然不是。把目光投向技术指标,你会发现更系统的证据。在28个常被关注的关键指标中

热心网友
04.01
择偶识人学贺思慕:5个关键前提让你看清关系本质
娱乐
择偶识人学贺思慕:5个关键前提让你看清关系本质

贺思慕一开始就对段胥充满怀疑,看他哪哪都很奇怪有问题。但又敢凑在他跟前,也敢信任他,帮助他。一个原因是她自己就很厉害,根本不怕他会对她不利。另一个原因也是她懂得洞察人,识人这一块,她一个活了几百年的

热心网友
04.01
iPhone15怎么开流量?详细步骤与常见问题解答
iphone
iPhone15怎么开流量?详细步骤与常见问题解答

在iPhone 15上启用蜂窝移动网络,其实非常简单。核心操作就一步:打开“设置”,进入“蜂窝网络”,然后将“蜂窝数据”的开关打开就行。 iPhone15开启蜂窝数据的详细步骤 新机到手,想立刻用上移动网络?别急,跟着下面的步骤操作,一分钟就能搞定。首先,解锁你的iPhone 15,在主屏幕上找到那

热心网友
04.01
什么是DooDoo?值得投资吗?DooDoo代币经济学及价格预测
web3.0
什么是DooDoo?值得投资吗?DooDoo代币经济学及价格预测

什么是 Aptos 生态系统? 最近,Aptos 生态热闹非凡,活动量激增,这似乎暗示着迷因币市场的风向正在悄然变化。作为一个第一层区块链平台,Aptos 在 Solana、Near Protocol 等一众明星项目中,走出了自己独特的路子。当整个行业都在朝着模块化区块链的方向高歌猛进时,Aptos

热心网友
04.01
什么是加密货币中的背离模式?它是如何运作的?背离模式详细介绍
web3.0
什么是加密货币中的背离模式?它是如何运作的?背离模式详细介绍

什么是背离模式? 在变幻莫测的加密货币市场中,有一种技术分析工具被资深交易者频频提起,那就是背离模式。它之所以重要,是因为能帮你嗅到趋势衰竭或反转的早期气息。掌握它,就如同在波涛汹涌的市场中多了一个可靠的罗盘,不仅能更好地理解行情节奏,还能显著提升交易决策的胜算。 什么是背离模式? 简单来说,背离模

热心网友
04.01