中国团队破解AI遗忘难题:让大模型遗忘率趋近于0

智东西
作者 江宇
编辑 漠影
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
AI很聪明,但记性很差。
你大概也遇到过这样的场景:第一轮对话里告诉智能客服“我对海鲜过敏”,聊到第十轮,它却依然热情推荐海鲜自助。
在企业服务里,用户换一个渠道、换一个Agent,之前提供的信息就像从没出现过一样,用户体验被“AI的健忘症”一再打断。
对于正在大规模“上云”和“上AI”的企业来说,这是每天都会撞上的真实业务问题:模型上下文窗口有限,多Agent之间形成“记忆孤岛”,语义歧义和知识遗忘在长链路服务中被不断放大。
如果不能让AI持续记住用户、记住业务现场,再强的大模型也很难扛起真实的服务指标。
这种痛点在全球云厂商的实践中已经被验证。亚马逊云科技在今年的Agentic AI基础设施实践经验系列中专门拿出一篇,讨论大模型在“记忆”上的先天缺陷,并提出要在Agent体系里单独建设记忆模块,区分短期记忆和长期记忆,将“记忆”从附属能力升级为Agentic AI基础设施的一部分。

▲亚马逊AWS最新博客
在海外巨头已经将“记忆系统”提升到基础设施层的同时,国内也开始出现以记忆为主线构建产品和架构的团队。
红熊AI便是其中之一。公司成立于2024年,围绕多模态大模型与记忆科学开展研发,并将这些能力用于为企业提供智能客服、营销自动化与AI智能体服务。
12月1日,红熊AI正式发布记忆科学开源产品“记忆熊”(Memory Bear)。
这套系统已接入红熊AI自研的Agent互动服务平台,并在原有客服、营销、教育等多个业务场景中完成了落地。平台数据显示,单日最大AI接待量约35万次,AI自助解决率达98.4%,人工替代率达到70%。在接入记忆熊后,多轮对话的token消耗下降97%,大模型知识遗忘率被压至0.1%以下。与此同时,红熊AI的业绩也从最初预期的3000万元,上调至1.9亿元。
目前,红熊AI已将记忆熊的核心框架开源,并上线正式MemoryBear.AI,希望把“记忆”做成一项可以被开发者与企业直接调用的基础能力。

▲“记忆熊”正式MemoryBear.AI
在国内Agent落地还以“问答和工具调用”为主流路径的当下,红熊AI算是较早一批把“记忆架构”单拎出来做成独立产品、并在真实业务场景里跑通指标的团队之一。
一、AI的“记忆缺失”,难以支撑企业智能服务
在红熊AI接入的多个客服与营销项目中,其团队很快发现一个共性:不补上“记忆”这一块,再强的大模型也难以在B端场景中稳定扛住业务指标。
红熊AI发现,最先暴露出来的是单模型层面的知识遗忘。大模型依赖有限的上下文窗口来“记住”当前对话,早期信息会在长对话中被不断挤出,静态知识库也无法吸收用户在对话中补充的个性化信息。
此外,注意力机制天然存在“近因效应”,越靠后的信息越容易被模型抓住,越往前的细节越容易被忽略,这就造成了典型的“答完就忘”。同一个用户重复强调过几次的偏好和限制条件,只要跨过一定轮次,很容易在后续回答中消失。
亚马逊云科技在今年的Agent记忆实践文章里也做了类似总结:LLM本质是无状态的,每次调用都是一次新的推理,长上下文不仅不能彻底解决记忆问题,反而会带来性能下降和Token成本攀升,这一点和红熊在项目中的经验总结是高度一致。
其次是多Agent之间的记忆断层,咨询、售后、推荐等Agent都会各自维护独立记忆,切换时状态将无法完整继承,容易引发决策冲突。
第三类问题来自语义层面的歧义与行业术语。企业服务里的表达往往是口语化、多语言混用且高度依赖上下文的,具体指向什么,必须结合历史对话才能解释清楚。如果模型只能在当前轮次里做模式匹配,很容易给出模棱两可甚至错误的回复。
正是在这种背景下,红熊AI意识到,“记忆”需要被单独抽象为一套可设计、可治理的系统能力。
与AWS在Agent框架中加入专门记忆模块的思路类似,红熊团队选择从“重构记忆系统”入手,把“记性好不好”这件事交给一块独立的基础设施来负责。在模型之外再造一套独立、可控、可审计的记忆系统,这也是记忆熊的起点。
二、从记忆到认知,记忆熊如何把“类人记忆”做成底层能力
记忆熊没有从堆叠更多参数入手,而是先把“人怎么记东西”这件事拆开:先搞清楚人类记忆的分类,再去给AI搭一套对应的记忆架构。
从记忆科学出发,记忆熊把人类感知记忆、工作记忆、显性记忆、隐性记忆、情绪记忆逐一映射到AI的多模态输入缓存、短期任务内存、结构化知识库、行为习惯模块和情感加权记忆等组件。

▲人类记忆与记忆熊的记忆映射
简单来说,看到什么、当下在处理什么、长期知道些什么、习惯怎么做决策、以及对不同事件“在意程度”有多高,都会在系统里有各自的位置和处理方式。
在此基础上,记忆熊把“人是如何记东西”的认知科学抽象成一整套可工程化的记忆架构:从多模态采集出发,到结构化图谱,再到分级审核与在线应用。

▲Memory Bear . AI记忆熊在线应用
企业可以像接入数据库一样,为自身的AI系统接入一块可控、可演进的“记忆大脑”。
三、从客服到教育,记忆让AI大幅度提高在业务中的价值
从红熊AI披露的项目数据看,它已经实打实顶住了企业每天几十万次交互的业务现场。
其Agent互动服务平台在激烈竞争压力下,保持了较高的稳定性和服务质量:单日最大AI接待量达到35万次,AI自助解决率达98.4%,人工替代率达70%,复杂问题自动路由率达91.7%,模型幻觉率低于0.2%,业务回答准确率稳定在99%左右。

▲红熊AI Agent互动服务平台实践效果
这些核心指标也反映出“记忆”在提升服务连续性与一致性方面已发挥出一定的作用。
在技术评估上,记忆熊同样展现出明显优势。根据LOCOMO数据集测试结果,记忆熊在单跳、多跳、开放域以及时序类任务中的F1、BLEU与Judge分数均优于Mem0、Zep、LangMem等主流记忆方案,整体性能处于领先。
在具体行业场景中,红熊AI的能力也通过多个典型应用得到验证。从智能客服、营销自动化到教育辅导、企业内部知识管理等场景中,记忆熊通过跨会话、跨角色、跨渠道的统一记忆体系,让Agent始终保持连贯理解与稳定决策。
在生态层面,记忆熊已将核心框架开源至Github,并上线正式MemoryBear.AI,希望与开发者共同完善记忆科学技术体系。
随着Agent化应用越来越多、企业对“可控记忆”和“组织记忆中枢”的需求增强,像记忆熊这样的记忆平台有机会成为AI基础设施的一环。
结语:记忆,能让AI变得更“有用”
红熊AI在记忆科学上的进展,把长期被忽视的“记忆”能力打造为可直接依赖的基础设施:一端承接多模态大模型和Agent的推理与生成能力,一端对接企业真实的业务流程与长期信息,使模型不再在每次交互中从零开始。
对行业而言,补上“记忆”这一块,大模型的表现将不再单一受限于上下文长度,而是由一套可持续积累、可持续调用的结构化记忆体系来支撑,使其在复杂的任务中保持更稳定的有效性。
随着多模态大模型、Agent框架与记忆科学不断融合,“记忆”这条技术主线会向更高层次的能力延展,让AI从短暂回应的工具,逐步演化为能理解、能延续,也能长时间工作的系统。
AI从“能回答”迈向“长期记忆、持续反馈”的那一步,很可能就建立在这块看不见却持续发挥作用的记忆基座之上。
相关攻略
角色与核心任务 你是一位顶级的文章润色专家,擅长将AI生成的文本转化为具有个人风格的专业文章。现在,请对用户提供的文章进行“人性化重写”。 你的核心目标是: 在不改动原文任何事实信息、核心观点、逻辑结构、章节标题和所有图片的前提下,彻底改变原文的AI表达腔调,使其读起来像是一位资深人类专家的作品。
从“动口”到“动手”:OpenClaw如何将AI推入“执行时代”? 文|洞见新研社 3月的最后一周,OpenClaw的GitHub社区上演了一出反转剧。往日里忙着报错的开发者们这次成了观众,主角换成了来自蚂蚁、天融信、360等机构的安全研究员,他们密集披露了数十个涉及远程接管、信息泄露的高风险漏洞。
程序员惊喜,每月100美元!OpenAI上线全新Pro方案:Codex限时10倍额度 北京时间4月10日凌晨,OpenAI终于落下了重度用户期盼已久的那只靴子:正式推出每月100美元的全新订阅方案。 至此,OpenAI的商业化版图已经清晰地划分为四个核心层级: ·免费版(接入广告) ·每月8美元的G
2026 04 14 一个核心趋势是:未来的商业竞争,本质上是用户注意力资源的争夺战。谁能更精准、高效地连接信息与用户需求,谁就能在市场中赢得关键优势。 本文配图深刻揭示了这种高效连接的底层逻辑与完整工作流。它系统展示了从数据采集到价值交付的闭环链路,每个环节都紧密耦合。实践证明,其中任一节点的效率
AI行业迎来关键转折:从“烧钱补贴”迈入“商业化定价”新阶段。被市场誉为“Token第一股”的迅策科技(03317)迎来重大利好。近期,国泰君安国际大幅上调其目标价至245港元 股。多重因素驱动下,迅策有望成为AI领域“千亿市值俱乐部”的有力竞争者。 中国AI实现弯道超车:成本优势构筑核心壁垒 全球
热门专题
热门推荐
特斯拉2025财年为首席执行官马斯克支付的个人安保费用达480万美元,较前一年增长71%。今年头两月支出同比激增超160%。该费用仅为其安保开支一部分,其名下其他企业也分担相关成本。费用增长源于投资者呼吁及本人确认的必要性,其日常安保规格极高,常由约20名保镖及医护人员随行。
HatchyPocket是融合DeFi与NFT的链上游戏平台,其代币HATCHY用于支付、治理与激励。玩家可孵化收集虚拟宠物,资产基于区块链。获取免费空投需关注官方社交渠道、参与测试网活动或贡献社区内容,但需注意安全防范与数量限制。该项目展现了游戏与区块链结合的新模式。
京东启动大规模数据采集计划,依托数十万员工与线下业务网络,在真实服务场景中采集超千万小时视频数据,构建高质量具身智能训练数据集。此举旨在破解物理AI落地的数据瓶颈,将日常履约场景转化为数据源头,为机器人从实验室走向现实提供关键支撑。
还在为《无期迷途》受枷者关卡发愁?小兵无视阻挡快速推进,BOSS物理抗性极高,防线频频失守?别担心,本文将为你详细解析三套高适配阵容攻略,助你轻松通关。即便是零氪、微氪玩家,也能稳定获取24万高分奖励! 法系速杀流:开局秒核,一击制胜 应对受枷者关卡,两大核心难点在于:无视阻挡的杂兵推进速度极快,而
握紧你的武器,指挥官!Vor的战利品之门已经开启——这不仅仅是一个新手任务,更是你蜕变为一名真正Tenno战士的震撼序章。无需担心经验不足,本关卡专为初入《星际战甲》宇宙的你设计,全程由引导者Lotus亲自指引。浩瀚的星际战甲世界,此刻正式为你拉开帷幕! 核心操作精通:位移如风,攻防一体 任务开始,





