游乐游手机版
首页/业界动态/文章详情

Engram - DeepSeek联合北大推出的条件记忆模块

时间:2026-04-22 20:31
Engram是什么 如果说给大语言模型(LLM)装上一个“外置知识U盘”,会是什么效果?DeepSeek团队联合北京大学推出的条件记忆模块Engram,就在做这件事。它的核心思路很巧妙:通过引入现代化的 -gram 嵌入表,把那些相对静态、固定的知识,从模型的计算核心中剥离出来,单独存到一个独立的记

Engram是什么

如果说给大语言模型(LLM)装上一个“外置知识U盘”,会是什么效果?DeepSeek团队联合北京大学推出的条件记忆模块Engram,就在做这件事。它的核心思路很巧妙:通过引入现代化的 -gram 嵌入表,把那些相对静态、固定的知识,从模型的计算核心中剥离出来,单独存到一个独立的记忆体里。

怎么用呢?靠的是稀疏检索和上下文感知门控这两项关键技术。模型在运行时,可以像查字典一样,快速从这个记忆体中查找所需的知识片段,既高效又精准。更重要的是,Engram与当前流行的混合专家模型(MoE)架构形成了完美互补。它能在几乎不增加实际计算量的前提下,显著提升模型在知识密集型任务、长文处理和多步骤推理上的表现。更吸引人的是,这种设计还能突破GPU显存的物理限制,为未来模型的参数规模扩展,打开了一扇新的大门。

Engram的主要功能

  • 知识检索:它的基本功。通过静态嵌入表快速锚定固定知识,让模型不必每次都“重新计算”常识,大幅降低了对即时计算资源的依赖。
  • 长上下文处理:这算是它的“特长”。Engram分担了记忆固定知识的任务,相当于释放了注意力机制的“脑容量”,让它能更专注于理解和串联全局的上下文逻辑,从而有效提升长文本的深层推理能力。
  • 计算与存储解耦:这是其架构上的突破。支持从主机内存异步预取数据,意味着知识库可以做得非常大,不再受GPU显存大小的束缚,为实现千亿、万亿参数级别的模型铺平了道路。
  • 性能提升:最终体现为综合收益。在不额外增加计算成本的情况下,模型在知识问答、通用推理、乃至代码和数学等专业任务上的表现,都能获得肉眼可见的提升。

Engram的技术原理

  • 分词器压缩:第一步是“瘦身”。通过预计算的满射函数,将海量的原始Token ID映射为更精简的规范化ID,这直接减少了词表的冗余度,让后续的 -gram 覆盖效率大大提高。
  • 多头哈希检索:这是实现快速查找的“寻址系统”。利用哈希方法和多头机制,将局部的上下文片段映射到庞大的嵌入表中,巧妙地绕过了直接参数化所有 -gram 组合所带来的组合爆炸难题。
  • 上下文感知门控:确保精准的“质量控制”。以模型当前的隐藏状态作为动态查询指令,将检索到的嵌入作为知识钥匙和内容,再通过一个门控机制来自动滤除噪声,保证引入的记忆与当前语境高度相关、语义一致。
  • 稀疏性分配:关乎资源优化的“艺术”。在固定的参数预算下,研究团队尝试将MoE专家的一部分参数重新分配给Engram记忆体,并发现了一条计算与记忆之间的“U型”权衡曲线。找到这个曲线上的最优点,就能实现性能的最大化。
  • 系统实现:最后是工程上的“精益求精”。利用Engram确定性检索的特性,彻底实现了计算过程与存储空间的解耦。通过数据预取和计算-传输重叠等机制,巧妙掩盖了数据搬移的延迟,从而真正实现了突破显存限制的大规模部署。

Engram的项目地址

Engram的应用场景

  • 知识问答:这类任务简直是Engram的“主场”。它可以毫秒级检索知识库中的事实、日期、定义,让问答系统的响应既快又准。
  • 文本生成:在创作或生成规范性文本时,Engram能快速匹配出地道的固定短语、专业术语或行文模式,让生成内容不仅流畅,也更显专业。
  • 长文本处理:法律文档分析、学术论文研读等场景迎来利器。Engram能优化长上下文建模,增强模型对全篇逻辑的把握能力,实现更深度的分析。
  • 代码辅助:编程时常见的模式、API结构和算法模板,都可以被Engram高效检索。这对于代码补全、生成乃至理解复杂项目,都能带来效率的显著提升。
  • 数学推理:面对复杂的数学问题,快速回忆起相关公式、定理和推导步骤是关键。Engram在此能发挥类似“数学手册”的辅助功能,提升推理的效率和准确性。
来源:https://ai-bot.cn/engram/
上一篇Claude Cowork - Anthropic推出的AI Agent协作工具 下一篇Baichuan-M3 - 百川智能开源的新一代医疗增强大语言模型
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
诺基亚TA-1619入网:1400mAh电池双卡双待新机
业界动态 · 2026-07-01

诺基亚TA-1619入网:1400mAh电池双卡双待新机

诺基亚又有新动作了。7月1日消息,一款型号为TA-1619的诺基亚新机已经拿到了电信设备进网许可,不过证件照目前还没公布。 从入网信息来看,这是一款TD-LTE数字移动电话机,支持TD-LTE网络,属于LTE单天线终端设备。双卡双待、VoLTE语音模式都支持,终端款式为直板。核心配置方面,电池额定容

芯佰微CBMRF900系列国产射频芯片突破海外壁垒
业界动态 · 2026-07-01

芯佰微CBMRF900系列国产射频芯片突破海外壁垒

芯佰微电子发布CBMRF9002和CBMRF9009两款射频收发芯片,采用直接变频架构,覆盖10MHz至7250MHz频段,支持最大450MHz带宽及JESD204B高速接口,性能对标国际,满足5G基站与卫星通信等高端需求,突破海外技术壁垒。

月起私人充电桩可卖电 每度净赚5毛
业界动态 · 2026-07-01

月起私人充电桩可卖电 每度净赚5毛

近期有一则重大利好消息,值得新能源车主们特别留意——车网互动价格机制改革已正式落地。自7月1日起,湖北武汉的新能源车主,可在家中的私人充电桩上通过“卖电”轻松赚钱。具体而言,就是借助峰谷电价差,实现低买高卖,每度电净收益约5毛钱。过去,车网互动(V2G)基本只局限于特定的公共充电站,受试点规模限制,

谷歌发布Nano Banana 2 Lite 4秒出图1元4张
业界动态 · 2026-07-01

谷歌发布Nano Banana 2 Lite 4秒出图1元4张

先说几个关键信息:谷歌DeepMind又给图像生成赛道添了新选项。7月1日发布的消息,Nano Banana 2 Lite正式亮相。这个名字听起来像是水果命名系列大爆发,实际上它的技术代号是Gemini 3 1 Flash Lite Image,属于Gemini 3 1家族。最大的卖点就两个:快,便

技嘉专业电竞装备助力2025 CFS世界总决赛
业界动态 · 2026-07-01

技嘉专业电竞装备助力2025 CFS世界总决赛

2025CFS世界总决赛将于12月3日至14日在重庆举行,来自四大赛区的16支战队参赛。技嘉AORUS作为赛事设备合作伙伴,以主板、显示器等专业硬件保障比赛稳定流畅,并通过赛事反哺研发的闭环模式支持电竞发展。