游乐游手机版
首页/科技数码/文章详情

梁文锋披露DeepSeek V4:全新记忆架构或将面世

时间:2026-01-13 09:55
1月13日消息,今日凌晨,DeepSeek 开源全新架构模块「Engram」,并同步发布技术论文,署名作者中再次出现梁文锋。据悉,Engram 模块通过引入可扩展的查找式记忆结构,为大模型提供了区别

1月13日消息,今天凌晨,DeepSeek开源了全新架构模块“Engram”,并同步发布了技术论文,署名作者中再次出现了梁文锋。据悉,Engram模块通过引入可扩展的查找式记忆结构,为大模型提供了区别于传统Transformer与MoE的全新稀疏性维度。

DeepSeek在论文中指出,当前主流大模型在处理两类任务时存在结构性低效:一类是依赖固定知识的“查表式”记忆,另一类是复杂推理与组合计算。传统Transformer(无论Dense或MoE)均需通过多层注意力与MLP重建这些静态模式,导致计算资源被大量消耗在“重复构造已知模式”上。

Engram的核心机制是基于现代化哈希-N-Gram嵌入的O(1)查找式记忆。模块会对输入Token序列进行N-Gram切片,并通过多头哈希映射到一个规模可扩展的静态记忆表中,实现常数时间的检索。

论文强调,这种查找与模型规模无关,即便记忆表扩展至百亿级参数,检索成本仍保持稳定。与MoE的条件计算不同,Engram提供的是“条件记忆”。模块会根据当前上下文隐向量决定是否启用查找结果,并通过门控机制与主干网络融合。

论文显示,Engram通常被放置在模型早期层,用于承担“模式重建”职责,从而释放后续层的计算深度用于复杂推理。DeepSeek在27B参数规模的实验中,将部分MoE专家参数重新分配给Engram记忆表,在等参数、等算力条件下,模型在知识、推理、代码与数学任务上均取得显著提升。

在相关技术讨论平台上,观点认为Engram的机制有效减少了模型早期层对静态模式的重建需求,使模型在推理部分表现得更“深”。有开发者指出,这种架构让大规模静态记忆得以脱离GPU存储限制,通过确定性寻址实现主机内存预取,从而在推理阶段保持低开销。多位观察者推测,Engram很可能成为DeepSeek下一代模型“V4”的核心技术基础。

来源:https://www.donews.com/news/detail/1/6369207.html
上一篇小米首发3纳米玄戒O1芯片,布局智能汽车新赛道 下一篇Counterpoint:苹果2025年重夺手机出货第一,全球增长2%
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元
科技数码 · 2026-07-03

泰坦军团战魂KG277VPLUS双模显示器27英寸4K165Hz/520Hz仅1888元

泰坦军团“战魂KG277VPLUS”27英寸显示器发售,支持4K165Hz与FHD520Hz双模切换,定价1888元。采用FastIPS面板,97%DCI-P3色域,配备升降支架及双HDMI2 1和双DP1 4接口。

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%
科技数码 · 2026-07-03

苹果调价影响消费需求 2026年全球笔电出货量或降13.6%

迈入2026年,DRAM与NAND闪存的供应持续紧张及价格不断攀升,正逐步传导至终端消费市场。可以预见,下半年市场环境将更加严峻。上半年多家PC厂商已陆续上调产品定价,最终连苹果也不得不跟进,宣布提升iPad、Mac及家居设备的价格,以应对存储成本的快速上涨。 TrendForce分析指出,苹果全面

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波
科技数码 · 2026-07-03

苹果iPhone 18 Pro自研C2芯片或不支持5G毫米波

苹果自研C2芯片仅支持Sub-6GHz,不支持5G毫米波。因此,美版iPhone18Pro继续采用高通基带方案以支持毫米波,而其他地区版本则搭载苹果自研C2芯片。这一差异将导致在毫米波覆盖的市场中,用户峰值速率可能显著低于美版用户。

纳睿雷达推出睿宸超精细化短时临近AI气象大模型
科技数码 · 2026-07-03

纳睿雷达推出睿宸超精细化短时临近AI气象大模型

纳睿雷达近日释放了一项重磅成果。2026年7月1日,公司正式对外发布了两款自主研发的全新产品:一款是“WDSPT0152型”S波段全极化多功能有源相控阵雷达,另一款则是名为“睿宸”的超精细化短时临近AI气象大模型。从产品战略来看,此次发布直指气象监测与灾害预警领域的技术制高点。 先来看这款S波段雷达

南航国际创新港一期交付 四大专业园区打造空天产业强磁场
科技数码 · 2026-07-03

南航国际创新港一期交付 四大专业园区打造空天产业强磁场

近日,南京航空航天大学与六合区深度合作的标杆项目——南航国际创新港一期正式交付投用。两个地块陆续启用,成功串联起高校科研能量、地方产业载体与市场创新主体,为南京打造全国领先的航空航天产业创新中心、助力江苏布局商业航天全产业链,提供了坚实的物理支撑。 该创新港一期位于六合区雄州街道,分为3号和4号两个