长期以来,LPDDR主要活跃在智能手机和轻薄本等低功耗消费电子设备上。但最近几年,全球AI推理需求爆发,LPDDR正悄悄渗透进数据中心,成了端侧、边缘到云端AI推理芯片的共同选择。
不管是国际巨头还是国内玩家,纷纷在推理产品中拥抱LPDDR。这背后,是成本、功耗和性能的综合权衡。
LPDDR正成为AI推理的“通用答案”
现在,LPDDR已经不只是手机内存了。它正全面切入AI芯片市场,从推理GPU到AI专用CPU、桌面AI超级计算机,到处都能看到它的身影。
数据中心
高通AI200/AI250是目前最激进的LPDDR数据中心方案。作为高通首款数据中心级推理系统,AI200专为机架级AI推理打造,瞄准大语言模型和多模态模型推理,主打低总体拥有成本。单卡配了768GB LPDDR内存,容量和成本优势都很明显,预计2026年上市。后续的AI250会在2027年推出,在核心架构上升级。
英特尔这边,推出了首款基于Xe3P架构的数据中心GPU,代号“新月岛”。这款产品专门为AI推理和Agent工作负载优化,用了480GB LPDDR5内存,TDP只有350W。放弃HBM后,它可以直接进现有的风冷数据中心,不用液冷改造,这是个很实际的部署优势。
国内的曦望科技,其启望S3是国产芯片的代表。作为国内首款用LPDDR6显存的GPGPU,官方称推理性价比能提升10倍以上,单位token成本降了90%。
端侧AI
端侧AI是LPDDR最成熟的阵地。韩国半导体企业DEEPX近期宣布,其产品将导入LPDDR-PIM存内计算方案。PIM把数据处理单元直接集成到DRAM里,能减少数据在处理器和内存间来回搬移,提升能效。DeepX计划把80TOPS算力的2nm端侧芯片DX-M2和三星的LPDDR5X-PIM搭配。后续的DX-M3还会配合JEDEC标准化的LPDDR6-PIM。
上游供应商江波龙也推出了两款端侧AI推理专用LPDDR方案:AIDIMM(插槽式)和AILPBGA(焊接式)。AIDIMM用了4颗LPDDR5x同面布局,最高128GB容量、256bit位宽、307.2GB/s单通道带宽。AILPBGA则采用自研技术,单颗原生256bit位宽,带宽307GB/s,容量覆盖24GB到64GB,封装尺寸22×22mm,兼容LPDDR标准接口。
桌面与AI PC
除了专用推理芯片,LPDDR还在通过“统一内存架构”重新定义AI PC的性能边界。AMD Strix Halo(Ryzen AI MAX系列)用了256-bit LPDDR5X接口,支持最高128GB LPDDR5X-8000内存,带宽256GB/s。苹果M4 Max更激进,512-bit LPDDR5X总线(32×16-bit控制器),用MoP封装实现546GB/s带宽,成了本地跑大模型的性能标杆。英伟达也不甘示弱,新推出的RTX Spark超级芯片,面向轻薄本和小型台式机,集成了Blackwell架构RTX GPU和20核Grace CPU,最高128GB LPDDR5X统一内存,AI算力达到1 PFLOP,在低功耗小体积设备上实现了高性能AI计算。
此外,英伟达还发布了“全球最强大的桌面AI超级计算机”DGX Station for Windows。它由GB300 Grace Blackwell Ultra桌面超级芯片驱动,通过NVLink-C2C互连把Blackwell Ultra GPU和72核Grace CPU连起来。配备748GB相干内存,包括496GB LPDDR5X(396GB/s)CPU内存和252GB HBM3e GPU显存,CPU和GPU之间数据交换带宽很高。
为什么是LPDDR?
LPDDR全称是低功耗双倍数据率同步动态随机存取存储器。顾名思义,它的设计核心就是“省电”。它通常直接焊在手机或超薄本主板上,和处理器紧挨着,几乎不可更换。那么,为什么这些厂商不约而同地转向LPDDR?有四个关键原因。

首先,成本更低,供应更充足。HBM是多个DRAM芯片垂直堆叠的3D结构,每层都要通过TSV硅通孔和微凸点互连。堆叠层数一多,良率就直线下降。3D堆叠工艺复杂、良率有限,HBM长期供应紧张。而LPDDR依托成熟的平面DRAM工艺和大规模消费电子产能,单位容量成本远低于HBM,能显著降低AI推理服务器的硬件投入和总拥有成本,特别适合大规模部署。
其次,容量更大,单卡可以加载更大的模型,上下文也能更长。高通AI200的768GB LPDDR是行业最大容量。作为对比,NVIDIA GB300单GPU只有288GB HBM3e,AMD MI450X是432GB HBM4。HBM通过硅中介层和处理器做2.5D封装,必须紧挨着核心排布,限制了单系统总容量上限,PHY固定宽度和接口位置也限制了布局。而LPDDR5X控制器IP生态成熟,获取门槛低,PCB布线及信号训练流程高度标准化。系统扩展很灵活,需要带宽可以多通道并行,需要容量也可以加,无非是多增加引脚数。
另外,功耗更低。以英特尔新月岛为例,用LPDDR而不是HBM,功耗降到350W,意味着可以在现有风冷数据中心直接运行,不需要液冷改造。这省去了数据中心液冷改造的投入,降低了投资成本和建设周期。
最后,推理对存储带宽的要求比训练低。训练场景中,大量数据的反向传播需要极高内存带宽,HBM不可替代。但推理场景中,模型参数是固定的,重点是大容量存储和高效检索;LPDDR的容量和成本优势远超带宽方面的缺点。今年GTC大会上,黄仁勋说AI推理市场拐点已到,AI从训练阶段全面进入推理与执行阶段,推理算力需求指数级爆发。相比传统训练芯片,推理芯片更强调功耗控制、成本效率和部署灵活性,LPDDR显然更合适。
芯片巨头同时转向LPDDR不是巧合,是行业调整。有机构预测,到2030年,推理工作负载数量将是训练工作负载的100倍。数据中心AI芯片采用LPDDR,是个明确的推理导向设计选择。在HBM供应紧张、价格昂贵的背景下,高通、Intel等厂商通过LPDDR实现了“单卡大容量、低TCO、风冷部署”的差异化路线,特别适用于LLM推理、视频分析、推荐系统等带宽需求相对可控、容量需求极高的场景。当然,LPDDR方案也有代价:相比HBM,它的内存带宽较低、接口更窄导致延迟较高,而且在24小时高温服务器环境中的可靠性还有待验证。
LPDDR需求暴涨
厂商集体转向的直接后果,是LPDDR需求几何级增长。以高通AI200为例,单个机架可能包含数十张加速卡,每张768GB内存,总内存容量达数十TB。这相当于数十万甚至数百万智能手机的内存使用量。当高通、英特尔、英伟达以及其他潜在竞争者(如AMD和博通)在2026-2027年大规模生产LPDDR方案时,需求将指数级增长。
有分析师指出,英伟达Vera Rubin AI服务器所需的LPDDR使用量,将从2026年的31.44亿GB攀升至2027年的60.41亿GB,占2027年全球LPDDR总供应能力的36%。这一数字将首次超过苹果(29.66亿GB)和三星(27.24亿GB)的用量总和。
Vera Rubin是英伟达在GTC 2026上宣布全面投产的最新AI平台,由Vera CPU和Rubin GPU构成。Vera CPU搭载88个定制ARMv9.2“Olympus”核心,系统支持高达1.5TB(约1536GB)LPDDR5X内存,采用新一代SOCAMM2封装形态。相比之下,一部旗舰智能手机通常只有12-16GB LPDDR5X内存——单颗Vera CPU的LPDDR配备量,是一部手机的90倍。
AMD也在推升LPDDR需求。其2027年推出的第六代EPYC服务器处理器“Verano”,将首次支持SOCAMM2形态的LPDDR5X内存。
LPDDR的供应逻辑和HBM完全不同。HBM由SK海力士、三星、美光三巨头垄断,产能高度受限;而LPDDR拥有更庞大的消费电子产能基底和更成熟的供应链。当AI巨头集体转向,LPDDR的产能会成为AI基础设施扩张的关键变量。
LPDDR6:从“够用”到“好用”
JEDEC固态技术协会于2026年4月正式预览LPDDR6路线图。其中最引人注目的是:LPDDR6单颗内存芯片容量有望达到512GB。这一规格直接大幅超越当前主流服务器DDR5(单根容量普遍64GB-128GB,单颗Die容量差距更悬殊)。之所以能实现这么夸张的容量突破,主要是因为JEDEC新增了更窄的x6子通道模式,让单个封装能容纳更多内存die,再配合更先进的制程工艺带来单颗die密度提升,最终使单颗芯片就能承载以往整根内存条才能达到的容量。
LPDDR6的性能规格较上一代显著跃升。带宽可达10.6Gbps至14.4Gbps,上一代LPDDR5X最高10.7Gbps,性能提升约1.5倍。SK海力士已成功开发出采用1cnm工艺的16Gb LPDDR6 DRAM,并完成了全球首个相关认证。这款新品的运行速度达到10.7Gbps,数据处理速度较上一代LPDDR5X产品提高33%。
同时,基于LPDDR6的SOCAMM2紧凑型模块标准也在同步开发,用来替代传统又厚又大的DDR5条,为AI服务器提供更高集成度的低功耗内存底座。对普通游戏和创作玩家来说,LPDDR6的进阶不会一蹴而就,但未来三年内,高端游戏本、平板或AIPC都有望获得超大内存。更关键的是,在保持轻薄续航的前提下,端侧运行数百亿参数的大模型甚至大型仿真渲染将成为常态。
采用LPDDR,是个明确的推理导向设计选择。它标志着AI算力竞争从“训练时代的HBM带宽竞赛”转向“推理时代的容量与TCO竞赛”。随着LPDDR6的512GB单颗容量、14.4Gbps速率、SOCAMM2模块化封装和PIM存内计算的成熟,AI服务器将轻松构建TB级内存池。模型权重与KV Cache不再需要在内存与SSD之间“痛苦搬家”,端侧运行数百亿参数大模型、车载实时多模态推理、桌面AI Agent常驻后台——都将成为常态。
