AI推理芯片集体换用LPDDR内存原因解析

首页/业界动态/文章详情

AI推理芯片集体换用LPDDR内存原因解析

时间：2026-06-11 13:52

LPDDR正从手机内存全面切入AI推理芯片市场，成为端侧、边缘到数据中心推理芯片的共同选择。凭借成本低、容量大、功耗低及供应充足等优势，厂商纷纷采用LPDDR替代HBM，推动推理算力从带宽竞赛转向容量与总拥有成本竞赛。

长期以来，LPDDR主要活跃在智能手机和轻薄本等低功耗消费电子设备上。但最近几年，全球AI推理需求爆发，LPDDR正悄悄渗透进数据中心，成了端侧、边缘到云端AI推理芯片的共同选择。

不管是国际巨头还是国内玩家，纷纷在推理产品中拥抱LPDDR。这背后，是成本、功耗和性能的综合权衡。

LPDDR正成为AI推理的“通用答案”

现在，LPDDR已经不只是手机内存了。它正全面切入AI芯片市场，从推理GPU到AI专用CPU、桌面AI超级计算机，到处都能看到它的身影。

数据中心

高通AI200/AI250是目前最激进的LPDDR数据中心方案。作为高通首款数据中心级推理系统，AI200专为机架级AI推理打造，瞄准大语言模型和多模态模型推理，主打低总体拥有成本。单卡配了768GB LPDDR内存，容量和成本优势都很明显，预计2026年上市。后续的AI250会在2027年推出，在核心架构上升级。

英特尔这边，推出了首款基于Xe3P架构的数据中心GPU，代号“新月岛”。这款产品专门为AI推理和Agent工作负载优化，用了480GB LPDDR5内存，TDP只有350W。放弃HBM后，它可以直接进现有的风冷数据中心，不用液冷改造，这是个很实际的部署优势。

国内的曦望科技，其启望S3是国产芯片的代表。作为国内首款用LPDDR6显存的GPGPU，官方称推理性价比能提升10倍以上，单位token成本降了90%。

端侧AI

端侧AI是LPDDR最成熟的阵地。韩国半导体企业DEEPX近期宣布，其产品将导入LPDDR-PIM存内计算方案。PIM把数据处理单元直接集成到DRAM里，能减少数据在处理器和内存间来回搬移，提升能效。DeepX计划把80TOPS算力的2nm端侧芯片DX-M2和三星的LPDDR5X-PIM搭配。后续的DX-M3还会配合JEDEC标准化的LPDDR6-PIM。

上游供应商江波龙也推出了两款端侧AI推理专用LPDDR方案：AIDIMM（插槽式）和AILPBGA（焊接式）。AIDIMM用了4颗LPDDR5x同面布局，最高128GB容量、256bit位宽、307.2GB/s单通道带宽。AILPBGA则采用自研技术，单颗原生256bit位宽，带宽307GB/s，容量覆盖24GB到64GB，封装尺寸22×22mm，兼容LPDDR标准接口。

桌面与AI PC

除了专用推理芯片，LPDDR还在通过“统一内存架构”重新定义AI PC的性能边界。AMD Strix Halo（Ryzen AI MAX系列）用了256-bit LPDDR5X接口，支持最高128GB LPDDR5X-8000内存，带宽256GB/s。苹果M4 Max更激进，512-bit LPDDR5X总线（32×16-bit控制器），用MoP封装实现546GB/s带宽，成了本地跑大模型的性能标杆。英伟达也不甘示弱，新推出的RTX Spark超级芯片，面向轻薄本和小型台式机，集成了Blackwell架构RTX GPU和20核Grace CPU，最高128GB LPDDR5X统一内存，AI算力达到1 PFLOP，在低功耗小体积设备上实现了高性能AI计算。

此外，英伟达还发布了“全球最强大的桌面AI超级计算机”DGX Station for Windows。它由GB300 Grace Blackwell Ultra桌面超级芯片驱动，通过NVLink-C2C互连把Blackwell Ultra GPU和72核Grace CPU连起来。配备748GB相干内存，包括496GB LPDDR5X（396GB/s）CPU内存和252GB HBM3e GPU显存，CPU和GPU之间数据交换带宽很高。

为什么是LPDDR？

LPDDR全称是低功耗双倍数据率同步动态随机存取存储器。顾名思义，它的设计核心就是“省电”。它通常直接焊在手机或超薄本主板上，和处理器紧挨着，几乎不可更换。那么，为什么这些厂商不约而同地转向LPDDR？有四个关键原因。

首先，成本更低，供应更充足。HBM是多个DRAM芯片垂直堆叠的3D结构，每层都要通过TSV硅通孔和微凸点互连。堆叠层数一多，良率就直线下降。3D堆叠工艺复杂、良率有限，HBM长期供应紧张。而LPDDR依托成熟的平面DRAM工艺和大规模消费电子产能，单位容量成本远低于HBM，能显著降低AI推理服务器的硬件投入和总拥有成本，特别适合大规模部署。

其次，容量更大，单卡可以加载更大的模型，上下文也能更长。高通AI200的768GB LPDDR是行业最大容量。作为对比，NVIDIA GB300单GPU只有288GB HBM3e，AMD MI450X是432GB HBM4。HBM通过硅中介层和处理器做2.5D封装，必须紧挨着核心排布，限制了单系统总容量上限，PHY固定宽度和接口位置也限制了布局。而LPDDR5X控制器IP生态成熟，获取门槛低，PCB布线及信号训练流程高度标准化。系统扩展很灵活，需要带宽可以多通道并行，需要容量也可以加，无非是多增加引脚数。

另外，功耗更低。以英特尔新月岛为例，用LPDDR而不是HBM，功耗降到350W，意味着可以在现有风冷数据中心直接运行，不需要液冷改造。这省去了数据中心液冷改造的投入，降低了投资成本和建设周期。

最后，推理对存储带宽的要求比训练低。训练场景中，大量数据的反向传播需要极高内存带宽，HBM不可替代。但推理场景中，模型参数是固定的，重点是大容量存储和高效检索；LPDDR的容量和成本优势远超带宽方面的缺点。今年GTC大会上，黄仁勋说AI推理市场拐点已到，AI从训练阶段全面进入推理与执行阶段，推理算力需求指数级爆发。相比传统训练芯片，推理芯片更强调功耗控制、成本效率和部署灵活性，LPDDR显然更合适。

芯片巨头同时转向LPDDR不是巧合，是行业调整。有机构预测，到2030年，推理工作负载数量将是训练工作负载的100倍。数据中心AI芯片采用LPDDR，是个明确的推理导向设计选择。在HBM供应紧张、价格昂贵的背景下，高通、Intel等厂商通过LPDDR实现了“单卡大容量、低TCO、风冷部署”的差异化路线，特别适用于LLM推理、视频分析、推荐系统等带宽需求相对可控、容量需求极高的场景。当然，LPDDR方案也有代价：相比HBM，它的内存带宽较低、接口更窄导致延迟较高，而且在24小时高温服务器环境中的可靠性还有待验证。

LPDDR需求暴涨

厂商集体转向的直接后果，是LPDDR需求几何级增长。以高通AI200为例，单个机架可能包含数十张加速卡，每张768GB内存，总内存容量达数十TB。这相当于数十万甚至数百万智能手机的内存使用量。当高通、英特尔、英伟达以及其他潜在竞争者（如AMD和博通）在2026-2027年大规模生产LPDDR方案时，需求将指数级增长。

有分析师指出，英伟达Vera Rubin AI服务器所需的LPDDR使用量，将从2026年的31.44亿GB攀升至2027年的60.41亿GB，占2027年全球LPDDR总供应能力的36%。这一数字将首次超过苹果（29.66亿GB）和三星（27.24亿GB）的用量总和。

Vera Rubin是英伟达在GTC 2026上宣布全面投产的最新AI平台，由Vera CPU和Rubin GPU构成。Vera CPU搭载88个定制ARMv9.2“Olympus”核心，系统支持高达1.5TB（约1536GB）LPDDR5X内存，采用新一代SOCAMM2封装形态。相比之下，一部旗舰智能手机通常只有12-16GB LPDDR5X内存——单颗Vera CPU的LPDDR配备量，是一部手机的90倍。

AMD也在推升LPDDR需求。其2027年推出的第六代EPYC服务器处理器“Verano”，将首次支持SOCAMM2形态的LPDDR5X内存。

LPDDR的供应逻辑和HBM完全不同。HBM由SK海力士、三星、美光三巨头垄断，产能高度受限；而LPDDR拥有更庞大的消费电子产能基底和更成熟的供应链。当AI巨头集体转向，LPDDR的产能会成为AI基础设施扩张的关键变量。

LPDDR6：从“够用”到“好用”

JEDEC固态技术协会于2026年4月正式预览LPDDR6路线图。其中最引人注目的是：LPDDR6单颗内存芯片容量有望达到512GB。这一规格直接大幅超越当前主流服务器DDR5（单根容量普遍64GB-128GB，单颗Die容量差距更悬殊）。之所以能实现这么夸张的容量突破，主要是因为JEDEC新增了更窄的x6子通道模式，让单个封装能容纳更多内存die，再配合更先进的制程工艺带来单颗die密度提升，最终使单颗芯片就能承载以往整根内存条才能达到的容量。

LPDDR6的性能规格较上一代显著跃升。带宽可达10.6Gbps至14.4Gbps，上一代LPDDR5X最高10.7Gbps，性能提升约1.5倍。SK海力士已成功开发出采用1cnm工艺的16Gb LPDDR6 DRAM，并完成了全球首个相关认证。这款新品的运行速度达到10.7Gbps，数据处理速度较上一代LPDDR5X产品提高33%。

同时，基于LPDDR6的SOCAMM2紧凑型模块标准也在同步开发，用来替代传统又厚又大的DDR5条，为AI服务器提供更高集成度的低功耗内存底座。对普通游戏和创作玩家来说，LPDDR6的进阶不会一蹴而就，但未来三年内，高端游戏本、平板或AIPC都有望获得超大内存。更关键的是，在保持轻薄续航的前提下，端侧运行数百亿参数的大模型甚至大型仿真渲染将成为常态。

采用LPDDR，是个明确的推理导向设计选择。它标志着AI算力竞争从“训练时代的HBM带宽竞赛”转向“推理时代的容量与TCO竞赛”。随着LPDDR6的512GB单颗容量、14.4Gbps速率、SOCAMM2模块化封装和PIM存内计算的成熟，AI服务器将轻松构建TB级内存池。模型权重与KV Cache不再需要在内存与SSD之间“痛苦搬家”，端侧运行数百亿参数大模型、车载实时多模态推理、桌面AI Agent常驻后台——都将成为常态。

来源：https://36kr.com/p/3847177758919175

LPDDR

本站内容用于信息整理与展示，如有侵权或内容问题请及时联系处理。