国产内存架构突破30TB带宽 AI推理内存墙难题获新解

时间：2026-05-11 16:07

新紫光集团发布“紫弦”三维化近存计算架构，以3DDRAM和3 5D异质异构集成实现30TB s的超高存储带宽，远超当前HBM3e方案。该架构同时将访存延迟最大降低18倍，在同等算力下Token吞吐率较NVIDIAB200系列提升1 5至2倍以上。技术基于国内供应链，具备规模化量产能力，展示了在先

随着人工智能应用从大规模模型训练转向实际推理部署，计算系统的性能瓶颈正发生深刻变化。行业共识指出，单纯依赖算力提升已难以满足复杂AI模型对实时响应与高效处理的需求，由内存带宽与访问延迟共同构成的“内存墙”已成为制约AI整体效能的关键挑战。在此背景下，国内企业在核心存储架构上的自主创新与突破，为破解这一全球性技术难题提供了切实可行的新路径。

国产内存新架构实现30TB/s带宽突破，AI推理内存墙难题迎来新解法

近日，新紫光集团正式发布了名为“紫弦”的三维化近存计算架构。该架构的核心技术基石在于以3D DRAM为基础，并创新性地采用了先进的3.5D异质异构集成方案。根据官方披露的关键数据，其存储带宽实现了30TB/s的惊人突破。这一性能指标具有怎样的行业意义？与当前主流的高带宽内存方案对比，AMD与NVIDIA采用的HBM3e显存，其单颗带宽约为1.2TB/s，即便是NVIDIA最新的B200旗舰计算卡，其总内存带宽也仅为8TB/s。“紫弦”架构在带宽性能上实现了数量级的领先与超越。

性能优势不止于带宽

除了带宽的跨越式提升，该架构在至关重要的访存延迟控制方面同样表现卓越。在其PNM近存计算模式下，内存访问延迟最大可降低18倍。更为直观的性能对比来自于模拟仿真结果：在相同算力配置条件下，该架构处理AI任务的Token吞吐率，较NVIDIA B200系列高出1.5至2倍以上。这组数据有力地证明，通过存储单元与计算单元的深度协同与架构级重构，能够从根本上显著提升AI推理任务的整体执行效率与吞吐能力。

技术落地与供应链意义

此次技术发布并非停留在实验室阶段的预研概念。新紫光方面特别强调，该技术已具备可规模化量产的工程能力。更具战略意义的是，其完整技术路线基于国内领先的半导体供应链体系构建，实现了对国外特定核心技术依赖的重要突破。这标志着，在先进制程发展可能面临外部约束的背景下，中国人工智能与高性能计算产业完全有机会通过系统架构创新、先进封装集成等非传统路径，走出一条自主可控的差异化发展道路。

尽管该技术的具体量产与商用时间表尚未最终公布，但其揭示的技术方向具有清晰的行业引领性。它成功验证了通过近存计算、异构集成等前沿架构创新来系统性优化内存子系统性能的可行性，为下一代AI芯片与高性能计算系统设计提供了关键的技术参考。对于正普遍面临内存带宽瓶颈的AI推理服务器、边缘计算设备及大模型部署等领域而言，此类具备超高带宽与超低延迟特性的内存解决方案，有望在未来成为大幅提升系统能效比与性价比的核心组件。

来源：驱动之家