随着人工智能应用从大规模模型训练转向实际推理部署,计算系统的性能瓶颈正发生深刻变化。行业共识指出,单纯依赖算力提升已难以满足复杂AI模型对实时响应与高效处理的需求,由内存带宽与访问延迟共同构成的“内存墙”已成为制约AI整体效能的关键挑战。在此背景下,国内企业在核心存储架构上的自主创新与突破,为破解这一全球性技术难题提供了切实可行的新路径。

近日,新紫光集团正式发布了名为“紫弦”的三维化近存计算架构。该架构的核心技术基石在于以3D DRAM为基础,并创新性地采用了先进的3.5D异质异构集成方案。根据官方披露的关键数据,其存储带宽实现了30TB/s的惊人突破。这一性能指标具有怎样的行业意义?与当前主流的高带宽内存方案对比,AMD与NVIDIA采用的HBM3e显存,其单颗带宽约为1.2TB/s,即便是NVIDIA最新的B200旗舰计算卡,其总内存带宽也仅为8TB/s。“紫弦”架构在带宽性能上实现了数量级的领先与超越。
性能优势不止于带宽
除了带宽的跨越式提升,该架构在至关重要的访存延迟控制方面同样表现卓越。在其PNM近存计算模式下,内存访问延迟最大可降低18倍。更为直观的性能对比来自于模拟仿真结果:在相同算力配置条件下,该架构处理AI任务的Token吞吐率,较NVIDIA B200系列高出1.5至2倍以上。这组数据有力地证明,通过存储单元与计算单元的深度协同与架构级重构,能够从根本上显著提升AI推理任务的整体执行效率与吞吐能力。
技术落地与供应链意义
此次技术发布并非停留在实验室阶段的预研概念。新紫光方面特别强调,该技术已具备可规模化量产的工程能力。更具战略意义的是,其完整技术路线基于国内领先的半导体供应链体系构建,实现了对国外特定核心技术依赖的重要突破。这标志着,在先进制程发展可能面临外部约束的背景下,中国人工智能与高性能计算产业完全有机会通过系统架构创新、先进封装集成等非传统路径,走出一条自主可控的差异化发展道路。
尽管该技术的具体量产与商用时间表尚未最终公布,但其揭示的技术方向具有清晰的行业引领性。它成功验证了通过近存计算、异构集成等前沿架构创新来系统性优化内存子系统性能的可行性,为下一代AI芯片与高性能计算系统设计提供了关键的技术参考。对于正普遍面临内存带宽瓶颈的AI推理服务器、边缘计算设备及大模型部署等领域而言,此类具备超高带宽与超低延迟特性的内存解决方案,有望在未来成为大幅提升系统能效比与性价比的核心组件。
