随着人工智能技术从模型训练大规模转向实际应用部署,AI算力的需求重心正发生深刻变化。一个关键的行业转折点已经到来:单纯追求算力峰值不再是唯一焦点,内存带宽与延迟正成为制约性能提升的新瓶颈。如何构建高带宽、低延迟、高能效的内存子系统,已成为全球AI芯片行业必须攻克的核心挑战。近期,国内科技企业在这一前沿领域取得了突破性进展,通过架构创新交出了一份令人瞩目的答卷。
新紫光集团正式发布了其创新的“紫弦”三维化近存计算架构。该方案的核心技术路线,是围绕先进的3D DRAM技术进行构建,并全球首创了“3.5D异质异构集成”方案。其最引人瞩目的性能参数,是实现了高达30TB/s的极致存储带宽。
这一带宽数据究竟意味着什么?我们可以通过行业对比来理解。目前,AMD和NVIDIA高端AI芯片普遍采用的HBM3e高带宽内存,单颗带宽约为1.2TB/s。即便是英伟达最新发布的旗舰级B200 GPU,其聚合内存带宽也“仅为”8TB/s。紫弦架构实现的30TB/s带宽,实现了数量级上的跨越,在带宽性能上建立了显著优势。
除了极高的带宽,超低延迟是该架构的另一大技术优势。在其PNM(近存计算)工作模式下,通过将计算单元尽可能靠近存储单元,最大可将访存延迟降低18倍。这意味着数据无需在芯片内部进行“长途跋涉”,计算核心能够以极快的速度获取所需数据,从而大幅提升整体计算效率和能效比。
那么,其实际性能表现如何?根据官方发布的模拟仿真测试数据,在相同算力条件下,紫弦架构处理AI推理任务时的Token吞吐率,相比NVIDIA B200系列GPU,可提升1.5倍至2倍以上。这不仅是理论参数的领先,更是架构创新带来实际效能飞跃的有力证明。
当然,任何前沿技术都面临一个核心问题:能否实现产业化落地?对此,新紫光集团给出了明确而肯定的答复。他们强调,此项技术并非停留在实验室阶段的“盆景”,而是已经具备了规模化量产的技术基础与产业条件。更为关键的是,其完整的技术路径并不依赖国外供应链,而是基于国内成熟且领先的半导体产业链构建而成。这在当前全球技术竞争与供应链重构的背景下,具有重要的战略自主意义。

尽管具体的产品量产与上市时间表尚未最终公布,但这项突破性技术的亮相,已然向业界传递出一个清晰的信号:在先进制程发展可能面临挑战的背景下,通过极致的系统架构设计与集成技术创新,完全有可能开辟出一条差异化的、高性能的AI算力发展新路径。未来的芯片竞争,或许将不止聚焦于晶体管微缩,更在于系统级的设计智慧与内存架构的突破性创新。
