12月20日消息,摩尔线程正式发布全新华山GPU芯片,其首发采用“花港”新架构。
这款芯片专为AI训练推理一体化及超智能融合设计,同时配套发布了超十万卡级AI工厂技术与新一代高性能张量计算系统。

华山GPU以“花港”架构为核心,聚焦AI训练与推理场景的一体化能力。在系统级支撑技术方面,它配备了超十万卡级AI工厂技术。
新一代Scale-up系统搭载MTLink 4.0及多种以太协议,片间互联速度高达134.5Gb/s,可扩展至1024颗GPU的集群规模,适配多种纵向扩展方案,并支持SHARP技术;

RAS 2.0:新增SRAM奇偶校验与ECC能力,强化错误检测、上报与隔离功能,同时全面提升了可调试能力;
ACE2.0新一代异步通信引擎:通过架构优化实现更高效的通信调度,支撑大规模集群的协同运算。

采用新一代高性能张量计算系统,全精度MMA:支持TF32/FP16等格式;实现了端到端加速的混合低精度计算,满足大语言模型等AI场景的需求。
在性能指标方面,“华山”GPU在浮点算力、访存带宽、访存容量、高速互连带宽等关键性能上已大幅超越英伟达Hopper架构产品。其部分性能甚至可媲美乃至超越英伟达Blackwell架构产品,进一步强化了在AI大模型训练推理场景的技术竞争力。

