3月12日,中科曙光(603019.SH)宣布在国产高端原生RDMA(远程直接数据存取)技术领域取得重大突破,正式推出了首款全栈自主研发的400G无损高速网络产品——scaleFabric。该产品基于原生RDMA架构,实现了从底层112G+ SerDes IP、硬件设备到上层管理软件的100%自主可控研发,填补了国内数据中心高速网络技术的空白。其性能足以比肩国际顶尖同类产品,为超大规模计算集群构建了一条具备高带宽、低时延、真无损、超高可靠性的“算力大动脉”。
scaleFabric是国内首款原生无损RDMA高速网络,专为超大规模计算集群设计,从核心关键IP、交换芯片、网卡到交换机、驱动与管理软件均实现了自主研发,构建起从硬件到软件的完整技术体系。
此次发布的scaleFabric 400系列网络产品,其技术规格全面对标英伟达NDR,部分关键指标实现超越。性能方面,scaleFabric 400网卡基于PCIe 5.0接口,单端口带宽达400Gbps,端到端通信时延低至0.9微秒;scaleFabric 400交换机单端口带宽达800Gbps,整机交换容量可达双向64Tbps,交换时延约260纳秒,并支持800G×40或400G×80的端口扩展配置。这一性能组合,能够充分满足万卡级AI训练集群对高带宽、低时延网络的极致需求。
在稳定性与扩展能力上,该产品采用基于信用的无损流控机制,从根源上规避了拥塞丢包风险,链路故障恢复时间小于1毫秒,并已通过支撑近万卡集群持续稳定运行超过10个月的验证。与英伟达NDR相比,其交换机端口密度提升25%,网卡最大QP(队列对)数支持能力提升100%,单子网互联规模是传统IB(无限带宽)网络的2.33倍,可轻松支持最大11.4万卡集群部署,同时网络总成本可降低约30%。
