国产ScaleX万卡超算集亮相：中科曙光真机实测解析_AI热点日报

国产ScaleX万卡超算集亮相：中科曙光真机实测解析

类型：热点整理2025-12-18

12 月 18 日消息，在江苏昆山举行的光合组织 2025 人工智能创新大会（HAIC2025）上，中科曙光今日发布并展出了大规模智能计算系统 —— scaleX 万卡超集群，这也是国产万卡级 A

12月18日，江苏昆山举办的光合组织2025人工智能创新大会上，中科曙光正式发布并展出了大规模智能计算系统——scaleX万卡超集群。这是国产万卡级AI集群系统首次以真机形式亮相。

国产 scaleX 万卡超集群真机首次亮相，中科曙光打造

据中科曙光高级副总裁李斌介绍，scaleX万卡超集群凝聚了曙光大研大型计算机系统的研发成果，旨在为万亿参数大模型、科学智能等复杂任务场景，构建坚实的大规模智能算力基础设施。面对人工智能基础设施在性能、效率、可靠性与可扩展性方面日益严苛的需求，scaleX万卡超集群在超节点架构、高速互联网络、存储性能优化以及系统管理调度等层面取得了一系列重要突破。其中部分技术与能力已领先于海外同类产品的研发路线，甚至超越其2027年NVL576的规划节点。

scaleX万卡超集群的核心技术优势主要体现在以下方面：

优势一：全球首创单机柜级640卡超节点。scaleX万卡超集群由16个曙光scaleX640超节点通过scaleFabric高速网络互联而成，可部署超过10240块AI加速卡，总算力规模超过5EFlops。作为全球首个单机柜级640卡超节点，scaleX640创新应用了超高密度刀片、浸没相变液冷等前沿技术，将单机柜算力密度大幅提升20倍，同时其PUE值低至1.04。

优势二：自主研发原生RDMA高速网络。曙光scaleFabric网络基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片，实现了400Gb/s的超高带宽与低于1微秒的端侧通信延迟。这使得超节点间的通信性能达到业内领先水平，能充分释放万卡超集群的澎湃算力。该架构还能轻松将超集群规模扩展至十万卡以上，相比传统IB网络，性能提升2.33倍，同时整体网络成本降低30%。

优势三：存、算、传紧耦合深度优化。通过“超级隧道”与AI数据加速等创新设计，实现了从芯片级、系统级到应用级的三级数据传输协同优化。这不仅使存力平台能够从容应对大模型训练时万卡并发读写带来的极致带宽挑战，还能显著提升高吞吐AI推理场景的响应速度与结果精度，并可AI加速卡资源利用率提升55%。

优势四：超集群数字孪生与智能调度。通过物理集群的数字孪生，实现了故障定位、修复等全流程可视化智能管理；智能化的运维平台可支撑集群长期可用性高达99.99%；智能调度引擎则能高效管理数万个节点与数十万级服务用户，支持每秒万级作业调度。

scaleX万卡超集群具备出色的兼容性，支持多品牌加速卡及主流计算生态。系统已完成400多个主流大模型与世界级模型的适配优化。在实际应用中，该超集群可广泛应用于大模型训练、金融风控、地质能源勘探及科学智能等多个前沿领域。

来源：https://www.ithome.com/0/906/070.htm

万卡超集群 AI 集群中科曙光

延伸阅读

补充最近整理过的热点入口。

国产ScaleX万卡超算集亮相：中科曙光真机实测解析

相关热点

延伸阅读