2月5日,中科曙光提供的三套万卡超集群在国家超算互联网郑州核心节点同步上线试运行,标志着全国首个实现三万卡部署并已投入实际运营的、规模最大的国产AI算力池正式投入使用。
这一举措意味着我国在人工智能算力基础设施建设上迈出了坚实一步,该算力池能够全面赋能万亿参数模型训练、高通量推理以及AI for Science等大规模AI计算场景,为前沿科研与产业智能化转型提供了强大支撑。

从概念到实用化的跨越
人工智能大模型正朝着万亿级参数、多模态乃至世界模型的路径高速演进,对底层算力设施提出了前所未有的挑战。去年12月,曙光scaleX万卡超集群在HAIC大会首度以真机亮相,短短不足两个月后,便以超过三万卡的AI算力规模正式落地。这也标志着国产万卡集群已迈入规模化部署与实战应用的新阶段。
这背后是复杂的系统工程实践。中科曙光凭借系统性创新,攻克了高速互联网络、存算传紧耦合设计、高密供电与散热、统一资源高效调度等一系列关键技术难题。
从自主自强到普惠开放
随着AI产业的蓬勃发展,全球智能算力需求呈现爆发式增长。算力基础设施需要具备生态兼容、弹性扩展等特性,从而高效支撑多元应用场景,大幅降低产业使用门槛。
曙光scaleX万卡超集群基于开放式AI计算架构,能够全面兼容主流软件生态,支持多品牌国产加速卡混合部署,显著降低开发者迁移适配成本。同时,它更具向十万卡、百万卡规模灵活扩展的能力,更好地契合了产业规模化发展的现实需求。
依托这些优势,scaleX万卡超集群成为国家超算互联网郑州节点的核心AI算力支撑,并依托国家超算互联网实现一体化算力调度,从而为全球用户提供通用、易用、高效、普惠的中国AI算力服务。
从算力基石到创新沃土
培育繁荣的AI产业,需要构建协同共生的创新生态。scaleX万卡超集群已完成400多个主流大模型、世界级模型的适配与优化。依托国家超算互联网,更可接入上千款成熟应用,链接更广泛的AI产业生态伙伴,实现“算力+应用”的一体化交付。
在实际应用中,scaleX万卡超集群持续为多场景提供深度赋能:针对超大规模模型训练,支持万亿参数模型的整机训练与容错恢复;面向高吞吐推理场景,已服务于多家头部互联网用户的核心智能化业务,并通过联合深度优化持续提升推理效能;在AI for Science领域,支撑国内某材料研发大模型登顶国际权威榜单,助力国内顶级科研团队将蛋白质研究效率提升3-6个数量级;同时搭配OneScience科学大模型一站式开发平台,大幅降低多学科交叉研究的创新门槛。
“智能化的浪潮正以前所未有的力量重塑世界。”中科曙光高级副总裁李斌表示,“我们将以郑州核心节点上线为新的起点,持续深化技术研发与应用实践,推动国产智能算力更高效、更稳定、更普惠地服务于经济社会发展的各个领域。”
