国产ScaleX万卡超算集亮相:中科曙光真机实测解析
12月18日,江苏昆山举办的光合组织2025人工智能创新大会上,中科曙光正式发布并展出了大规模智能计算系统——scaleX万卡超集群。这是国产万卡级AI集群系统首次以真机形式亮相。

据中科曙光高级副总裁李斌介绍,scaleX万卡超集群凝聚了曙光大研大型计算机系统的研发成果,旨在为万亿参数大模型、科学智能等复杂任务场景,构建坚实的大规模智能算力基础设施。面对人工智能基础设施在性能、效率、可靠性与可扩展性方面日益严苛的需求,scaleX万卡超集群在超节点架构、高速互联网络、存储性能优化以及系统管理调度等层面取得了一系列重要突破。其中部分技术与能力已领先于海外同类产品的研发路线,甚至超越其2027年NVL576的规划节点。
scaleX万卡超集群的核心技术优势主要体现在以下方面:
优势一:全球首创单机柜级640卡超节点。scaleX万卡超集群由16个曙光scaleX640超节点通过scaleFabric高速网络互联而成,可部署超过10240块AI加速卡,总算力规模超过5EFlops。作为全球首个单机柜级640卡超节点,scaleX640创新应用了超高密度刀片、浸没相变液冷等前沿技术,将单机柜算力密度大幅提升20倍,同时其PUE值低至1.04。
优势二:自主研发原生RDMA高速网络。曙光scaleFabric网络基于国内首款400G类InfiniBand的原生RDMA网卡与交换芯片,实现了400Gb/s的超高带宽与低于1微秒的端侧通信延迟。这使得超节点间的通信性能达到业内领先水平,能充分释放万卡超集群的澎湃算力。该架构还能轻松将超集群规模扩展至十万卡以上,相比传统IB网络,性能提升2.33倍,同时整体网络成本降低30%。
优势三:存、算、传紧耦合深度优化。通过“超级隧道”与AI数据加速等创新设计,实现了从芯片级、系统级到应用级的三级数据传输协同优化。这不仅使存力平台能够从容应对大模型训练时万卡并发读写带来的极致带宽挑战,还能显著提升高吞吐AI推理场景的响应速度与结果精度,并可AI加速卡资源利用率提升55%。
优势四:超集群数字孪生与智能调度。通过物理集群的数字孪生,实现了故障定位、修复等全流程可视化智能管理;智能化的运维平台可支撑集群长期可用性高达99.99%;智能调度引擎则能高效管理数万个节点与数十万级服务用户,支持每秒万级作业调度。
scaleX万卡超集群具备出色的兼容性,支持多品牌加速卡及主流计算生态。系统已完成400多个主流大模型与世界级模型的适配优化。在实际应用中,该超集群可广泛应用于大模型训练、金融风控、地质能源勘探及科学智能等多个前沿领域。
相关攻略
2月5日,由中科曙光提供的3套万卡超集群系统在国家超算互联网郑州核心节点同时上线试运行,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池 2月5日,由中科曙光提供的3套万卡超集群系统在
经济观察报记者 郑晨烨12月20日,北京中关村国际创新中心,摩尔线程(688795 SH)举办了首届MUSA开发者大会,在现场,这家刚登陆A股市场的国产GPU公司,发布了其最新的全功能GPU架构“花
人民财讯12月18日电,12月18日,在昆山举行的光合组织2025人工智能创新大会(HAIC2025)上,中科曙光发布并展出了大规模智能计算系统——scaleX万卡超集群,这也是国产万卡级AI集群系
12月18日,在昆山举行的光合组织2025人工智能创新大会(HAIC2025)上,中科曙光发布并展出了全球领先的大规模智能计算系统——scaleX万卡超集群,这也是国产万卡级AI集群系统首次以真机形
scaleX万卡超集群,是曙光发挥大型计算机系统研制经验优势,面向万亿参数大模型、科学智能等复杂任务场景打造的大规模智能算力基础设施方案 2025年12月18日,在昆山举行的光合组织2025人工智能
热门专题
热门推荐
在流量日益分散的今天,把鸡蛋放在同一个篮子里,风险不言而喻。多平台推广,早已不是“要不要做”的选择题,而是“如何做好”的生存题。它的核心价值,可以概括为两点:实现“流量风险对冲”,以及构建“品牌触点全覆盖”。通过在不同生态位——无论是搜索、短视频、图文还是电商——建立内容矩阵,企业不仅能有效缓冲单一
DeepSeek知识库的核心,是运用RAG(检索增强生成)技术,将DeepSeek强大的大语言模型推理能力,与您的私有文档资源——包括PDF文件、内部代码库、标准操作流程(SOP)等——深度融合。其最终目标是实现基于特定垂直领域数据的精准智能问答,让AI的回答不再是通用泛化,而是具备专业依据、内容详
三大运营商推出Token套餐,将大模型调用量包装为类似流量包的产品,以降低AI使用门槛。中国电信推出个人与企业多档套餐,最低月费9 9元;上海移动推出1元购40万Tokens服务;联通则提供个人与团队版套餐。运营商凭借用户渠道和支付优势,推动算力消费向大众市场普及,可能重塑AI服务消费模式。
HermesAgent本地运行缓慢常因未量化的大语言模型占用资源过多。可通过AWQ量化模型、llama cpp后端加载GGUF模型、配置vLLM引擎提升并发吞吐、禁用非必要工具降低上下文开销,以及调整SQLite记忆检索阈值等方案优化。这些方法能显著降低延迟,提升响应速度。
随着AI智能体能力的持续增强,确保其行为始终符合预设目标与安全边界,已成为行业亟待解决的核心挑战。然而,当前主流的治理方案在防止智能体“失控”或“脱轨”方面,仍面临显著的实践瓶颈。 在之前的探讨中,我们分析了主流治理思路:部署多样化的对抗性验证器,构建一个多层次的安全审查网络。该方案的核心逻辑并非限





