首页 游戏 软件 资讯 排行榜 专题
首页
AI
国内最大AI算力池部署超三万卡,支撑上千应用

国内最大AI算力池部署超三万卡,支撑上千应用

热心网友
20
转载
2026-02-09

允中 发自 凹非寺
量子位 | 公众号 QbitAI

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

国内智算基础设施建设,正迈过一个关键的分水岭。

2月5日,由中科曙光提供的3套scaleX万卡超集群,在国家超算互联网核心节点同时上线试运行。

由此,全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池正式形成。



过去,万卡集群更像是头部玩家的实力勋章。如今,当万卡规模的算力开始实现“多套并行、同时落地、即刻应用”,国产超集群便跨过了单点突破的阶段,正式步入规模化落地的工程成熟期。

从产业角度,这释放了三层明确信号:

第一,国产万卡超集群开始进入规模化落地阶段;第二,系统创新正在取代“单点算力参数”,成为竞争主战场;第三,万卡超集群已实现从“做出来”向“让真实业务跑起来”的跨越。

能落地、稳得住,才是万卡时代的“入场券”

万卡超集群的难点,早已从单纯的“做出一套系统”,转向了能否实现规模化复制和落地。

规模化落地,说到底就是系统工程能力的集中较量。

周期可控、性能可复现、故障可定位、成本可核算——这些硬核能力,才是长期玩家真正的入场券。

万卡超集群的竞争,正在从“总卡数、总算力”转向“系统级协同”:即网络、存储、散热、供配电、调度与运维的联动优化,才是把大规模算力变成稳定产能的关键。

以scaleX万卡超集群为例,其scaleFabric网络不仅能实现万卡超集群400Gb/s超高带宽、低于1微秒端侧通信延迟,更具备未来面向十万卡、百万卡演进的扩展能力。

同时,通过高密度设计、低PUE导向的工程方案,以及智能调度等系统能力,让集群不止于“建得起来”,更能“稳得住、用得好”。

到了规模化落地阶段,系统级创新就不是虚词了,效率高不高、稳不稳、好不好维护、TCO(总成本)划不划算,才是见真章的地方。

说到底,这些实打实的指标,才是撑起万卡超集群大规模复制的“压舱石”。

万卡超集群真正的胜负手:规模化应用

搞定万卡的稳定供应,充其量只是拿到了“及格分”。

真正的终极考题在于:这些卡能不能实实在在地转化成真实业务的生产力?

过去行业里有个怪现象,不少万卡项目更像是“样板工程”,停留在展示和跑分上,一旦拉到真实业务里去“练兵”,就显得底气不足,那是因为缺少持续业务负载的实际检验。

规模化应用背后,至少包含三层要素。

1、开放兼容,决定万卡超集群应用门槛与广度

一个封闭生态的万卡超集群,即便性能很强,也会在迁移成本上劝退大量用户。

相反,开放兼容意味着更低的适配门槛、更快的上手速度、更可控的改造成本。

曙光scaleX超集群基于AI计算开放架构,可全面兼容CUDA等主流软件生态,支持多品牌国产加速卡混合部署,加速国产AI生态繁荣。

2、万卡超集群不应是“大公司专属”,公共基础设施属性正在形成

过去,万卡超集群过去给很多人的直观印象是:只有极少数巨头公司用得起、用得好。

但在万卡超集群进驻国家级算力网络的核心节点后,它就从单纯的技术设施,真正转变为一种公共基础设施,成为制造、能源、交通、科研、教育、医疗、金融等领域千行百业的算力“水电煤”。

3、用真实业务把万卡超集群变成各行各业生产力

万卡超集群能不能行,跑通几个模型和应用只是“及格线”,能不能扛住千行百业实打实的业务负载,才是真正的“分水岭”。

以scaleX万卡超集群为例,其已完成400余个主流大模型与世界模型的适配与优化,并依托国家超算互联网实现上千款应用对接运行,链接更多AI产业生态伙伴,推动形成“算力+应用”协同的一体化落地模式。



在实战应用中,scaleX万卡超集群的价值,在三个维度得到了充分释放:

第一,在大模型训练场景下,主打“稳”字。

它能稳稳托住万亿参数模型的整机训练,并提供容错与快速恢复能力,保障超长周期训练稳定连续。

第二,在高通量推理场景下,强调“实”字。

通过软硬协同与端到端联合优化,将推理能力沉淀为可长期承载核心业务的服务化能力,目前已服务于多家头部互联网用户的核心智能化业务。

第三,在AI for Science场景下,突出“快”字。

将算力直接变现为科研效率。无论是支撑材料研发大模型刷新全球评测记录,还是将蛋白质研究效率提升数百万倍(3-6个数量级),它都在加速科学发现的进程。

3套scaleX万卡超集群上线背后,释放了一个信号——

单纯堆垒算力规模已不再是核心胜负手。

未来的赢家,必须要能让万卡集群在业务一线持续“出力”,并能把这种复杂的工程能力大规模地铺向全行业。

来源:https://www.163.com/dy/article/KL3RCGT10511DSSR.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Agent时代高效智能的Token工厂:中关村论坛圆桌热议
科技数码
Agent时代高效智能的Token工厂:中关村论坛圆桌热议

3月27日,在2026中关村论坛年会“AI开源前沿论坛”上,智谱华章CEO张鹏、月之暗面CEO杨植麟(担任主持)、无问芯穹联合创始人兼CEO夏立雪,小米MiMo大模型负责人罗福莉,香港大学助理

热心网友
03.28
Token需求暴增,升级AI基础设施如何应对?
科技数码
Token需求暴增,升级AI基础设施如何应对?

来源:科技日报科技日报记者 崔爽以OpenClaw为代表的智能体框架爆火,打破大众对大模型“对话机器人”的固有认知,随之而来的是行业对Token(词元)需求的指数级爆发,AI发展正快速迈入以推理为核

热心网友
03.28
人形机器人训练揭秘:中国团队如何炼就超逼真“中国秀”
科技数码
人形机器人训练揭秘:中国团队如何炼就超逼真“中国秀”

  在山东省青岛市人形机器人数据采集训练场里,28台人形机器人正在数据采集员的操控下完成物流分拣、零部件分拣、厨房操作、商超理货等数据采集任务。  上万次重复和试错生成的海量真机数据,赋予机器人更聪

热心网友
03.27
Agent需求引爆Token市场10倍增长,中国如何打造全球Token工厂?
AI
Agent需求引爆Token市场10倍增长,中国如何打造全球Token工厂?

智东西作者 ZeR0编辑 漠影智东西3月27日报道,今日,在中关村论坛人工智能主题日AI开源前沿论坛“OpenClaw与AI开源”圆桌上,无问芯穹联合创始人兼CEO夏立雪谈道,OpenClaw引爆了

热心网友
03.27
智能体引爆交互新范式:从问答到智能知己,上车正当时
科技数码
智能体引爆交互新范式:从问答到智能知己,上车正当时

OpenClaw“小龙虾”的发展速度快得离谱,上半个月大家还在讨论如何在电脑上“装小龙虾”,下半个月“小龙虾”就已经往车上装了。日前,智己汽车发布了基于阿里千问大模型打造的IM Ultra Agen

热心网友
03.26

最新APP

凡人传说
凡人传说
角色扮演 03-30
恶魔秘境
恶魔秘境
角色扮演 03-29
猫和老鼠华为
猫和老鼠华为
休闲益智 03-29
暗黑之地
暗黑之地
角色扮演 03-28
你比我猜
你比我猜
休闲益智 03-26

热门推荐

vivo Pad6 Pro发布:首款4K原彩屏配骁龙8,售4499元起
网络安全
vivo Pad6 Pro发布:首款4K原彩屏配骁龙8,售4499元起

3月30日消息,今晚除了手机之外,vivo还发布了全新的旗舰平板——vivo Pad6 Pro。行业首发13 2英寸4K原彩屏,分辨率3840×2160,347PPI,支持1-144Hz LTPS自

热心网友
03.30
WPS表格提取括号内容:3步掌握MID函数实战用法
电脑教程
WPS表格提取括号内容:3步掌握MID函数实战用法

WPS表格中提取括号内容有四种方法:一、单对英文小括号用FIND+MID;二、中英文括号通用需SUBSTITUTE预处理;三、多对括号取最后一对需REVERSESTRING反向查找

热心网友
03.30
聚焦AI文创与跨境,“数智苏豪”新街口OPC社区启幕
科技数码
聚焦AI文创与跨境,“数智苏豪”新街口OPC社区启幕

3月30日,南京新街口核心商圈,苏豪大厦一楼广场上机器人迎宾起舞,充满科技感。由苏豪资产运营集团与南京新街口金融商务区管理委员会(以下简称“新街口管委会”)共同打造的“数智苏豪”新街口OPC社区揭牌

热心网友
03.30
1.9亿年薪背后:又一位车企CEO薪酬为何大幅上涨?
科技数码
1.9亿年薪背后:又一位车企CEO薪酬为何大幅上涨?

电 动 知 家消 息,近日,据外媒报道,据福特汽车日前发布的一份文件,该公司首席执行 官吉姆·法利2025年的总薪酬大幅增长了11%,达到约2752万美元(约1 9亿元人民币),这是其自2020年末

热心网友
03.30
美议员为何急于拉黑中国机器人却暗留后门?
科技数码
美议员为何急于拉黑中国机器人却暗留后门?

白宫里,一台人形机器人缓步走入东厅,与美国“第一夫人”并肩亮相,动作仍带着明显的机械感;仅仅一天后,国会山上,这种“会走路的机器”却被划为潜在安全威胁,写进立法提案。这是上周美国上演的荒诞一幕。两党

热心网友
03.30