游乐游手机版
首页/科技数码/文章详情

中科曙光40卡超算节点发布,智能算力爆发机遇到来

时间:2026-03-26 21:01
国产超节点产品的“堆卡”规模经历一番急遽膨胀后,又在针对市场需求变化做减法。3月26日,中科曙光(603019 SH)在2026中关村论坛期间发布一款搭载40张GPU的中小规模超节点产品,以应对持续

国产超节点产品的“堆卡”规模经历一番急遽膨胀后,又在针对市场需求变化做减法。

3月26日,中科曙光(603019.SH)在2026中关村论坛期间发布一款搭载40张GPU的中小规模超节点产品,以应对持续增长的模型推理需求,尤其是智能体火爆带来的Token(词元)经济机遇。

中科曙光高级副总裁李斌接受南都等采访时表示,市面上动辄数百卡互连的超节点,主要适用于顶级AI模型的预训练场景,但对于AI推理场景“太过高配”,采购部署成本高,“已经远远超过了性能收益的甜点区”。与此同时,随着模型参数量的增大,传统用于模型推理服务的8卡GPU服务器又显得“过于落伍”,由此留下了市场空白。

所谓超节点,是通过高速互连技术,将数十、数百乃至数千张AI芯片堆叠耦合,构成一个超级计算节点,弥补单颗国产芯片性能的短板,已被视为AI基础设施的基本单元。自华为于2025年4月推出搭载384颗昇腾910C芯片的CloudMatrix 384超节点以来,超节点迅速成为行业焦点,浪潮信息、阿里云、百度云、中科曙光等芯片和服务器厂商相继跟进。其中,中科曙光在2025年11月发布的scaleX640超节点,支持单机柜640张卡互连。

曙光信息产业(北京)有限公司副总裁李柳介绍,超大规模模型训练需要千卡甚至万卡级别的超节点,但人工智能在各行业的商业化落地,更需要普惠属性、更具性价比的超节点方案——这考验产品的性能规模、能效散热、可维护性等方面的均衡设计。

超节点规模存在性能收益边际递减。李柳说,基于客户调研,公司发现40卡的超节点正处于性能与成本平衡的“甜点区”,可以覆盖大多数人工智能计算的场景。


中科曙光scaleX40超节点产品。图:杨柳

最新提供的关键参数显示,中科曙光新发布的这款scaleX40超节点集成40张GPU,FP8(8位浮点数)精度下的总算力超过28PFLOPS,HBM显存容量超过5TB,访存带宽超过80TB/s。

李柳告诉记者,scaleX40超节点的整体部署成本,与传统的5台8卡GPU服务器基本持平,但其训练性能最大提高120%,推理性能最大提升330%,这得益于包括计算、网络、存储、调度软件在内的整体性调优。

与业内超节点方案普遍依赖大规模线缆连接不同,scaleX40超节点的计算节点和用于片间互连的交换节点之间,采用无线缆架构,实现直接对插。在业内,英伟达NVL72超节点采用铜缆方案,而华为CloudMatrix 384超节点则使用光纤连接。中科曙光称,与铜缆方案相比,无线缆架构能提高超节点的可用性;相比光纤连接,无线缆连接能降低40%至70%的功耗。据李柳介绍,光纤连接会带来散热增加的难题,可能导致系统运行不稳定,增加了故障率。

为了降低安装和部署的门槛,scaleX40采用19英寸标准箱式设计,适配主流机柜,无需额外改造机房。李斌提到,目前市场上的超节点多为定制化的机柜,其对机房的供电、环境条件等有严苛要求,使用、调试与运维的门槛也非常高。

scaleX40超节点瞄准企业级AI基础设施的需求,比如大模型的微调,在金融、制造、政务等行业的私有化部署中用于企业级推理等。李柳对此表示,科研、教育、网络安全、政府部门、行业组织等垂直领域,由于数据普遍较为敏感,但数据量又有限,客户更倾向于大模型的私域部署。

采写:南都N视频记者 杨柳 发自北京

来源:https://www.163.com/dy/article/KOVJR6F005129QAF.html
上一篇美团外卖全年业绩战报:出海与AI双线驱动 下一篇专访姚洋:AI泡沫必然破裂,短期风险更需警惕
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
加油站卖车 全国首座能源汽车综合服务站落地
科技数码 · 2026-06-04

加油站卖车 全国首座能源汽车综合服务站落地

广汽集团与中国石化在广东湛江遂溪建成全国首座“能源+汽车”综合服务站,推出加油站+汽车销售+维保一体化新模式,填补县域市场跨界空白,构建看车、购车、养车、加油一站式用车服务生态圈。

谷歌被曝研发至少8款Googlebook安卓本 今秋发布
科技数码 · 2026-06-04

谷歌被曝研发至少8款Googlebook安卓本 今秋发布

谷歌正在研发至少8款Googlebook安卓笔记本,计划今年秋季发布。其中4款搭载英特尔PantherLake芯片,3款采用高通骁龙X系列,1款配备联发科迅鲲Ultra芯片并支持可拆卸键盘设计。

巴菲特重仓谷歌而非英伟达的投资逻辑
科技数码 · 2026-06-04

巴菲特重仓谷歌而非英伟达的投资逻辑

伯克希尔·哈撒韦重仓谷歌而非英伟达,因其看好AI基础设施的长期价值。谷歌拥有搜索现金流、云服务和数据中心,商业模式可预测。伯克希尔认为投资“卖铲子的人”更具确定性,而非高风险的AI模型公司。

2026年WWDC最值得关注的升级与实操避坑指南
科技数码 · 2026-06-04

2026年WWDC最值得关注的升级与实操避坑指南

2026年苹果全球开发者大会预计将聚焦于人工智能与操作系统的深度融合。iOS18、iPadOS18等系统或将迎来AI原生体验的全面升级,包括更智能的Siri、系统级AI助手以及开发工具的革新。对于开发者和用户而言,了解新特性适配、隐私数据准备以及测试流程是顺利过渡的关键。

iPhone语音备忘录内置AI转写功能iOS 18起无
科技数码 · 2026-06-04

iPhone语音备忘录内置AI转写功能iOS 18起无

你是否也遇到过这样的场景——会议刚结束、课程刚刚听完、采访也收了尾,手机里却躺着一段十几分钟甚至更长的录音,亟待整理成文字? 原本想着快速转成文本,结果反复暂停、回放、快进,三十分钟的音频硬生生耗了一个多小时才逐字敲完。不少人不得不下载第三方转写工具,到头来却发现——付费门槛才是真正的绊脚石。 其实