游乐游手机版
首页/科技数码/文章详情

中科曙光发布国产IB网络:全栈自研实现万卡级算力集群

时间:2026-03-13 13:16
《科创板日报》3月13日讯(记者 郭辉)3月12日,中科曙光在郑州宣布实现国产高端原生RDMA技术重大突破,正式发布首款全栈自研400G无损高速网络——scaleFabric。据了解,中科曙光sca

《科创板日报》3月13日发布消息(记者 郭辉)3月12日,中科曙光在郑州宣布实现国产高端原生RDMA技术重大突破,正式推出首款全栈自研400G无损高速网络——scaleFabric。

据了解,中科曙光scaleFabric是国内首款全栈自研IB网络产品。

在大规模智算集群领域,RDMA(远程直接内存访问)网络已成为算力中心的基础需求。中科曙光scaleFabric基于原生RDMA架构,从底层的112G SerDes IP、硬件设备到上层的管理软件实现100%自主研发,突破了海外在高端原生RDMA网络的技术垄断。

中国工程院院士邬贺铨指出,高速网络作为算力基础设施的核心关键技术,其自主可控性直接关系到国家算力基础的安全与发展质量。在大模型训练和智算集群规模化部署背景下,网络需要同时具备超低延迟、超高带宽与无损传输能力,而RDMA高速网络正是智算集群的“算力大动脉”。

目前InfiniBand和RoCE是市场主流的高速网络技术方案。其中InfiniBand凭借低时延与原生无损传输能力,在全球顶级超算与AI集群中被广泛采用。根据TOP500榜单,当前全球约60%的高性能计算系统采用InfiniBand网络架构。

中科曙光scaleFabric采用InfiniBand原生RDMA路线,而非RoCE路线。对此,中科曙光表示,InfiniBand的技术路线在AI/HPC中具有不可替代的优势,是真正的无损网络,而无损特性对RDMA性能的发挥具有优势,便于更好地对网络进行管理。

此前InfiniBand(IB)相关产业链基本被海外厂商垄断。

2019年,英伟达以69亿美元收购Mellanox(迈络思)。Mellanox是一家主打InfiniBand网络技术的公司。上世纪90年代以后,随着超算技术的路径分化,InfiniBand逐步成为高速网络的代名词。这一收购事件被视为算力史上的标志性转折点,英伟达借此从一家GPU产品厂商转型为AI数据中心公司,还实现以整合网络技术,解决AI算力规模化进程中的通信瓶颈。

据业内人员向《科创板日报》记者表示,中国市场用户在使用IB网络时面临诸多痛点,IB网络虽是开放协议,但是技术事实上是被迈络思公司所垄断的,其次其价格成本、服务和响应速度也难以满足国内客户的需求。

性能方面,据称scaleFabric400系列网络产品技术规格实现全面对标英伟达NDR产品。

中科曙光高速网络互联产品部总工程师万伟介绍,scaleFabric的核心是自主研发的两颗高速网络芯片。其中scaleFabric400网卡芯片做到400G高带宽,采用自研的RDMA引擎;scaleFabric400交换芯片实现64T双向交换容量,采用VCT交换机制,转发时延可低至260纳秒。

此外,scaleFabric交换机端口密度做到80口400G,与英伟达NDR 64口交换机相比,端口密度提升25%,这使得scaleFabric的组网成本得到大幅降低。同时,单卡最大QP数支持为256K,相比英伟达NDR提升100%,单子网互联规模是传统IB的2.33倍,可轻松支持最大11.4万卡集群部署,同时网络总成本可降低30%。

“实测数据来看,scaleFabric基本上都能做到和英伟达NDR相当的水平,部分数据甚至优于NDR系列,两款芯片技术规格全面对标了英伟达当前主力产品的NDR产品。”万伟如是称。

在与现有IB网络的兼容方面,据介绍,scaleFabric提供原生的接口,可全面兼容各种通信库,实现无缝兼容各种HPC和AI的应用,各类大模型训练都可以在不改代码的情况下,直接迁移到基于scaleFabric的系统。同时,在网络管理和维护方式上,也兼容了IB用户的使用习惯。

对国产算力硬件的兼容上,中科曙光高级副总裁李斌接受《科创板日报》记者等媒体采访表示,过去scaleFabric已经对不同的计算芯片进行了互联适配,未来会探索更高效的方式,比如计算芯片通过专有的协同连接到网卡,另外还在生态内推动芯片互联协议的共享,探索与其他厂商芯片更高效的芯片直通。

在实际应用层面,scaleFabric目前已部署在位于郑州的国家超算互联网核心节点,支撑三套万卡级scaleX智算集群上线运行,总规模达3万卡。

李斌表示,随着产品在超大规模智算集群中的落地应用,国产原生RDMA技术路线正逐步走向成熟,围绕其形成的高性能网络产业生态正在加速形成。

随着此次首款国产全栈自研IB网络产品的发布,中科曙光联合联想开天、中兴通讯、达梦数据、欧瑞科斯、乐讯科技、九章云极等产业合作方,成立光合组织高性能计算专委会AIDC高速网络工作组。

曙光信息产业(北京)有限公司副总裁柳昀表示,“scaleFabric技术推出后,未来还要依靠标准化的组织,以开放的姿态联合更多的国内合作伙伴,从AI数据中心、加速芯片到网络设备、AI框架等多个环节,推动产业协同创新,构建AI网络生态。”

来源:https://www.163.com/dy/article/KNT9LLFV05198CJN.html
上一篇美企断供后央企果断采用国产芯片,外媒破防揭秘 下一篇英伟达GTC大会前瞻:AI春晚除了黄仁勋与LPU还有哪些看点?
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
OpenClaw手机App上线,结果翻车了
科技数码 · 2026-07-01

OpenClaw手机App上线,结果翻车了

OpenClaw 官方宣布,已正式推出 iOS 和 Android 原生移动 App,用户如今可以在手机上使用这款主打“能真正帮你做事”的个人 AI 助手。官方在 X 上给出的定位也很直接:把 Agent 放进口袋里,让用户可以在移动端处理频道消息、任务和回复。从功能上看,OpenClaw 移动端并

优必选CEO周剑:家庭机器人生态核心投入过半精力
科技数码 · 2026-07-01

优必选CEO周剑:家庭机器人生态核心投入过半精力

先说几个核心判断:优必选正在布局一盘长远战略。创始人兼CEO周剑在近期一场媒体沟通会上,直接亮出了公司未来的发展路线——工业、商用、家庭陪伴机器人三条业务主赛道并行推进,现阶段每条线各占约一半精力。一边是已经能够稳定创造收入的工业场景,另一边则是他眼中“最具想象力与未来空间”的家庭陪伴领域。工业人形

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛
科技数码 · 2026-07-01

CPO/NPO/OIO开启封装级光连接价值空间,技术路线尚未收敛

6月30日,申银万国在光连接系列研报中重点指出,MPO光连接器领域的投资机会值得高度关注。通俗来说,随着AI算力集群持续扩张,光互联升级带来的连锁效应——数据中心光纤通道数量、前面板端口密度、机柜内光纤管理复杂度——均在同步攀升。光连接器的角色早已超越传统的低价值标准件,如今它直接决定着链路插损、可

龙岗AR实景剧本游内测体验短板有效破解之道
科技数码 · 2026-07-01

龙岗AR实景剧本游内测体验短板有效破解之道

在今年龙岗区第二届人工智能与机器人发展大会上,区级部门一次性推出了7个AI“龙搭子”。其中,名为“龙导游”的成果成为文商旅融合领域的核心亮点。据南都N视频记者了解,依托“龙导游”打造的全区全域AR实景剧本游“龙岗大陆”,已在今年五一假期发布了内测版本。经过一个月市场验证后,该项目正式启动面向全社会的

南下资金6月30日净买入中芯国际与建滔积层板
科技数码 · 2026-07-01

南下资金6月30日净买入中芯国际与建滔积层板

6月30日,南下资金持续大举买入港股,单日净流入金额高达58 95亿港元。接下来,我们直接盘点哪些个股获得资金青睐、哪些遭到减持: 净买入方面,中芯国际领跑全场,单日吸金19 33亿港元;建滔积层板紧随其后,净买入10 59亿港元;腾讯控股获得7 65亿港元净流入;智谱(02513 HK)也有6 5