首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
中科曙光发布国产IB网络:全栈自研实现万卡级算力集群

中科曙光发布国产IB网络:全栈自研实现万卡级算力集群

热心网友
51
转载
2026-03-13

《科创板日报》3月13日发布消息(记者 郭辉)3月12日,中科曙光在郑州宣布实现国产高端原生RDMA技术重大突破,正式推出首款全栈自研400G无损高速网络——scaleFabric。

据了解,中科曙光scaleFabric是国内首款全栈自研IB网络产品。

在大规模智算集群领域,RDMA(远程直接内存访问)网络已成为算力中心的基础需求。中科曙光scaleFabric基于原生RDMA架构,从底层的112G SerDes IP、硬件设备到上层的管理软件实现100%自主研发,突破了海外在高端原生RDMA网络的技术垄断。

中国工程院院士邬贺铨指出,高速网络作为算力基础设施的核心关键技术,其自主可控性直接关系到国家算力基础的安全与发展质量。在大模型训练和智算集群规模化部署背景下,网络需要同时具备超低延迟、超高带宽与无损传输能力,而RDMA高速网络正是智算集群的“算力大动脉”。

目前InfiniBand和RoCE是市场主流的高速网络技术方案。其中InfiniBand凭借低时延与原生无损传输能力,在全球顶级超算与AI集群中被广泛采用。根据TOP500榜单,当前全球约60%的高性能计算系统采用InfiniBand网络架构。

中科曙光scaleFabric采用InfiniBand原生RDMA路线,而非RoCE路线。对此,中科曙光表示,InfiniBand的技术路线在AI/HPC中具有不可替代的优势,是真正的无损网络,而无损特性对RDMA性能的发挥具有优势,便于更好地对网络进行管理。

此前InfiniBand(IB)相关产业链基本被海外厂商垄断。

2019年,英伟达以69亿美元收购Mellanox(迈络思)。Mellanox是一家主打InfiniBand网络技术的公司。上世纪90年代以后,随着超算技术的路径分化,InfiniBand逐步成为高速网络的代名词。这一收购事件被视为算力史上的标志性转折点,英伟达借此从一家GPU产品厂商转型为AI数据中心公司,还实现以整合网络技术,解决AI算力规模化进程中的通信瓶颈。

据业内人员向《科创板日报》记者表示,中国市场用户在使用IB网络时面临诸多痛点,IB网络虽是开放协议,但是技术事实上是被迈络思公司所垄断的,其次其价格成本、服务和响应速度也难以满足国内客户的需求。

性能方面,据称scaleFabric400系列网络产品技术规格实现全面对标英伟达NDR产品。

中科曙光高速网络互联产品部总工程师万伟介绍,scaleFabric的核心是自主研发的两颗高速网络芯片。其中scaleFabric400网卡芯片做到400G高带宽,采用自研的RDMA引擎;scaleFabric400交换芯片实现64T双向交换容量,采用VCT交换机制,转发时延可低至260纳秒。

此外,scaleFabric交换机端口密度做到80口400G,与英伟达NDR 64口交换机相比,端口密度提升25%,这使得scaleFabric的组网成本得到大幅降低。同时,单卡最大QP数支持为256K,相比英伟达NDR提升100%,单子网互联规模是传统IB的2.33倍,可轻松支持最大11.4万卡集群部署,同时网络总成本可降低30%。

“实测数据来看,scaleFabric基本上都能做到和英伟达NDR相当的水平,部分数据甚至优于NDR系列,两款芯片技术规格全面对标了英伟达当前主力产品的NDR产品。”万伟如是称。

在与现有IB网络的兼容方面,据介绍,scaleFabric提供原生的接口,可全面兼容各种通信库,实现无缝兼容各种HPC和AI的应用,各类大模型训练都可以在不改代码的情况下,直接迁移到基于scaleFabric的系统。同时,在网络管理和维护方式上,也兼容了IB用户的使用习惯。

对国产算力硬件的兼容上,中科曙光高级副总裁李斌接受《科创板日报》记者等媒体采访表示,过去scaleFabric已经对不同的计算芯片进行了互联适配,未来会探索更高效的方式,比如计算芯片通过专有的协同连接到网卡,另外还在生态内推动芯片互联协议的共享,探索与其他厂商芯片更高效的芯片直通。

在实际应用层面,scaleFabric目前已部署在位于郑州的国家超算互联网核心节点,支撑三套万卡级scaleX智算集群上线运行,总规模达3万卡。

李斌表示,随着产品在超大规模智算集群中的落地应用,国产原生RDMA技术路线正逐步走向成熟,围绕其形成的高性能网络产业生态正在加速形成。

随着此次首款国产全栈自研IB网络产品的发布,中科曙光联合联想开天、中兴通讯、达梦数据、欧瑞科斯、乐讯科技、九章云极等产业合作方,成立光合组织高性能计算专委会AIDC高速网络工作组。

曙光信息产业(北京)有限公司副总裁柳昀表示,“scaleFabric技术推出后,未来还要依靠标准化的组织,以开放的姿态联合更多的国内合作伙伴,从AI数据中心、加速芯片到网络设备、AI框架等多个环节,推动产业协同创新,构建AI网络生态。”

来源:https://www.163.com/dy/article/KNT9LLFV05198CJN.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

科技股中期行情持续关注算力与复苏双主线投资策略
AI
科技股中期行情持续关注算力与复苏双主线投资策略

科技板块近期出现回调,分析指出这主要受短期因素影响,人工智能等产业的中期趋势未变。投资布局可关注“算力”与“复苏”双主线,算力方向包括AI、光模块、PCB、存储芯片等核心环节;复苏方向则涉及电网设备、人形机器人及部分传统周期板块。中报业绩将成为验证各细分领域景气度的关键指标。

热心网友
05.18
英伟达全系列GPU现货租赁价格大幅上涨,算力租赁概念反复走强
科技数码
英伟达全系列GPU现货租赁价格大幅上涨,算力租赁概念反复走强

算力租赁市场持续升温,行业格局悄然生变 4月15日,资本市场上的算力租赁板块表现相当活跃,反复走强。午后,协创数据(300857 SZ)、宏景科技(301396 SZ)的股价涨幅超过了10%,利通电子(603629 SH)更是逼近涨停板,股价续创历史新高。与此同时,恒润股份(603985 SH)、亿

热心网友
04.16
OpenAI内部信曝光:断言死敌Anthropic深陷算力瓶颈,差距将持续拉大
业界动态
OpenAI内部信曝光:断言死敌Anthropic深陷算力瓶颈,差距将持续拉大

OpenAI内部备忘录曝光:直指竞争对手Anthropic算力规模“不在一个量级” AI领域的竞争,火药味越来越浓了。就在本周,OpenAI向投资者发送的一份内部备忘录被曝光,内容直指其主要竞争对手Anthropic。OpenAI在文件中毫不客气地指出,双方的“规模体量完全不在一个量级”,并称Ant

热心网友
04.14
当算力开始“排队”,IT分销商不再只是“卖货的人”
科技数码
当算力开始“排队”,IT分销商不再只是“卖货的人”

高端GPU缺货、存储价格上涨、AI项目交付延迟。过去几个月,算力供给的收紧,正在从上游快速传导至整个IT产业链。多位渠道商近日对第一财经记者表示,AI算力需求的爆发已明显拉长关键设备的交付周期。“高

热心网友
04.07
国产万卡智算集群破局背后:99.99%超高可用性如何实现?
科技数码
国产万卡智算集群破局背后:99.99%超高可用性如何实现?

走进上海智能算力科技有限公司(下称“智算科技”)位于上海松江区的国产万卡集群智算中心,刚踏入机房大门,浑厚而持续的风扇轰鸣声便扑面而来。目光所及,数万张GPU在机柜里整齐排列、鳞次栉比;高速网络线缆

热心网友
04.07

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

Mac清理Safari自动填充记录教程 保护苹果隐私安全
系统平台
Mac清理Safari自动填充记录教程 保护苹果隐私安全

在使用Safari浏览器时,自动填充功能确实能极大提升效率。但随着时间推移,其中可能积累大量过时地址、失效密码,甚至无意保存的敏感内容。这些残留记录不仅影响使用体验,更可能成为隐私泄露的隐患。本文将系统介绍在Mac上彻底清理Safari自动填充记录的多种实用方案,帮助您有效管理浏览器数据。 一、通过

热心网友
05.19
关闭Windows自动维护功能 解决电脑空闲时CPU占用过高问题
系统平台
关闭Windows自动维护功能 解决电脑空闲时CPU占用过高问题

你是否遇到过这样的困扰:电脑明明处于空闲状态,风扇却突然高速运转,硬盘指示灯频繁闪烁,任务管理器显示CPU或磁盘占用率异常飙升?这种“系统看似休息,硬件却异常忙碌”的现象,很可能源于Windows系统内置的“自动维护”功能在后台悄然运行。该功能的设计初衷是好的,旨在利用系统空闲时间自动执行磁盘碎片整

热心网友
05.19
Win11高对比度模式开启教程 弱视用户屏幕显示优化指南
系统平台
Win11高对比度模式开启教程 弱视用户屏幕显示优化指南

如果你在使用Windows 11时,感觉屏幕上的文字、图标或按钮有些模糊不清,看久了眼睛容易疲劳,这可能不是你的视力问题,而是系统默认的色彩搭配对比度不够。为了让界面元素更醒目、更容易识别,Windows 11内置了一个非常实用的功能——高对比度模式。它通过大幅强化前景与背景的颜色差异,能显著提升屏

热心网友
05.19
Mac关闭Spotlight索引的详细步骤与禁用设置技巧
系统平台
Mac关闭Spotlight索引的详细步骤与禁用设置技巧

当你的Mac出现运行卡顿、风扇噪音增大或应用程序启动缓慢时,很可能是因为Spotlight索引服务正在后台占用大量系统资源。Spotlight作为macOS内置的搜索工具,虽然方便,但其持续的索引过程确实可能影响性能。本文将详细介绍五种有效管理Spotlight的方法,包括彻底禁用、精准控制索引范围

热心网友
05.19
Mac清理Microsoft Teams缓存详细步骤指南
系统平台
Mac清理Microsoft Teams缓存详细步骤指南

当您在 macOS 上遇到 Microsoft Teams 运行缓慢、界面显示错误或登录失败等问题时,不必立即归咎于网络或系统故障。一个常见且高效的解决方案是清理应用程序的本地缓存文件。这些缓存数据在长期使用后可能损坏或过时,从而影响软件性能。本文将为您提供三种在 Mac 上安全清理 Teams 缓

热心网友
05.19