首页 游戏 软件 资讯 排行榜 专题
首页
科技数码
国产原生RDMA scaleFabric发布:填补大规模智算互联空白

国产原生RDMA scaleFabric发布:填补大规模智算互联空白

热心网友
38
转载
2026-03-13

3月12日,中科曙光宣布实现国产高端原生RDMA(远程直接内存访问)技术重大突破,正式发布首款全栈自研400G无损高速网络scaleFabric。该产品基于原生RDMA架构,从底层的112G SerDes IP(芯片设计中用于实现高速串行数据传输的核心硬件模块)、硬件设备到上层的管理软件实现100%自主研发,填补了国内数据中心高速网络领域的空白,以比肩国际顶尖同类产品的性能表现,为超大规模智算集群铺就了一条高带宽、低时延、真无损、超可靠的“算力大动脉”。据发布会披露,该产品已实现量产现货供应,具备全场景即插即用的落地能力。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

中科曙光scaleFabric发布会现场 郭博昊/摄

高端智算互联待破局

随着AI大模型训练与高通量推理计算需求持续扩大,万卡级乃至更大规模的算力集群正成为主流形态。研究表明,在大规模分布式训练中,网络通信耗时占比已达到30—50%,网络性能直接影响算力系统的整体效率。

在大规模智算集群领域,RDMA网络已成为算力中心的基本需求,凭借零丢包、高带宽、低延迟等特征,可极大提升通信效率。其中,InfiniBand(无限带宽技术,简称IB)凭借低时延与原生无损传输能力,在全球顶级超算与AI集群中被广泛采用。根据TOP500榜单,目前全球约60%的高性能计算系统采用InfiniBand网络架构。

长期以来,从高速SerDesIP、核心芯片到IB网卡、IB交换机等设备,InfiniBand相关产业链基本被海外厂商垄断。随着AI算力需求快速增长及数据中心网络持续演进,自主高性能RDMA网络正成为产业关注焦点。

中科曙光高级副总裁李斌在发布会上直言,“计算决定了计算系统性能的上限,但是如果是网络系统拉垮的话,有可能会把整个性能下限归零了”。中国工程院院士邬贺铨表示,高速网络作为算力基础设施的关键核心技术,其自主可控性直接关系到国家算力基础设施的安全与发展质量。

国产原生RDMA问世

scaleFabric是国内首款原生无损RDMA高速网络,面向超大规模智算集群设计,从核心关键IP、交换芯片、网卡到交换机、驱动与管理软件均实现自主研发,构建起从硬件到软件的完整技术体系。

此次发布的scaleFabric400系列网络产品技术规格全面对标英伟达NDR,部分指标实现赶超。性能方面,scaleFabric400网卡基于PCIe5.0接口,端口带宽达400Gbps,端到端通信时延低至0.9微秒;scaleFabric400交换机单端口带宽达800Gbps,整机交换容量可达双向64Tbps,交换时延约260纳秒,支持800G×40或400G×80端口扩展。这一性能组合,可充分满足万卡级AI训练集群对高带宽、低时延网络的极致需求。

稳定性与扩展能力上,产品采用基于信用的无损流控机制,从根源规避拥塞丢包风险,链路故障恢复时间小于1毫秒,已支撑近万卡集群持续稳定运行验证超10个月。与英伟达NDR相比,交换机端口密度提升25%,网卡最大QP数支持提升100%,单子网互连规模是传统IB的2.33倍,可轻松支持最大11.4万卡集群部署,同时网络总成本可降低30%。

同时,产品完成了与IB生态的全面兼容,中科曙光高速网络互联产品部总工程师万伟介绍,各类HPC(高性能计算)和AI大模型训练应用无需修改代码即可直接迁移,运维管理习惯也可无缝衔接,大幅降低了用户的迁移门槛。

在大规模AI训练系统中,网络互联能力已成为影响算力利用率的关键变量。scaleFabric的发布,标志着国产智算网络在高端RDMA领域实现重大突破。

万卡集群率先验证

在实际应用层面,scaleFabric目前已部署于国家超算互联网郑州核心节点,支撑三套万卡级scaleX智算集群上线运行,总规模达3万卡。万伟介绍,该网络系统仅用36小时便完成三套万卡级集群的网络部署上线,目前累计服务1万个客户、支撑超10项万作业稳定运行。李斌表示,随着产品在超大规模智算集群中的落地应用,国产原生RDMA技术路线正逐步走向成熟,围绕其形成的高性能网络产业生态也正在加速形成。

针对超大规模集群的运维挑战,中科曙光高端计算总工程师解西国介绍,scaleFabric配套了覆盖网络配置、上线筛查、监控管理、故障处理全流程的运维能力,六大核心能力实现了从被动响应到主动感知、从手动管理到智能运维的升级,为十万卡级集群的稳定运行提供了全链路保障。

目前,scaleFabric已完成多领域的落地验证与实测优化。中科院计算技术研究所研究员王展团队实测显示,scaleFabric的单QP(通信队列)通信性能、交换机转发延迟均达到很高水平,可支撑科学智能领域的高精度模拟需求;科大讯飞也正与中科曙光深化合作,推动scaleFabric在讯飞星火大模型训练与推理场景的适配落地,助力国产智算生态完善。

依托在高性能计算、存储与网络领域的长期技术积累,中科曙光已逐步形成“算—存—网”协同发展的完整算力底座能力,为大规模AI基础设施提供系统级支撑。随着政府工作报告提出持续推进“人工智能+”,算力基础设施正进入新一轮升级周期。国产原生RDMA网络的落地,意味着我国在智算互联这一关键环节开始形成自主技术路径,补齐了我国智算基础设施中的关键一环。

技术突破之外,国产高速网络的生态共建也同步启动。发布会同期,光合组织高性能计算专委会AIDC高速网络工作组正式成立,联合了科大讯飞、联想开天、中兴通讯等数十家产业链上下游企业,将共同推动国产高速网络的技术标准、生态适配与产业落地。李斌表示,曙光将秉持极致开放的态度,与产业链上下游伙伴在标准、接口、协议、商业模式等方面开展全方位合作,共同把国产高速网络的生态做实。

来源:https://www.163.com/dy/article/KNTAPU1T053469RG.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

Linux端口占用查看教程:lsof与netstat命令详解
系统平台
Linux端口占用查看教程:lsof与netstat命令详解

排查Linux端口占用时,首选`lsof-i:端口号`,它能完整显示进程、用户及协议信息。若系统未安装lsof,可使用`ss-tulnp`作为现代替代方案。传统命令`netstat`已逐渐被弃用,在新环境中不建议依赖。查到占用进程的PID后,应先确认其身份,尝试用`killPID`正常终止,无响应时再考虑`kill-9`强制结束,操作后需验证端口是否释放。

热心网友
05.09
XAMPP多端口配置与KeepAlive性能优化指南
编程语言
XAMPP多端口配置与KeepAlive性能优化指南

在XAMPP环境中配置多端口并优化KeepAlive参数,是提升本地开发效率的关键步骤。然而,许多开发者在实际操作中常因忽略配置细节而陷入误区,导致服务不稳定或性能未达预期。本文将深入解析XAMPP多端口设置与KeepAlive调优的核心要点,帮助您避开常见陷阱,实现高效稳定的本地服务器环境。 多端

热心网友
05.08
TCP TIME_WAIT状态分析与高并发短连接端口耗尽解决方案
编程语言
TCP TIME_WAIT状态分析与高并发短连接端口耗尽解决方案

高并发短连接场景下端口耗尽的根源是端口回收速度跟不上消耗速度,而非TIME_WAIT状态本身。诊断时应关注系统临时端口范围及实时占用,而非单纯统计TIME_WAIT数量。关键解决方案是在Go客户端自定义拨号器,设置SO_REUSEADDR选项以重用TIME_WAIT端口,避免使用有风险的SO_LINGER。系统层面可协同调整临时端口范围和FIN_TIMEOU

热心网友
05.07
XAMPP配置多端口实现本地测试服务器集群
编程语言
XAMPP配置多端口实现本地测试服务器集群

XAMPP配置多端口实现本地测试服务器集群 配置多端口虚拟主机,其实是个“三合一”的联动操作:监听端口、虚拟主机定义、目录权限,这三项必须同步修改,缺一不可。否则,等待你的不是403拒绝访问,就是500内部服务器错误。 Listen 指令必须显式添加多个端口 这里有个常见的误区:以为在httpd-v

热心网友
04.28
Navicat连接SQL Server报超时错误如何处理_网络端口排查
数据库
Navicat连接SQL Server报超时错误如何处理_网络端口排查

Na vicat连接超时主因是SQL Server未监听TCP IP或端口被阻:需启用TCP IP协议、配置静态 动态端口并重启服务;检查Windows防火墙及云平台安全组放行对应端口;用Test-NetConnection验证端口连通性;连接字符串优先用IP,端口格式,命名实例需确保SQL Ser

热心网友
04.28

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

咖啡连锁品牌激战正酣谁能稳坐行业第三把交椅
科技数码
咖啡连锁品牌激战正酣谁能稳坐行业第三把交椅

持续三年的咖啡市场价格竞争,在2026年初迎来了关键转折点,各大品牌集体展现出告别低价策略的趋势。 库迪咖啡已将大部分产品价格调整至11 9元至16 9元区间,部分核心单品的价格上调幅度达到30%至60%;瑞幸咖啡则更早一步,显著收窄了其标志性的9 9元优惠活动的适用范围。行业已形成一个清晰共识:仅

热心网友
05.13
MSCI中国指数最新调整 新增22只成分股名单
科技数码
MSCI中国指数最新调整 新增22只成分股名单

2026年5月13日,全球权威指数编制机构MSCI(明晟公司)正式发布了其季度指数审议结果。此次调整备受资本市场瞩目,所有变更将于5月29日收盘后正式生效。 在本次MSCI指数季度调整中,MSCI中国指数的成分股变动成为市场焦点。根据最新公告,该指数新增了22家中国上市公司,涵盖光库科技、长飞光纤、

热心网友
05.13
柳州以竹代塑推动汽车产业绿色转型新路径
科技数码
柳州以竹代塑推动汽车产业绿色转型新路径

在汽车制造业的可持续发展浪潮中,一场源自中国广西柳州的绿色材料革命正备受瞩目。上汽通用五菱成功构建了以本土竹资源为核心的汽车零部件创新产业链,通过前沿科技将这一可再生材料转化为高性能汽车部件,为全球汽车产业的低碳转型探索出一条独具特色的中国路径。 这一产业链的核心价值,在于其显著降低了对石油基塑料的

热心网友
05.13
实测干货告别电车高速焦虑省心省力跑长途
科技数码
实测干货告别电车高速焦虑省心省力跑长途

对于经常驾驶电动汽车进行长途出行的车主而言,高速续航焦虑、服务区充电排队、途中电量不足等问题,都是真实存在的困扰。这曾是许多新能源车主在跨城出行时最担心的情况。然而,通过多次长途实测的经验总结与策略优化,一套能够显著提升电车长途旅行安心度与便利性的实用方法已经得到验证。 车载电器:容易被忽视的“耗电

热心网友
05.13
MEXC抹茶交易所注册教程:新用户5大常见问题与审核通过指南
web3.0
MEXC抹茶交易所注册教程:新用户5大常见问题与审核通过指南

本文解答了抹茶MEXC新用户在注册过程中最常遇到的五个问题,涵盖账户注册、身份验证、审核时长、安全设置以及后续操作。内容旨在帮助用户清晰了解流程,顺利完成从开户到交易的全部步骤,确保账户安全与合规使用。

热心网友
05.13