迈向10万卡集群:摩尔线程128卡超节点参考设计解析
3月16日讯,传统服务器通常采用单机配置2到8张加速卡的方案,但智算集群的规模正以前所未有的速度扩张。从百卡、千卡到万卡,乃至十万卡级别,集群规模持续攀升,因此具备强大互联能力的超节点架构正成为行业关注的焦点。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
近期,依托OISA协同创新平台,摩尔线程、中国移动研究院、之江实验室等伙伴携手合作,正式发布了《OISA高密超节点参考设计技术规范》。
该规范直面当前智算中心在互联瓶颈、供电压力及散热极限等方面的挑战,提出了一套全栈式解决方案,支持构建自主可控、性能卓越的高性能计算集群。
OISA高密超节点创新性地引入了大尺寸高密线缆方案,在主流32卡至64卡互联的基础上,实现了标准单宽机柜内128卡的全互联架构,并支持通过并柜扩展轻松部署256卡规模。
在核心协议层面,规范采用了基于OISA 2.0版本的原生内存语义支持,能够实现跨节点的无障碍数据高速访问。结合创新的报文重组技术,可将卡间通信带宽推向TB/s量级,时延则大幅缩短至数百纳秒。
如今,单颗GPU算力卡的功耗已攀升至700W甚至1000W以上,整机柜功率更是朝着350kW甚至更高水平迈进。
OISA参考设计对机柜级供电和散热管理两方面进行了重点革新。
在供电侧,方案引入了高压直流系统与柜内集中供电、盲插技术,减少了中间电力转换层级,显著降低了能源传输过程中的损耗。
在散热侧,液冷技术在该超节点架构中已从“可选项”转变为“原生标配”。针对单GPU超过2kW的散热需求进行深度优化,将PUE值从风冷时代的约1.4,显著降低至1.05到1.15之间。
再结合对流量、压力、温度进行全量监测的智能诊断系统,导热效率实现了数千倍的提升。
展望未来,OISA协同创新平台将继续融合Chiplet、光互联、内存池等前沿技术,不断探索高密度计算的性能极限。

相关攻略
快科技3月27日消息,七彩虹iGame再度发力高端显卡市场,正式推出iGame GeForce RTX 5070 Ultra OC 12GB显卡。现在这款新品已经来到我们评测室,下面为大家带来图赏。
3月27日消息,据Reddit网友u ForkDryer分享,其在当地一家沃尔玛超市以惊人的80美元(约合人民币553元)价格,成功买下了一块全新的微星RTX 5060 Ti 8GB Ventus
IT之家 3 月 26 日消息,英特尔昨日发布了 Q1 26 版锐炫 Arc Pro 专业显卡 Windows 驱动程序,版本号来到 32 0 101 8515。这版本显卡支持锐炫 Pro B70
苹果公司近日正式停止销售 Mac Pro 台式机,并已将该产品从正式下架,同时表示未来不再计划开发任何新款 Mac Pro,这意味着这一曾经象征苹果专业台式机路线的产品线正式宣告终结。根据报道,Ma
IT之家 3 月 27 日消息,科技媒体 9to5Mac 昨日(3 月 26 日)发布博文,报道称苹果公司已停售 Mac Pro,并将其从正式全面下架,最新确认目前没有计划推出继任机型。Mac St
热门专题
热门推荐
猎豹浏览器免安装网页版入口是https: web lemur-browser com,具备界面简洁响应迅速、多端同步无缝衔接、安全防护层级丰富、文档处理能力突出、资源兼容性广泛覆
据昆仑万维集团消息,3月27日下午,昆仑万维(300418 SZ)旗下天工AI顺利举办“世界模型前沿技术与天工AIGC全家桶大模型生态”专场发布会,携Matrix-Game 3 0、SkyReels
本报(chinatimes net cn)记者石飞月 北京报道大模型未来会走向哪里?OpenClaw的爆火似乎为全行业指明了一个方向,但接踵而至的舆论质疑,又让这个答案变得扑朔迷离。3月27日,在2
Anthropic一款尚未发布的新AI模型因数据泄露意外曝光,引发市场对AI颠覆网络安全行业的担忧再度升温,网络安全板块股价周五盘前全线下挫。据《财富》杂志报道,Anthropic正在开发并已开始向
3月初,腾讯在深圳总部楼下设立“龙虾站”,引发千人排队尝鲜。OpenClaw掀起的“全民养虾”热潮,在短短一个月内让更多人看到了AI Agent深入业务场景的价值,随即推动Token调用量大规模增长





