中国首条算力光轨正式通车并发布分布式光互连超节点
超节点技术(SuperPod)正在重新定义算力集群的形态。它不再局限于单个服务器机箱,而是通过高带宽、低时延的互连技术,将海量GPU芯片整合为一个统一的超级计算单元,将算力的疆域拓展到了整个机柜,甚至跨机柜的层面。
在2025世界人工智能大会(WAIC)上,一项来自中国的集成化方案引起了业界关注。上海仪电联合曦智科技、壁仞科技、中兴通讯,正式发布了国内首个光互连光交换GPU超节点——光跃LightSphere X。这套方案集成了多项自主技术:曦智科技的分布式光交换、壁仞科技的大算力通用GPU液冷模组、中兴通讯的AI服务器以及仪电的智算云平台。其目标很明确:构建一个高带宽、低延迟且灵活可扩展的自主可控智算集群新范式。据悉,该超节点即将在上海仪电智算中心落地应用。
在大会期间,曦智科技创始人兼CEO沈亦晨博士详细解读了其光互连与光交换技术的核心,也让光跃LightSphereX背后的技术逻辑更为清晰。
光互连已成超节点必选项
目前,构建超节点主要有两种思路。一种是拼命“堆料”,在单个机柜里塞进更多GPU。但这条路很快会遇到天花板——数据中心的单机柜功耗是有限的,密度提升终有瓶颈。另一种思路则更具碘伏性:采用光互连技术,通过增加机柜数量来构建超节点,从而突破传统电互连的物理限制。光缆的远距离传输优势,使得算力部署可以摆脱机柜的束缚,实现更灵活的交付。
不过,光互连的优势虽大,在实际落地时却要面对功耗、成本和可靠性的三重考验。因此,整个产业正在向集成度更高的光学方案演进。最初的可插拔光模块有个明显问题:光电转换芯片离GPU太远,信号完整性、损耗和延迟都成了挑战。
而超节点的需求恰恰相反,它要求单通道互连带宽更高,通道的密度和数量也要提升。这就催生了新的技术——近封装光学。它的做法很巧妙,把光电转换芯片从交换机“下放”到GPU板卡上。这一下,传输距离从1米级缩短到了10厘米级,互连密度能提高2-3倍,还能省去DSP芯片,大幅削减GPU间的通讯延迟。目前,这已是批量落地的成熟方案。
那么,下一步是什么?答案是共封装光学。这是一种更极致的集成,它将光引擎与计算或交换芯片,通过先进封装技术集成在同一块基板上。传统方案里,电信号要在几厘米长的铜线上奔波,损耗不小;而CPO将这段距离缩短到了毫米级,信号损耗和延迟自然大幅降低。
在本次WAIC上,曦智科技联合燧原科技展示了国内首款xPU-CPO光电共封装原型系统。这套系统验证了将光学引擎与计算芯片共封装的可行性。与传统可插拔方案相比,它在信号完整性、损耗、延迟和系统功耗上都表现更优,光电转换的稳定性也显著提升。
国内首款 xPU-CPO 光电共封装原型系统,图源:曦智科技
沈亦晨博士指出,这是全球范围内首次实现的相关技术演示。在这个Demo中,GPU芯片通过极短距的Serdes,直接以共封装方式在芯片上完成电光转换并输出光信号。这个案例不仅验证了技术方向,也为中国AI基础设施和先进光学封装产业突破,打下了一个关键的技术锚点。
他进一步描绘了技术演进的终局:“最终的光互连形态,应该是光芯片和电芯片在同一颗芯片上,我们称之为3D共封装方案。这种方式能将互连带宽再提升1-2个数量级。我们的目标是通过近封装、共封装到3D共封装的路径,将单芯片带宽推至2000GB/s。同时,用光互连全面取代电互连,把超节点单节点内的GPU数量从现在的8颗,扩展到500颗。两者叠加,超节点的总带宽将比目前的单机8卡方案提高3个数量级。”
用光交换替代电交换
除了互连,交换是超节点的另一大核心。在WAIC 2025上,曦智科技与沐曦合作的光互连电交换超节点方案首次公开。该方案采用线性直驱光互连,具备低延时、高带宽、低功耗的特性,能支持长距离传输,突破跨机柜连接限制,可实现64张xPU卡的高速互连,为大模型训练提供更灵活的并行策略。
而光跃LightSphere X选择的,是更为前沿的“光互连光交换”路线。沈亦晨博士打了个生动的比方:“传统的电交换,就像城市里跑的小汽车,每个信号到了电交换机这个‘十字路口’,都要等待芯片运算决定向左还是向右。整个交换的容量和速度,受限于电交换芯片的‘交通处理能力’,在大型超节点网络中极易堵塞。此外,不同GPU的互连协议不同,每款GPU都需要定制专用的交换芯片来适配,而这些电交换芯片又极度依赖先进工艺制程,这正是我们当前面临的卡脖子难题。”
用光交换替代电交换,意味着信号传输模式从“普通公路”升级到了“高速铁路”。为此,曦智科技发布了全球首款基于硅光技术的分布式光交换芯片,这构成了光跃LightSphere X的底层核心技术,相关论文已被国际顶会SIGCOMM 2025收录。
谈及分布式光交换的优势,沈亦晨博士列举了几组关键数据:在单位互连成本上,由于无需昂贵的电交换机,成本可降至英伟达NVL72系统的31%,同时每个GPU的使用效率能提升3.37倍;在自主性上,该技术不受特定协议限制,所有硅光芯片均可实现国内自主生产,摆脱了对先进制程的依赖;在可靠性上,系统能在毫秒级时间内将任务从故障GPU切换至正常GPU,大幅降低了冗余备份带来的成本负担。
结语
当光技术将超节点的GPU互连规模从8颗推向500颗,将总带宽提升数个数量级时,这背后不仅仅是一场从“公路”到“高速铁路”的传输革命。它更标志着中国在智算基础设施的核心技术领域,实现了关键的自主突破。这些突破,不仅为大模型的训练与推理注入了灵活高效的算力协同能力,更在成本控制、资源利用率和供应链安全上,构建起了独特的竞争优势。一条以光为核心的、高效协同的超节点“高速路”正在铺就,一个全新的算力时代,正加速到来。
相关攻略
超节点技术(SuperPod)正在重新定义算力集群的形态。它不再局限于单个服务器机箱,而是通过高带宽、低时延的互连技术,将海量GPU芯片整合为一个统一的超级计算单元,将算力的疆域拓展到了整个机柜,甚至跨机柜的层面。 在2025世界人工智能大会(WAIC)上,一项来自中国的集成化方案引起了业界关注。上
阿里云PolarDB分布式版AI助手深度融合大语言模型与专家知识库,具备智能问答、诊断和巡检三大核心能力。它通过自然语言交互,帮助用户定位性能问题、优化分片策略、规划扩缩容,并确保数据安全,覆盖从故障诊断到容量管理的全生命周期运维,显著降低了使用与运维门槛。
AI智能体规模化应用面临架构瓶颈,用户多设备体验割裂。研究指出,分布式智能与系统级编排是破局关键,能大幅降低云端成本并提升响应与隐私安全。智能手机将演变为个人AI生态核心,行业需推动跨设备协同与边缘计算整合,实现以用户为中心的智能服务。
在人工智能与复杂系统研究的前沿,基于多智能体系统的分布式优化正成为核心技术焦点。它不仅引领着学术探索的方向,更是破解未来大规模协同与决策难题的关键。本文将深入解析其原理、方法与未来趋势。 一、研究背景与核心价值 我们已全面进入万物互联的时代。从工业物联网到智慧城市管理,系统的规模与复杂性呈指数级增长
在分布式智能体系统的设计与实践中,实现多个智能体(Agent)之间的高效通信与协同协作,是保障系统整体性能与可靠性的关键技术。这好比一支高度协同的团队,若成员间缺乏顺畅的信息交换与任务配合,即便个体能力再强,也难以达成整体目标。那么,这些分布在网络各处的智能体,究竟通过哪些机制与策略来完成有效的“对
热门专题
热门推荐
制作PPT用什么软件好?2024年五大主流工具深度评测 无论是职场汇报、学术答辩还是项目路演,一份专业且吸引人的PPT演示文稿都至关重要。面对众多制作工具,如何选择最适合自己的那一款?本文将对五款主流的PPT软件进行全方位对比分析,从功能、协作、设计到易用性,助您根据核心需求做出最佳决策,高效打造令
今日A股市场整体走势偏弱,朗玛信息(股票代码300288)股价同步调整,截至收盘下跌3 16%,全天成交额4783 73万元,换手率为1 77%,公司总市值约为35 21亿元。股价的短期波动,引发了投资者对其核心投资逻辑与未来潜在机会的深入探讨。 异动深度解析:AI医疗战略的机遇与挑战 朗玛信息是市
《超级蠕虫大战圣诞老人2》是一款休闲益智游戏,攻略涵盖基本操作、关卡解锁与道具使用。玩家需掌握战斗策略与技能升级,熟悉敌人特性和环境机制。合理运用道具并完成隐藏任务可获取奖励,多人模式注重策略博弈。建议多练习并参与社区交流,同时注意游戏时长以保护视力。
在Kimi里搜索“2026年北京积分落户政策细则”,如果跳出来的总是房产中介的软文、培训机构的广告或者各种自媒体猜测,那说明默认的联网检索没有经过过滤。想要获得干净、权威的结果,必须主动使用结构化的提示词进行限定。 用结构化提示词锁定权威信源 这一步是关键,直接决定了你看到的信息是来自官方发布渠道,
为避免代码丢失,Qoder编辑器需手动开启自动保存功能。全局设置中可开启开关并选择触发条件,如按时间间隔或窗口失去焦点时保存。还可为特定项目单独配置,覆盖全局设置。若功能失效,需检查文件位置是否只读、用户权限是否足够,并避免直接编辑受保护的系统文件。





