游乐游手机版
首页/科技数码/文章详情

港中文全光芯片突破AI数据中心传输瓶颈

时间:2026-06-15 12:47
香港中文大学研发全光信号处理芯片,解决了数据中心GPU间数据传输延迟的瓶颈。该芯片让光信号无需转换为电信号即可修复损伤,实验吞吐量达1 6Tbps,延迟仅60皮秒,远超传统电芯片方案。它能同时处理色散、带宽限制和非线性效应,且功耗极低、成本可控,有望显著提升AI算力利用率并降低训练成本。

马斯克旗下xAI打造的Colossus数据中心,配备了高达55万张顶级GPU。然而,业内一个广为人知的秘密是,这些昂贵的算力资源在训练阶段的平均利用率往往仅徘徊在10%左右。剩下的90%算力去了哪里?答案可能让许多人感到意外——它们并非在“计算”,而是在“等待”。数据在GPU之间的搬运速度,已成为拖慢整个系统性能的关键瓶颈。

那么,这一瓶颈能否被彻底突破?一项刚刚发表于《科学》杂志的突破性研究,似乎给出了肯定的答案。

全光信号处理芯片:让GPU不再“空等”

6月11日,《科学》杂志刊登了香港中文大学黄超然教授团队的研究成果——一款名为“全光信号处理芯片”的新型处理器。该论文的共同第一作者为博士生王本善和肖洽荣,通讯作者为黄超然教授。
这款芯片的核心任务,是解决数据中心内部GPU间数据光互连的“最后一公里”延迟问题,将被“等数据”浪费的算力彻底释放。实验数据显示,该芯片的总吞吐量达到惊人的1.6Tbps,而延迟仅有60皮秒。这是什么概念?1.6Tbps意味着每秒可传输上百部蓝光电影;60皮秒则比大多数现代计算机的一个时钟周期还要短暂。

(来源:《科学》)

光信号无需转电,直接在半路修复

要理解这项技术的创新之处,得先看看当前数据中心是如何运作的。

目前,大规模AI集群中,GPU之间主要依赖光互连进行高速通信。流程大致是:发送端GPU的电信号由光模块转换为光信号,通过光纤传输;接收端再将光信号转换回电信号,交给GPU处理。问题就出在这个“光-电-光”的转换过程,以及光信号在光纤中传输时的自然损耗——色散会让光脉冲展宽、器件带宽不足会使信号模糊、非线性效应则会引入额外噪声。

传统解决方案,是在光电转换后,使用数字信号处理(DSP)芯片来修复这些损伤。DSP芯片固然成熟可靠,但其工作依赖于电时钟频率,处理延迟通常在微秒甚至毫秒级。当数万张GPU同时协作时,这些微小延迟不断累积,最终成为制约系统效率的致命短板。

黄超然教授团队的思路颇为巧妙:既然损伤发生在光路上,为何不直接在光路上修复?他们设计的全光信号处理芯片,被放置在光电探测器之前。这意味着信号在还是“光”的时候,就已经完成了损伤补偿。处理过程无需等待电时钟周期,光速有多快,处理就能有多快。

具体实现上,他们在芯片上设计了三层级联的“光学储备池”结构,每一层都配有反馈回路。这三层结构与一个8分支的全光读出层结合,共同形成了一个等效的“无限脉冲响应滤波器”。

这颗微型光子芯片,在功能上等效于一个拥有7个反馈通道和64个前馈通道的复杂滤波器。结合光电探测器的平方律探测特性,整个系统可被视为一个二阶Volterra非线性均衡器。研究团队还巧妙地采用了“游标卡尺”原理,通过微调各层的采样周期,将系统的有效采样分辨率提升至1皮秒——这仅仅是光穿越一根头发丝直径所需时间的几分之一。

(来源:《科学》)

共同第一作者王本善博士解释道,电芯片在处理高速信号时发热严重,就像笔记本电脑GPU过热会降频导致卡顿一样,数据中心里成千上万的DSP芯片发热会进一步降低系统能效。而全光处理方案,从根本上绕过了这个问题,实现了近乎零发热、超低延迟的信号修复,这对于追求极致能效的AI数据中心而言,意义重大。

色散、带宽、非线性,三种损伤一起修

光纤通信的三大经典难题——色散、带宽限制和非线性效应,一直困扰着行业。色散导致信号脉冲展宽、码间干扰;收发机带宽不足会过滤掉信号高频成分;非线性效应则在光功率较高时引发信号畸变。

传统DSP在处理色散时存在先天不足:光电转换后,光信号的相位信息已经丢失,补偿效果有限且容易放大噪声。业内著名的B²DL公式揭示了色散对系统的限制。以100GBaud信号为例,在C波段传输时,DSP能无损补偿的色散上限约为25皮秒每纳米。

王本善展示的对比实验极具说服力:在累积色散高达85皮秒每纳米的5公里光纤上,未使用OSP芯片时,信号“眼图”一片模糊。而接入OSP芯片后,“眼图”立刻变得清晰开阔。他们甚至在不依赖任何接收端DSP辅助的情况下,成功实现在5公里光纤上实时修复100GBaud的PAM4信号。仿真结果进一步表明,OSP芯片理论上可支持在170皮秒每纳米的色散下进行100GBaud传输,将可用波分复用窗口拓宽了6.8倍以上,同时支持高达200GBaud的超高速信号处理。

(来源:《科学》)

低成本、可编程,一个芯片处理八个通道

更令人印象深刻的是,这款OSP芯片并非功能固化的“黑盒子”。通过调节片上集成的微加热器驱动的移相器,它可以动态重新配置光场处理过程,从而灵活适应不同的信号调制格式、数据速率和工作波长。

研究团队在5公里光纤上分别测试了OOK和PAM4两种调制格式,符号率从56GBaud到112GBaud,波长从1540纳米到1565纳米连续可调,OSP芯片均表现出优异的适应性。他们还利用粒子群优化算法对芯片进行原位训练,使其能够针对不同的链路状态自动优化参数,确保误码率始终低于硬件前向纠错的门限。

(来源:《科学》)

成本与功耗的优势同样显著。这款OSP芯片基于成熟的商用硅光平台制造,65纳米及以上制程即可满足需求。相比之下,处理1.6T信号的传统电DSP芯片,往往需要追逐3纳米这样的尖端制程。二者在流片成本上的差距,可能高达几十甚至上百倍。

功耗对比更为悬殊:传统DSP处理1.6T信号功耗约10瓦,而OSP芯片的实测功耗仅约100毫瓦,理论上还有望降至10毫瓦量级,能效提升可达百倍甚至千倍。这清晰地揭示了一个趋势:当电芯片沿着摩尔定律艰难前行,面临制程微缩越来难、成本越来越高、功耗墙日益严峻的挑战时,光芯片正凭借其物理特性,在成熟制程上实现“弯道超车”。

光芯片还有一个电芯片难以比拟的天然优势:强大的并行处理能力。对于波分复用系统,传统方案需要为每一个波长通道配备一个独立的DSP模块,通道数增加,功耗和芯片面积便线性增长。而OSP芯片利用了光波的并行性,单个芯片即可同步处理多个波长通道,无需额外增加能耗和面积。

为展示其性能,团队搭建了一个1.6Tbps的数据中心互连演示系统:使用C波段8个波长通道,每个通道承载200Gbps的PAM4信号,经由5公里光纤传输。一个OSP芯片即可同步处理所有8个通道的信号。对于不同波长剩余的部分差异,仅需一个极简的电处理芯片辅助即可。在这种混合方案中,每个通道平均仅需25抽头的前馈均衡器或15抽头的判决反馈均衡器,抽头数量比传统纯DSP方案少了一个数量级,性能却更加优异。

(来源:《科学》)

谈及技术路线的选择,王本善指出了一个关键点:以往将光计算用于通用计算时常陷入一个怪圈——输入输出都是电信号,不得不反复进行光电/电光转换,其潜在的速度和能效优势在转换中被消耗殆尽。而他们选择的GPU光互连场景则截然不同:信号从始至终都是光形态,天然适合光计算介入。“我们相当于把光计算芯片,精准地嵌入到了它最能发挥价值的环节。”王本善总结道。

从实验室到产业化:将光计算用在刀刃上

这项突破性研究的背后,是一支年轻而富有活力的团队。王本善2020年从武汉大学电子信息工程专业本科毕业,早在本科期间就参与空间光通信项目并获得全国奖项。武汉作为中国光电子产业重镇,产业氛围的熏陶让他对光电领域产生了浓厚兴趣。随后,他加入香港中文大学黄超然教授课题组,成为团队最早的博士生之一。

项目自2024年启动,历经五次以上的流片迭代,每次数月的等待周期对团队而言都是耐心的考验。与此同时,光通信与光计算领域也在飞速发展,团队的目标也随之不断调高——从最初的单通道50G,逐步瞄准200G乃至400G级别。

2024年,团队迎来了激动人心的时刻:他们首次在纯光链路中,不借助任何DSP芯片或算法,成功将经过5公里光纤传输后损伤严重的200G光信号,完整清晰地修复还原。这个结果在当时的学术界和产业界都未见先例。要知道,目前商用的主流1.6T光模块,在O波段的传输距离通常仅为2公里左右。

香港中文大学在光学领域有着深厚传承,被誉为“光纤之父”的高锟教授曾担任校长。从高锟教授让光“跑腿”通信,到今天黄超然团队让光“动脑”处理信号,这所大学用了几代人的时间,在光科技领域完成了又一次重要跨越。对于作为黄教授首位博士生并亲身参与这项工作的王本善而言,这段经历无疑意义非凡。

眼下,即将博士毕业的王本善,正与团队一同积极推动这项技术的产业化,筹备创立初创公司。他们已在去年的中国国际大学生创新大赛中夺得全国第三名,并获得了投资机构的关注。

展望未来,王本善相信,一旦光互连的延迟从微秒级降至皮秒级,整个AI训练的成本结构将发生变革。训练一个万亿参数的大模型,时间可能从一个月缩短到几天,而那被低效数据传输耽搁的90%算力,也将被真正释放出来,最终让每个人使用AI服务的成本变得更低。

参考资料:
相关论文 https://www.science.org/doi/10.1126/science.ady5344

来源:https://www.163.com/dy/article/KVAB03EA05119734.html
上一篇钛媒体回应哈啰报警不接受任何威胁打压 下一篇新能源与燃油车长期共舞市场不必焦虑
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
年国家能源局充换电服务业用电量增速48.8%
科技数码 · 2026-06-29

年国家能源局充换电服务业用电量增速48.8%

2025年全社会用电量达103682亿千瓦时,同比增长5 0%。充换电服务业用电增速高达48 8%,信息传输与软件服务业增速17 0%。第三产业和居民用电对增长贡献率合计占一半。中国成为全球首个年度用电量超10 4万亿千瓦时的国家。

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元
科技数码 · 2026-06-29

追风者 GLACIER ONE 360 S25 液冷散热器新品上市 联体风扇售价429元

追风者冰川360S25液冷散热器售价429元,三联一体风扇便捷安装,冷头小体积纯铜底座噪音18dB,风扇转速300-2000RPM、风量75CFM、静压2 96mmAq,五年质保漏液包赔。

三星Galaxy Watch8用户反馈谷歌后台组件异常
科技数码 · 2026-06-29

三星Galaxy Watch8用户反馈谷歌后台组件异常

三星GalaxyWatch8、Watch5Pro、Watch6及Watch7用户反映,GooglePlayServices后台耗电异常,电量占比最高达99 97%,远超正常水平,严重影响续航。目前故障原因不明,谷歌尚未发布官方声明。

罗永浩批苹果iOS 27创新不足 盼新CEO改进
科技数码 · 2026-06-29

罗永浩批苹果iOS 27创新不足 盼新CEO改进

罗永浩批评苹果iOS27创新不足,称仅有双iPhone同号、音量分离等数十项细节改进,认为库克时代缺乏突破性创新,股市虽好但消费者只能被迫接受挤牙膏式升级。

年国产车出口710万辆,两家车企销量破百万
科技数码 · 2026-06-29

年国产车出口710万辆,两家车企销量破百万

2025年国产汽车出口总量达710万辆,同比增长21%。奇瑞以134万辆居首,比亚迪105万辆次之,上汽乘用车出口占比60%最高,长城出口51万辆。吉利、长安等主流品牌同步增长,小鹏、零跑等新兴品牌海外拓展加速。