新华社上海12月19日电(记者陈潇雨)今天,上海交通大学的科研团队取得了一项重大突破:他们成功研发出全球首款能够全面支持大规模语义媒体生成模型的全光计算芯片。这一杰出成果已正式发表在12月19日的《科学》杂志上。
随着深度神经网络和大规模生成模型的迅猛发展,对超高算力和能耗的需求日益增长,传统芯片架构的性能提升速度已明显乏力。正因如此,光计算等新型架构受到了业界的广泛关注。
“光计算,可以简单理解为:它不再依赖电子在晶体管中运行,而是让光在芯片中传播,利用光场的变化完成计算任务。”论文作者、上海交大集成电路学院助理教授陈一昀解释道,“光天然具备高速和并行处理的优势,因此被视为突破算力与能耗瓶颈的重要方向。”他同时指出,将光计算真正应用于生成式AI并非易事——现有的全光计算芯片大多局限于小规模、分类任务,而光电级联或复用又会严重制约其运算速度。如何让下一代算力光芯片高效运行复杂的生成模型,这是全球智能计算领域公认的技术难题。
陈一昀课题组此次提出并实现了全光大规模语义生成芯片LightGen。采用极其严苛的算力评价标准进行实测表明:即便搭配性能相对滞后的输入设备,LightGen仍能取得相比顶尖数字芯片高出2个数量级的算力与能效提升。团队表示,LightGen之所以能实现性能飞跃,关键在于它在一枚芯片上同时突破了三大瓶颈:单片集成了百万级光学神经元,实现了全光维度转换,并开发出不依赖真值的光学生成模型训练算法。这使得面向大规模生成任务的全光端到端计算成为现实。
据介绍,LightGen能够完整实现“输入—理解—语义操控—生成”的闭环,可完成高分辨率(≥512×512)图像语义生成、3D场景生成(NeRF)、高清视频生成及语义调控,同时支持去噪、局部与全局特征迁移等多项大规模生成式任务。
“LightGen为新一代光计算芯片助力前沿人工智能开辟了新路径,也为探索更高速、更高能效的生成式智能计算提供了新的研究方向。”陈一昀表示。(完)
