12月19日,上海交通大学传来科研捷报:该校研究人员在新一代光计算芯片领域取得关键突破,成功研制出全球首款能够支持大规模生成式人工智能模型的全光计算芯片。这一里程碑成果于12月19日发表在《科学》杂志上。
据悉,随着深度学习和大语言模型对算力与能效的需求不断飙升,传统电子芯片架构的性能提升已难以跟上步伐,面临严峻瓶颈。光计算等新型计算架构因其潜在的高速度、高并行与低功耗特性,正成为全球学界与产业界关注的焦点。
“光计算的核心原理,是利用光在芯片中的传播与干涉来完成信息处理,而非依赖电子的移动。光本身具有极高的传播速度和天然的并行性,被视为突破当前算力与能效困境的重要技术路径。”论文作者之一、上海交通大学集成电路学院助理教授陈一昀解释。她同时指出,将光计算真正应用于生成式AI并非易事,现有全光计算芯片多局限于小规模、分类任务,若进行光电级联或复用设计,又会严重制约其运算速度。因此,如何让下一代光芯片能够高效运行复杂的生成模型,是全球智能计算领域公认的技术难题。
陈一昀课题组此次提出的全光大规模生成芯片LightGen,正是在这一难题上实现了跨越。团队采用了极其严苛的算力能效测评标准,实测结果表明:即便搭配性能相对滞后的输入设备,LightGen芯片依然能取得相比顶级数字芯片高出两个数量级的算力与能效提升。
研究团队表示,LightGen芯片性能之所以能实现飞跃,关键在于它在单枚芯片上同时攻克了三大技术瓶颈:“单芯片百万级光学神经元集成”、“全光高维张量转换”以及“不依赖真值判定的光学生成模型训练算法”。这些突破使得面向大规模生成任务的全光端到端计算成为现实。
据介绍,LightGen能够完整实现“输入-理解-语义操控-生成”的闭环,可完成高分辨率图像语义生成、三维场景重建、高清视频生成及语义编辑等多种任务,同时支持去噪、局部与全局特征迁移等多项大规模生成式应用。
“LightGen为新一代光计算芯片助力前沿人工智能发展开辟了新途径,也为探索更高速度、更高能效的生成式计算提供了全新的研究方向。”陈一昀总结道。 (新华社)
