来源:光明日报
【瞧!我们的前沿科技】
本报上海12月21日电(记者颜维琦)从一句话转换成一张图片,到几分钟内生成一段视频,生成式人工智能正在加速融入现实世界的复杂应用之中。当模型体量不断增大、生成内容的分辨率与丰富度日益提升,其对计算能力与能源消耗的需求也愈发惊人。然而,当前主流的光电芯片仍更擅长处理识别与判断类任务,要真正支撑前沿的大规模生成模型,还有一段不短的路要走。下一代算力光芯片该如何运行这些复杂的生成模型?近日,记者从上海交通大学获悉,该校集成电路学院陈一韫课题组在新一代算力光芯片领域取得重要突破,成功研发出全球首款能支持大规模语义视觉生成模型的全光计算芯片LightGen。此项研究成果已正式发表于国际学术期刊《科学》。
所谓“光计算”,可以通俗地理解为:它并非让电子在晶体管中穿梭,而是让光子在芯片内传递,通过光场的变化来完成复杂运算。光天然具备高速与并行处理的优势,因此长期被视为突破算力与能耗瓶颈的关键方向。然而,要将光计算真正应用于生成式AI,却并非易事:生成模型往往规模庞大,还需在不同数据维度间频繁转换;若芯片规模有限,则不得不在光信号与电信号之间频繁地级联或复用,其速度优势便会被延迟与快速攀升的能耗所抵消。正因如此,实现全光计算显得尤为重要,也更具挑战。
LightGen之所以能实现性能的飞跃,关键在于它在一片芯片上同时攻克了三个领域公认的核心难题:单芯片百万级光学神经元集成、全光维度变换,以及不依赖真值标签的光学生成模型训练算法。这三项突破中的任何一项单独实现,都足以构成重要进展,而LightGen将它们融为一体,使得面向大规模生成任务的全光端到端处理成为可能。
更重要的是,LightGen展示的并非用电来辅助光进行生成,而是让全光芯片完整实现“输入—理解—语义操控—生成”的闭环流程:输入图像进入芯片后,系统能够提取并表征其中的语义信息,并在语义操控下生成全新的媒体数据,真正让光“理解”并“认知”图像内涵。论文实验验证,LightGen可完成高分辨图像语义生成、三维场景生成、高清视频生成及语义调控,同时支持图像去噪、局部与全局特征迁移等多项大规模生成式任务。
业内专家评价,LightGen为新一代算力芯片真正助力前沿人工智能开辟了新路径,也为探索更高速、更高能效的生成式智能计算提供了新的研究方向。
