近年来,人工智能领域的发展速度可谓突飞猛进。回顾2017年,AlphaGo接连击败李世石与柯洁的经典对决仍令人记忆犹新,这场人机大战不仅向世界展示了神经网络卓越的学习与计算能力,也正式拉开了新一代人工智能浪潮的序幕。自那时起,整个技术产业都在朝着更高运算速率、更低能耗的方向不断迈进。
然而,传统电子神经网络正面临一个难以回避的瓶颈——电子器件的物理极限已难以在提升能效与计算速度上取得显著突破。在此背景下,光子神经网络应运而生。作为光电子技术与人工智能交叉融合的产物,它天然具备高带宽、大容量、快速响应等优势,被视为突破传统电子限制的关键技术路径。
当前,光子神经网络的研究主要集中在三种典型架构上:前馈神经网络、循环神经网络(又称储层计算)以及脉冲神经网络。与此同时,该领域也正向实时训练、规模化扩展及特定应用等方向持续推进。
研究现状
1. 前馈神经网络
前馈神经网络的信息传递路径非常直接——数据从输入层单向流向输出层,过程中不存在反馈回路。
(a)

(b)
图1 集成光子干涉计算单元结构与元音识别混淆矩阵。(a)集成光子干涉计算单元结构;(b)元音识别混淆矩阵
2018年,Bagherian团队在光子干涉计算单元芯片基础上,提出了一种时分复用方法。简单来说,该方法通过让芯片分段处理图像卷积运算,进而构建更复杂的卷积神经网络。这一架构后来成功应用于彩色数字识别任务。
2. 循环神经网络(储层计算)
与前馈网络不同,循环神经网络中的信息流动更为复杂:除了前向传播,同层节点之间以及后向反馈环节也持续进行信号传递。
典型的循环神经网络由输入层、隐藏层和输出层构成。训练过程中,通常仅调整输出权重即可使网络收敛。采用光电器件搭建此类网络,主要有串行与并行两种技术路线。
并行方案的优势显而易见——结构直观且计算速度快。2011年Vandoorne团队基于半导体光放大器(SOA)实现的循环网络,以及2016年Bueno团队采用空间光学器件的方案,均属于并行路线的代表。
然而,并行方案也存在明显短板:鲁棒性较差、规模难以扩展、成本相对较高。串行方案则能有效缓解这些问题。2012年,Paquot团队采用光电混合系统率先构建了串行循环神经网络,并成功实现了信号分类功能。
3. 脉冲神经网络
脉冲神经网络(SNNs)的神经元模型更贴近生物神经元的运作方式,因此常被称为第三代人工神经网络。其激活机制极具特色——神经元并非在每次迭代中都产生输出,而是仅在膜电位达到设定阈值时才被激活。
2016年,普林斯顿大学Prucnal小组提出了一种基于可激活石墨烯光纤激光器的脉冲处理系统,结构如图2所示。该系统由掺铒光纤(提供增益)和石墨烯饱和吸收体(提供损耗)组成,1480 nm激光器携带脉冲刺激信号,能够激发出类似LIF(leaky integrate-and-fire)脉冲神经元的响应特性。

图2 可激活的石墨烯光纤激光器系统
到2018年,该小组又推出了基于分布式反馈(DFB)激光器结构的神经拟态光子集成电路(图3),并探讨了构建可编程、可级联光子神经网络的可行性。

图3 集成光子神经元
发展趋势
1. 实时训练算法
由于光子本身难以在系统中长期存储,电子神经网络中常用的反向传播算法很难直接迁移到光子神经网络上。
2018年,Hughes团队首次提出了针对集成光子干涉单元的实时训练算法。其核心思路是:记录光场分布与移相器的相位分布,计算出能够指向收敛方向的梯度值,并据此调整下一轮迭代的相位配置——通过这种闭环调整,芯片整体性能得以逐步收敛。
与此同时,北京邮电大学的Zhang团队在2019年提出了基于遗传算法/粒子群算法的非梯度片上训练方案。该方法无需获取和计算梯度值,从而降低了对器件性能的要求。通过仿真,该团队在Iris数据集和Wine数据集上成功实现了光神经网络的在线训练,收敛效果见图4。

(a)

(b)
图4 (a)采用GA算法训练光神经网络的分类效果; (b)采用PSO算法训练光神经网络的分类效果
相较于电子器件,光电器件实现非线性函数的难度更大,且已有的非线性函数仍存在诸多非理想特性。因此,非线性运算成为光子神经网络发展的又一大挑战。
早在1967年,Seldon团队就提出过利用饱和吸收体或电子模块实现非线性运算,但这种方法难以实现精准控制,且需要将光信号通过光电二极管转换为电信号,反而降低了计算速度。
2019年,Williamson团队提出了一种光电混合的非线性运算模块(图5)。该模块不仅能较为精准地生成非线性激活函数,还能通过改变移相器的相位实现不同激活函数之间的灵活切换。同年,Feldmann团队推出了光控相变存储器(PCM)方案,利用相变材料对不同光强的透光性差异来实现非线性激活函数(图6)。

图5 光电混合非线性模块结构以及通过调谐相位实现不同的非线性函数

图6 光控PCM的归一化传输系数曲线
此外,二维石墨烯材料也被认为是一种颇具潜力的光学激活函数实现方案。
2. 网络规模扩展
光子神经网络的规模化扩展,是另一项棘手挑战。一方面,规模更大的网络能够完成更复杂的任务;另一方面,光子器件本身存在不稳定、难以精细调谐等问题,导致规模越大,实现难度也随之增加。
2018年,Lin团队提出了一种基于衍射的光子深度神经网络(D²NN),有效缓解了这一难题(图7)。其原理是利用光的衍射叠加实现相邻层神经元之间的连接,通过调整不同位置像素块的厚度来改变光的相位差,从而为不同节点分配不同的权重。最后,在特定位置放置光电探测器以获取输出结果。采用该结构,每层节点数可扩展至数百个。

图7 基于衍射的光子深度神经网络结构图
清华大学的陈宏伟课题组则另辟蹊径,提出了一种基于时域拉伸的串行光子神经网络(TS-NN)。该方法利用光纤色散傅里叶变换实现线性矩阵运算,通过“并行转串行”的方式,成功扩展了光电混合全连接神经网络的规模(图8)。

图8 基于时域拉伸的全连接光电神经网络结构
### 3. 应用场景扩展
长期以来,受限于光子神经网络的规模与复杂度,其实际应用场景相对有限。
2012年,Paquot团队利用光纤系统搭建了光电混合循环神经网络,并成功实现了通信信道的均衡——这是光子神经网络在通信领域的首次场景拓展。
2019年,清华大学与北京邮电大学的Yu团队合作,利用光电混合网络构建了一款二值光相干接收机(图9),能够有效恢复发送端的调制信号。其工作流程如下:正交相移键控(QPSK)调制的光信号首先通过广播层进入输入层,再经由二值全光神经网络处理,之后通过光电二极管和模数转换器转换为电信号,最终由电人工神经网络恢复出原始信号。

(a)

(b)

(c)
图9 (a)光电混合二值神经网络架构;(b)单偏振系统二值权重映射结构;(c)偏振复用系统二值权值映射结构
该架构的优势在于:能够缓解电域信号处理压力、降低光接收机整体功耗、提升处理速度。更重要的是,它显著降低了对模数转换器量化位数的要求,从而有效压低了光接收机的成本。
总结
近年来,光子神经网络异军突起,种类日益丰富,被广泛视为突破电子神经网络瓶颈的重要技术方向。凭借光电器件大带宽、低损耗的天然优势,光子神经网络在高速低延迟运算领域展现出巨大潜力。然而,若要在人工智能领域真正实现大规模应用,仍需着力攻克实时训练、非线性激活函数、规模化扩展以及应用落地等核心难题。这些正是决定光子神经网络未来发展的关键所在。
