2021年1月6号,一篇名为《11 TOPS photonic convolutional accelerator for optical neural networks》的论文发表在nature上。这一由徐兴元博士(莫纳什大学)、谭朦曦博士、David Moss教授(斯文本科技大学)等人完成的实验向世人宣告了一个激动人心的成果:由硅基micro-comb芯片搭建的光学神经网络(Optical neural network, ONN)实现了64G波特速率、11TOPS计算速率的高速图像识别。这证明了光子神经网络硬件的运算潜力,并预示着单片集成光电芯片的到来。
电子器件在物理特性和结构特性上正面临着严重的挑战。籍由电子器件的尺寸已经直逼其热力学极限,靠纳米技术进步维持的摩尔定律已经到了难以维系的地步。电子作为最经典的费米子,受到泡利不相容原理的影响,无法在量子轨道上并行存在,换言之,费米子太笨重了,不适合做为高密度信息传递的载体。人们依靠电流大小、电压大小这些电子的广延量实现信息传递,而很少关注电子作为一种德布罗意波的频域信息(强度量信息),电子器件的性能提升因此也体现在对电子数目和电子速度这两个量的优化上。而光子作为一种玻色子完美的补充了上述电子的诸多缺点。玻色子可以在量子尺度上同时存在,人们对光子的研究也不会局限于对其光强这一广延量的研究,而是会将目光对准频率-光强-时间这三维物理量交织下进行的信息传递。换言之,光子作为信息载体在被人们使用的时候,能传递的信息比电子能传递的信息高一个维度。
然而,现代成熟的光纤业务都是基于可见光乃至红外、外红外波段电磁波进行的,意即其波长尺度在亚微米级别。这一现状限制了对光子的进一步集成,过大的波长尺度使得即便有集成波导管工艺,也难以在纳米级别上对光器件进行集成。想要波长短,就得抬高光子的能量,进而对承载高能光子的波导管系统提出了更高的要求。如果能实现对紫外或者X射线频段的光的波导管技术突破(材料上和结构上),那么在分子级别器件的热力学极限上,光子器件将全方面超越电子器件。
算法的输入输出一般都用某一函数来实现,意即:
F ( 输 入 ) = 输 出 F(输入)=输出 F(输入)=输出
其中,具体到F函数时,又往往可将F函数分解为一系列简单函数的复合:
F ( 输 入 ) = F ( G ( H ( 输 入 ) ) + Q ( P ( 输 入 ) ) ) = F ∘ ( G ∘ H + Q ∘ P ) F(输入)=F(G(H(输入))+Q(P(输入)))=F\circ(G\circ H + Q\circ P) F(输入)=F(G(H(输入))+Q(P(输入)))=F∘(G∘H+Q∘P)
而其中的G、H、Q、P算符就可以是由简单算符(如求和算符、求积算符等)通过算符空间中的线性组合来得到,也就是把复杂的算法分解成为一个又一个能用硬件模拟的短小算符。一个已知的算符往往可以分解为更简单的算符的叠加,比如实现求积算符可以用求和算符的迭代来实现。因而硬件模拟的算符越基本,越简单,硬件能实现的算法就越多,算法的可塑性就越大;反之,一个硬件模拟的算符越复杂,硬件就越专一,就越是只能针对特定问题求其特解。
矩阵运算算符是一个在实际生活中中被广泛应用,而又对冯诺依曼结构的电子计算机极不友好的数学算符。基于与非逻辑门的电子结构太基本了,需要堆砌大量的逻辑电路原件才能模拟一个简单的矩阵运算,就像我们用ZF集合论体系,去逻辑证明微积分一样复杂。相比之下,生物神经中枢的结构向我们展示了一个诱人的前景,我们可以基于矩阵运算这一算符本身线性复合出一套算符空间(即基于矩阵运算拟合的硬件构建一个集成芯片),矩阵运算算符作为基本算符之一复合成一种类神经中枢结构的层级网络算符,实现类似人脑能实现的各种独特的功能,且由于硬件直接拟合的就是矩阵算符,避免了靠先拟合基本逻辑算符再复合出矩阵算符的南辕北辙。
实现生物神经细胞算符的器件就被称为神经形态器件,用基于生物细胞算符去复合的层级网络算符就被称为用神经形态器件去搭建神经网络集成电路。这样的实验思路是简单而明了的,生物神经中枢能干成的活,神经网络集成电路就也能干,但遗憾的是,往往生物神经中枢很难干的活,神经网络集成电路去实现也会很艰难。(但是计算机在运算广延量上超越了人类的生理局限)
因而,作为光子的器件,其器件优越性由物理性质决定,而其实现的功能由算法来决定。当我们使用光子作为载体去搭建类似电子的基本逻辑算符器件时,它就是传统冯诺依曼结构的;当我们用光子去实现神经网络算符时,它就变成神经形态结构了。
矩阵运算算符是实现神经形态算法的关键。
说回《11 TOPS photonic convolutional accelerator for optical neural networks》这篇文章,文章作者使用了靠集成孤子微环谐振器(MRR,micro-ring resonator)件产生的Micro-comb(微梳)作为通信信道,通过光电耦合、光波整形、光波色散、光波探测的方式将信号输入输出Micro-comb信道,实现了对矩阵乘法算符的模拟并搭建了基于矩阵乘法算符的神经元的神经网络,把卷积神经网络(CNN,Convolutional Neural Network)这一经典网络成功的搬了上去。
什么是Micro-comb呢?说白了就是小尺度下的光学频率梳(Optical frequency comb ,2005年的诺贝尔奖就给了它)。光学频率梳指一束在频谱上离散等距的光复合而成的一个复色光。因在光谱上离散等距,就像梳子一样,所以这样的复色光被称为光学频率梳。一个光学频率梳可以同时使用不同频谱线的光的光强来传递不同的信息,这样的一束复色光一次传播能携带大量的信息,在现有器件下比用电子实现的信号传输高了三个数量级。光学频率梳产生后在波导管中传播,可以被商业整形器和随机波长发生器调制,也可以被一些实验室中实现了的集成光学器件中被调制。调制的过程就是拿笔书写的过程,将输入输出信号通过整形、光电耦合、色散等方式书写在光学频率梳中,实现可编程的光学运算。总的来讲,目前已经实现集成的功能有环形谐振器和马赫-曾德尔干涉仪滤波器、可调谐延迟元件和波导开关。这些都是实现将输入输出信号上下光信号通道并计算的手段,包括光-光、光-电、电-光,光的频率展开。光-光手段可以籍由波导管的复合或者拓扑组合完成,光-电手段可以由光电探测器完成(光致发电材料),电-光手段可由激光器或整形器完成(电致发光或电致光吸收),光的频率展开可由简单的色散完成(色散效应下的时间延迟或空间弯曲)。截至目前,还没有人将光子计算各部分集成模块整合到单片芯片上。
那么这篇文章里是怎么制备能产生Micro-comb的MRR芯片的呢?Micro-comb所在的波段是可见光-红外波段,尺度在300nm以上。籍由光子的驻波效应,波导管的直径不能比半波长窄,因而单个波导管的尺度在亚微米的级别。在这一尺度上以波导管构成的谐振腔可以以共振的方式让在其中传播的光达到孤子解的状态,起到锁频的作用。通过将数个谐振腔集成,MRR芯片生成了类似于晶体结构一般的光孤子,也就是Micro-combs。
光是一种波,它的动理学与力学运动受几何结构影响,从而由光的波动力学方程,我们可以一窥其独特的孤子解。对光孤子的动态激励和稳定结构可以由 Lugiato–Lefever 方程描述。光孤子解可以由KdV、NLS、Sine—Gordon等模型解出。
记录下来的这些是我日常学习中的想法,主要是想作为朋友与大家分享。有关集成光学或者神经形态器件或者算法的新东西或许会在以后继续就文献跟大家分享?
未来的光子芯片发展方向可能有以下两个方面:一、使用已经被证明了的其他集成光子模块进行彻底的单片光子芯片集成;二、在开发出新的材料和激光的条件下,实现紫外、X光波段的光子集成技术。
器件和算法的进步是实现更复杂人工智能的两个方向。器件模拟算法的数学模型从而实现算法。光子器件的物理性质天然较电子器件有高速和高带宽优势,但人们在光子器件的纳米技术上取得的成果还是太少了。集成光子器件或许是下一代计算机的希望,但与之竞争的候选者也不止一位,比如靠拓扑电子学量子霍尔效应实现的量子计算机是不是下一代取代电子计算机的东西?又或者基于光子拓扑学的器件会不会是下一代取代电子计算机的东西?这些笔者无力看出。摩尔定律终结了,皇冠落地,人们陷入混乱,时代的车轮会滚滚向前,敢问各路豪杰,未来的新皇冠花落谁家?