这篇论文是谷歌人工智能量子团队发布的,文章可以用一句话概括:对于QNN,量子几何的独特特征能够明确地防止梯度问题成为量子案例中的好策略,相反它会带你进入贫瘠的高原(barren plateaus)即,随机选择时,高维空间中的任意平滑函数将大概率倾向于采取接近平均值的数值。
通过对这篇论文的阅读,重新熟悉了量子计算方面的基础知识和变分法求解,认识到量子神经网络训练随机参数初始化不适于多个量子比特的情形,在高维空间中,梯度沿着任何合理方向为非零至某个固定精度(高原),都将根据量子比特数量呈指数减少
本文是阅读《Barren plateaus in quantum neural network training landscapes》之后的笔记。
避免在量子环境中出现这些情况的一种方法是使用结构化的初始猜测,另一种方法是使用预训练的方式
作者将其作为一个悬而未决的问题,是否可以通过使用替代的硬件效率分析来解决。
对于嘈杂的中级量子设备的许多实验建议都涉及使用经典的优化循环来训练参数化的量子电路。这种混合量子经典算法在量子模拟、优化和机器学习中得到了广泛的应用。由于其简单性和硬件效率,随机电路经常被提出作为探索量子态空间的初始猜测。
虽然量子硬件的飞速发展推动了算法的发展,使其可以在所谓的“噪声中级量子”(NISQ)机制下运行。现阶段,许多最有前途的面向应用的方法是混合量子经典算法,它们依赖于参数化量子电路的优化。
这些方法对某些类型的错误具有弹性,并且在 相干时间 和 门要求方面 具有很高的灵活性,这都使其对于NISQ实施特别有吸引力。
这种算法的第一个实现是在变分量子求解器的量子模拟背景下开发的
随机电路经常被提出作为探索量子态空间的初始猜测。我们证明了希尔伯特空间的指数维数和梯度估计复杂度使得该选择(随机选择)不适合 运行在多个量子位以上的混合量子经典算法 。具体来说,对于各种合理参数化量子电路,沿任何合理方向的梯度为 零至某个固定精度 的概率,根据量子比特的数量呈指数减小。我们认为这与随机电路的2设计特征有关,因此必须研究该问题的解决方案
即使是在少数轨道上进行随机参数化,同样会导致贫瘠高原的问题
量子观测浓度图。 球体描绘了量子空间中测量浓度的现象:沿任何坐标落在从零开始的固定角度距离之外的状态的比例,随量子比特的数量呈指数下降。
这意味着一个大概率处在平坦的平台,即可观测值集中在Hillbert空间上的平均值以及梯度是呈指数下降的。 只有极小的一个指数衰减的比例在这个波段之外的意味着类似于随机搜索将有呈指数下降的概率离开这个“贫瘠的高原”
量子电路的结构。
a 电路的通用子单元,每一层都有一个参数化元件Ul(θl)和一个非参数化单元Wl。
b 数值实验中使用的一维随机电路。 该电路首先将RY(π/ 4)门应用于所有量子位,然后将指定数量的随机选择的Pauli旋转层应用于每个量子位,然后是受控Z门的一维阶梯。 每层不重复初始RY(π/4)门。 θi,j中的索引i和j分别表示层和量子比特。 对于每一层和量子比特 Pi,j ∈{X,Y,Z}和 θi,j ∈[0,2π)被独立采样。因此,角度数(参数的数量)是量子比特数乘以层数。
方差的指数衰减。 在半对数图上绘制的两个局部Pauli项 的第一电路组件的能量梯度的样本方差作为qubit数量的函数绘制。 如所预测的,对于期望值及其扩展,观察到指数衰减是量子比特数量n的函数。 拟合直线的斜率表示由算子确定的指数衰减
收敛到2-设计极限。在这里,我们表明了两个局域泡利项的第一电路分量的能量梯度的样本方差;在一维量子电路中,不同的线对应于2到24之间所有偶数的量子位,其中2个量子位是最上面的线,其余的由量子比特数排序。 这就是虚线黑线描绘这个哈密顿量的2设计渐近线,由我们的分析结果决定。 这表明第二时刻作为层数的函数的收敛性是由量子比特数决定的固定值。