机器学习方法在量子多体物理中的应用

摘要

机器学习方法近年来在许多不同的领域受到广泛的关注,本文回顾机器学习在量子多体物理中应用中的代表性的例子,着重讨论了机器学习方法对于解决量子多体物理中的“指数墙”困难的可能的潜在意义。此外,量子多体物理中的若干方法和思想反过来可能对理解机器学习领域面临的核心问题有着重要的启发作用。

1  引言

物理世界是由相互作用的多粒子系统组成的,量子多体物理研究这种相互作用系统的新奇量子关联效应及其物理机理,是高温超导、量子霍尔效应、量子磁性等凝聚态物理前沿领域中的核心问题,在量子控制和量子信息、超冷原子物理、原子核物理与格点规范场等领域的发展中起着至关重要的作用。系统的希尔伯特空间维度会随着系统尺度增加指数发散,这为量子关联系统尤其是强关联系统的量子多体波函数的描述以及相关物理量的计算带来了本质性的困难,此即是所谓的“指数墙”困难。针对这一困难,人们也做了不少工作,但是各自还存在其局限性。例如,针对低维的强关系系统,人们设计了密度矩阵重整化群方法来研究这一系统的基态和低能激发态的性质,但是难以推广到高维。针对另一类强关联问题,如相互作用的玻色子系统或没有阻挫的量子磁性系统,物理学家借鉴经典统计物理中蒙特卡洛方法中重要的抽样思想,发展了量子蒙特卡洛方法,用以研究这类系统的基态和热力学平衡性质。但是在高温超导等领域用此方法会导致负符号问题。一种好的量子多体计算方法是能够从具有指数多信息的多体波函数中,利用系统本身所具有的某些特性,提取少量的人们关心的物理量,如能量、关联函数、序参量等重要信息的方法。

2 机器学习算法介绍

主要介绍了人工神经网络的前馈神经网络。一个人工神经网络本质上可以看成一个函数拟合器。

3 机器学习在量子多体物理中的应用

量子多体物理的研究对象是大量微观粒子的集体行为,即从巨量的信息(每个粒子的微光状态,或量子多体波函数)中提取出关键的特征量,即物理可观测量(序参量、关联函数、能量等)。量子多体物理面临的最大可困难是待处理系统的信息量(希尔伯特空间维数)会随着系统尺寸指数发散。

3.1 训练机器学会区分物质的不同量子或经典相

凝聚态物理的研究对象是物质的相和相变。在热力学极限下,不同的相一般具有不同的自发对称破缺,通过相应的序参量来刻画。这些序参量可以反映出数据共性的物理量,从而刻画出多体关联系统的宏观行为。机器学习具有一定的泛化能力,能将从某个系统中学到的知识应用到一个全新的系统中。例如二维铁磁Ising模型,先对二维正方格点上的Ising模型进行训练,机器会自动抽取出自发磁化这一概念作为序参量来区分铁磁相和高温顺磁相。训练后用到三角格点上任然有用。对非平庸的拓扑量子态不能用局域的序参量来刻画,物理学家希望能通过机器学习学会这些非局域的拓扑信息,包括拓扑量子数等。这些都是监督学习,也又无监督学习应用的探索,根据数据本身隐含的结构,按照一定的方法对它们进行自动分类,如主成分分析方法能够将属于不同相的态空间中的点自动分开,并从中自动得出自发磁化这一物理概念。这类基于无监督学习的机器学习方法本质上是一种空间降维的方法,有望被用来发现新的物质态。

3.2 加速现有粒子多体算法和发现新算法

推荐系统深入到电子商务和人类生活的方方面面,比如购物网站会对用户的购物历史记录进行建模,并推荐给用户更多可能感兴趣的产品。在量子蒙特卡洛中,要对不同的蒙特卡洛构型按照其重要性进行随机抽样,然而对于许多困难的量子多体问题,生成样本的效率往往很低。可以用推荐系统的思想对样本进行推荐,提高蒙特卡洛抽样的效率。物理学家将机器学习方法与经典蒙特卡洛方法相结合,发现机器可以重新“发明”出蒙特卡洛中的“团簇更新”的算法,甚至能发现尚未被人类发明的高效更新算法。

机器学习方法在算法上的另一个例子是密度泛函理论。该理论从理论上避免了处理量子多体波函数,而将基态电子密度放在核心地位。原则上存在一个唯一且普适的密度泛函。密度泛函中包含了能动泛函和交换关联泛函。因此可以想到用机器学习方法来拟合密度泛函的想法。具体地可以分别拟合动能泛函与交换关联泛函。由于动能泛函只涉及到求解不同外势场下的无相互作用问题,一个准确的动能泛函允许人们开展纯粹基于密度的“无轨道”密度泛函理论的计算(Orbital free DFT),从而很好的优化寻找材料的速度。

机器学习方法的另一个重要应用在材料的发现与设计。在传统的第一性原理材料计算中,人们通过求解薛定谔方程,建立了材料微观结构(多体哈密顿量)与宏观(热、力、电学等)性质的对应关系,但是这一过程往往会耗费大量的计算资源。通过对大量材料的微观组成结构与材料宏观性质的数据库,通过机器学习模拟函数,就可以得到从微观结构到宏观性质这一函数的近似形式,不用求解薛定谔方程。

3.3  为量子多体波函数提供一种新的描述

任意一个人工神经网络可以看成一个变分波函数,输入是基,输出是波函数在这个基上的投影。通过调节网络参数,希望该波函数可以逼近精确的基态波函数。例如通过限制玻尔兹曼机作为变分波函数,求解集中典型的量子磁性模型的基态。但是阻挫磁性系统和相互作用费米子系统仍然是一个未解之谜。

4 多体物理在机器学习中的应用

现在的机器学习过程很多时候都是当作一个“黑箱作业”。对于机器学习方法成功运用的例子,成功的原因是什么?如何将这种成功推广到类似的问题中?对于失败的例子,为什么会失败?如何系统地进行改进?物理学家试图从物理学的角度对这些问题给出答案。例如,从统计物理学的角度,物理学家发现机器学习方法和重整化群方法可能存在某种深刻的联系。重整化方法是统计物理中研究相变点附近临界行为的重要手段,通过对系统不断地做标度变换和重整化,抽取出反映相变点附近普适行为的重要物理量,即临界指数。其他方面的重要应用还包括:从量子纠缠的角度重新阐述神经网络的结构;将量子多体方法如矩阵乘积态直接用到图像识别等机器学习中的重要问题上。

参考原文:
[1]蔡子.机器学习方法在量子多体物理中的应用[J].物理,2017,46(09):590-596.

你可能感兴趣的:(机器学习)