机器学习 是计算机按照人们赋予的特定方法按照人们的思维方式解决特定的问题,主要在大数据库中训练找到知识规律,建立学习模型,通过验证集对新数据进行分析,已达到预测的目的。机器学习是实现任务的手段,神经网络是实现机器学习的一种方法,深度学习是是指多层神经网络上运用各种机器学习算法解决各种问题的算法集合。深度学习是深层的神经网络。其计算结构由人的神经网络启发,由此提出神经网络的实现方法,其在发展过程中主要经历了三次兴起。
1958年Rosenblatt提出两层神经网络的感知机,引发了神经网络的第一次学习,1969年Minsky指出感知机分类能力及其有限,神经网络发展停滞进入了AI寒冬,1986年Hinton提出了一种反向传播算法从而引起了神经网络的第二次兴起,1995年支持向量机的出现,其优势明显高于神经网络,神经网络进入第二次寒冬,直至2006年Hinton通过努力使神经网络计算效率大幅度提升,2012年用多层神经网络在图像识别上取得很好的效果,充分证明了多层神经网络的优越性,至此深度学习得以提出,神经网络进入了第三次兴起。
地震反演技术从方法的实现来分的话,可以分成线性反演和非线性反演两大类,而它们又可以归结为求目标函数的极值问题,即最优化问题。线性反演包含的是一个极值,而非线性反演的目标函数包含的是众多极值。根据科学工作者的研究发现,地球物理问题在很多情况下就是多极值的最优化问题,如速度或波阻抗的递推计算、吸收系数的提取、地震子波的估计、孔隙度以及压力参数计算等。20世纪80年代,由于大部分地球物理反演问题属于多参数、多极值的非线性优化反演问题,各种线性反演技术遇到了难于逾越的障碍和困难,以神经网络为基础的非线性智能反演技术给地球物理学家希望。
BP神经网络是一种误差反向传播的多层前馈人工神经网络,于1986由Rumelhart和 Mcclelland提出。它具有三层结构,分别是输入层、隐含层和输出层,每一层都由一个或多个神经元组成
1993年于建华是国内将BP算法应用到地球物理的第一人。2010年,曹琳昱 提出将基于粒子群优化的BP神经网络技术应用到地震属性 融合中,同时提出基于全局随机优化思想的粒子群优化算法,对BP神经网络的初始权值和阈值进行了优化,以求解决BP神经网络对初始值敏感、易陷入局部极小值的问题。BP神经网络的缺点是,容易陷入局部极小值,对于反演不稳定,并且不适合大的多个数据样本。但可通过和其他的方法结合使用来解决问题。
模拟退火法最早由Kripatrick于1983年提出,是以优化问题的求解与物体退火过程的相似性为基础,利用Metropolis算法,并用温度更新函数适当控制温度的下降过程实现模拟退火,从而达到求解全局优化问题的目的。模拟退火计算的速度很慢,为了解决这个问题,在模拟退火的基础上,Szu和Ingber进行了改进,提出了快速模拟退火算法(VFSA),其拥有快速收敛的特性。
模拟退火是找能量全局最小的参数,这与地震反演寻找目标函数的最优解类似。Rothman 最先提出了利用模拟退火方法,解决反演难度较大的自动剩余静校正问题。1991年,Vasudevan 通过引入一个优化函数来处理地震数据分析中的剩余静力学问题。1996年,Jervis基于快速模拟退火和遗传算法进行层状介质反演。 Misra 在2008年利用基于模拟退火的全局优化方案研究基于边界保护的叠前AVO反演,同时向同行人展示了该算法的较好的应用前景。国内,路鹏飞 (2008)等将快速模拟退火算法应用于叠前反演中,进行地层泊松比、级波速度及密度的反演,结果表明,快速模拟退火算法加快了模拟退火算法的收敛速度,反演精度也有所提高。刘全新 (2010)利用模拟退火算法实现了叠前同步反演的技术流程并重点介绍了其在砂岩含气储层中的应用效果。
遗传算法起源于对生物系统所进行的计算机模拟研究,是一种基于达尔文的遗传选择和自然淘汰的生物进化论的计算模式。它是由美国Michigan 大学的Holland教授及其学生首先提出的。1967年,他的学生Bagley在其博士论文中首次提出“遗传算法”( genetic algorithms)一词。70年代初, Holland 提出了遗传算法的基本定理——模式定理( Schema Theorem) ,从而奠定了遗传算法研究的理论基础。
遗传算法是一种自适应的、全局优化的概率搜索方法,其依据自然遗传学机制进行组合交叉和变异操作,通过优胜劣汰生成新的种群来替代原始种群,最终得到最优解。物种是通过演化和寻优,从低等进化为高等,这一现象与在特定模型空间寻找最优解的反演过程是相似的。因此,作为非线性反演方法的主要方法之一,遗传算法被广泛应用于地球物理反演中。
Stoffa (1991)率先提出利用遗传算法进行地震波形的非线性多参数反演。随后Mallick (1995)应用遗传算法求解AVO反演问题,陶春辉于1993年应用遗传算法反演波阻抗,张厚柱用遗传算法反演层速度。1996年,Boschetti 利用遗传算法反演地震折射数据,对高维度的数据分析进行了研究说明。2014年张生强 首次提出了基于BISQ机制的裂缝孔隙介质储层参数全波形反演方法,并引入了最小二乘原理和小生境遗传算法,通过和基本的遗传算法对比,得出基于小生境遗传算法的裂缝孔隙介质储层参数反演是稳定收敛的,且收敛速度更快、反演精度更高。
遗传算法的优点在于:不依赖于初始摸型的选择、具有自组织性、良好的全局捜索能力、并且在反演过程中不用计算雅克比偏导数矩阵。另外,随着并行计算的出现,由于遗传算法具有并行性,因此该算法将会得到越来越广泛的研巧和应用。
粒子群算法 (PSO) 模拟鸟群飞行觅食的行为 , 通过鸟之间的集体协作使群体达到最优。PSO的优势在于简单容易实现并且没有许多参数需要调整,而且由于其收敛速度快,编程简单而被应用于地球物理反演中。
易远元 ,2007年提出了地震波阻抗反演的粒子群算法实现方法;聂茹 (2010)等用免疫粒子群算法实现了地震波阻抗反演;严哲 (2010)率先利用量子行为的粒子群算法实现叠前AVO反演;朱童 (2012)考虑到粒子位置间的相互影响,提出一种并行的粒子群优化算法,该算法能有效的用于弹性波波动方程及弹性参数的反演中;刘立峰 等在2014年将Zeoppritz方程重新表示为更适用于粒子群算法的新方程,然后将该方法用于海洋地震数据,取得了较好的反演结果。
每种智能算法都拥有其优点,同时还存在相应的缺点,若把他们结合在一起是否会解决我们遇到的难题?
1993年,Porsani(1993)等提出了将遗传算法与线性反演方法结合进行地震反演。方中于 (2017)对基本遗传算法进行了自适应改进,然后将改进遗传算法与粒子群算法相结合,发展了遗传—粒子群算法混合的 GA-PSO协同进化智能优化算法。为提高地震波阻抗反演的精度, 刘玉敏 (2018)等提出了一种结合了混沌和遗传思想的混合粒子群算法。谢玮 (2019)提出了基于粒子群优化最小二乘支持向量机的裂缝识别新方法。
深度学习是是指多层神经网络上运用各种机器学习算法解决各种问题的算法集合。深度学习是深层的神经网络。深度学习较之此前发展的其他机器学习算法的主要特点是,能够进行“抽象概念”的机器“提炼、表达”,也即具有知识学习和发现对象内秉特征的能力。
2016年,曹俊兴及其带领的团队进行深度学习在地震勘探上的研究,并提出基于地震纹特征的天然气储层识别技术,探索利用地震数据深度学习进行深层天然气储层预测的思路;Li(2016)基于深度信念网络进行地层岩性的识别;Araya-Polo(2017) 利用深度学习提出不进行地震数据处理的断层识别技术;Huang(2017)将卷积神经网络和传统的机器学习结合开发了用于地震属性识别的平台;付超(2018)等利用纵波与转换横波在油气储层敏感度上存在的差异,提出了卷积神经网络与支持向量机方法(SVM)相结合的多波地震油气储层分布预测的深度学习法。
Vapnik(1995)基于统计学习理论和结构风险最小原理,提出了支持向量机(Support Vector Machine, SVM)机器学习方法。该方法在小样本集的条件下,通过寻求学习精度与学习函数复杂性之间的折中,克服了过拟合问题,获得了较强的泛化能力。可以用来解决非线性的分类、回归等问题。支持向量机方法首先通过非线性函数,把低维的样本数据转换到高维空间;然后在高维空间中求解二次规划问题;最终在高维空间中构建分类决策函数或回归估计函数,巧妙地解决了维数问题。从理论来讲,通过该方法可以得到全局最优解,避免了 BP神经网络的局部极值问题。
2008年,石广仁 就支持向量机在裂缝预测及含气性评价应用进行分析研究,指出了SVM的优越性;邴萍萍 (2012)等基于向量机提出一种新的AVO非线性反演技术,具有反演速度快稳定性好等优点;Wang (2014)等将支持向量机的方法应用于识别沉积微相和页岩岩相类型,具有较高的准确率。边会媛 (2014)利用支持向量机进行致密砂岩储层含气性识别;宋超 (2015)等提出在只依靠地震数据的条件下,使用支持向量机法进行的砂岩中流体的识别;Yuan (2018)等研究了基于机器学习技术的储层多属性参数提取方法,将支持向量机用于页岩气脆性参数估计;Zhao (2018)研究了基于无监督学习方法的地震相分类技术,并做出了比较;贾云娇 (2019)提取多种 AVO属性和组合因子的基础上,利用近似支持向量机进行机器学习,以提高流体识别的精度。
展望
随着油气勘探技术的发展及复杂油气藏勘探的需要,近年来基于叠前地震数据的AVO反演成为地震油气勘探研究中的焦点。因为叠前AVO反演可以通过对纵横波速度及密度的反演获得储层特征参数,如孔隙度、含油饱和度等,其使得地震解释从定性解释发展到定量解释,因而,叠前AVO反演成为地震反演中的新生力量。智能算法的出现给该研究该来了福音。就传统的算法而言,如何提高鲁棒性和泛化能力是关键,传统算法的混合是克服各自缺陷的一个思路。深度学习作为进年来发展的技术,其主要优势在于发现内禀性质,总结其数据背后的规律,而其数据特征的解释仍然是一个非常重要研究内容。深度学习的发展还在继续,还有很多算法和训练模型并没有应用到我们的地震勘探中,结合不同的算法,得到很高的识别精度是方向。
模拟退火算法:计算过程简单通用;鲁棒性强;可用于并行处理;可用于复杂非线性问题求解。但是收敛速度慢,执行时间长,算法性能与初始值有关及参数敏感等。
遗传算法:具有较强的全局寻优能力;易实现并行化;具有较强通用性;具有自组织、自学习和学习性;具有较强的扩展性,容易与其他算法相结合。但是存在过早收敛,易陷入局部最优解的情况。
粒子群算法:计算速度快,具有稳定的收敛性,具有记忆能力。局部搜索能力较差,搜索精度不高,易进入局部最优。
BP神经网络:具有较强的的非线性映射能力,高度自学习和自适应的能力。将学习成果应用于新知识的能力,一定的容错能力。容易陷入局部极小值,对于反演不稳定,并且不适合大的多个数据样本,收敛速度很慢。
支持向量机:有优秀的泛化能力。可以得到全局最优解,避免了“维数灾难”,简化了分类和回归问题,算法简单且具有较好的鲁棒性 。对大规模训练样本难以实施,对参数和核函数选择敏感,解决多分类问题困难。