在油气聚集地区,其下往往含有巨大的盐岩沉积物,这些盐岩沉积物与围岩沉积物存在着显著的密度差异,在上覆地层的压力之下,盐体(是一种力学性质较轻的岩石)产生塑性流动。由于承受不均匀的上覆地层负荷,盐体向低压地区流动,改变上覆地层产状,形成构造油气藏。因此对盐体进行精确成像具有重大意义。但盐体的这种复杂性质也给成像带来了挑战。
建立高质量的速度模型对成功的盐下成像起着重要作用。而全波形反演(FWI)是一种可建立高分辨率速度模型的技术,他的核心思想是借助地震波形包含的丰富信息,利用观测到的数据和模拟数据的最优匹配进行地下介质模型的重构。它有助于改善反演速度模型中的盐定义。反演的成功在很大程度上取决于对盐的先验知识(这些知识是预先存在的,并且独立于学习算法,与通常的训练数据分开),以及使用具有长偏移和低频率的先进采集技术。
业界建立盐速度模型的传统方法是:"从上到下"的工作流程,包括多步成像和人工挑选盐的边界。该工作流程如下:
step1:首先利用层析成像和浅水潜波FWI建立最佳沉积物速度。
step2:然后从地震图像中选取盐的顶部(ToS),即以淹没盐的深度这一速度。
step3:再进行另一个成像过程,选取盐的底部(BoS),并在推测正确的盐底深度解除盐速。
在复杂的模型中,工作流程往往需要多次重复淹没-解淹没(递归选取盐的顶部和底部),并测试不同的场景。虽然这种方法通常能提供令人满意的结果,但耗时且容易出错,因为这在很大程度上取决于解译人员的技能。这种工作流程之后有时还要进行FWI,以纠正对盐体的错误选取,尤其是在选取盐底(BoS)时。
所以许多研究建议,在构建盐体后,使用长偏移和低频率进行FWI,以纠正错误解释的边界。
因为盐体的复杂构造从而导致传播波的大部分能量会从盐体表面反射回来,导致盐下沉积物的照明不足。即ToS处的散射能量较高,而BoS处缺乏光照,因此淹没步骤比未淹没步骤要容易得多(?)。此外,FWI可以在没有任何人工干预的情况下开发ToS,并可进一步用于自动洪泛。
因此,在这里,我们只关注未淹没问题,并假设盐淹没已正确实施。我们的工作主要集中在两个方面:1)在正确的深度解盐;2)在解盐过程中降低对低频和长偏移的要求。后者是通过获取盐下速度的近似值来实现的。
我们建议在淹没模型上应用FWI,然后使用回归框架中的U-net架构自动解淹没。网络的任务是解除盐的淹没,并预测盐下速度的近似值。
本文将重点放在利用深度学习工具自动检测 BoS 上。步骤如下:
step1:我们特别生成了许多随机的一维模型(包含或不包含盐体),并计算了相应的炮检集/射线记录。
step2:我们从这些模型的盐淹没版本开始使用 FWI 反演它们的速度,反演结果成为神经网络的输入,而相应的真实一维模型则是输出。
step3:以回归方式对网络进行训练,以检测BoS并估算盐下速度。
step4:我们分析了创建训练数据集的三种情况,并测试了它们在二维 BP 2004 盐模型上的性能。
结果表明,当网络成功估算出盐下速度时,对低频和长偏移的要求在一定程度上得到了缓解。
总的来说,这项研究使我们能够将自顶向下的方法与FWI相结合,节省了BoS的选择时间,并使FWI能够在数据中没有低频和长偏移的情况下收敛。
论文的流程如下。首先,将从FWI理论的概述和建立盐模型的挑战开始。然后,将演示解盐方法,并提供有关网络以及如何创建训练数据集的更多细节。之后,将在BP 2004 salt模型的左侧部分进行不同的实验并分析它们的性能。
传统的全波形反演(FWI)以L2范数作为目标函数,直接匹配观测数据()与从模型m获得的合成地震数据()的差的平方(L2范数)。利用伴随状态法计算梯度,沿着梯度下降的方向迭代更新地下介质的模型参数。目标函数由以下公式给出:
(1)
尽管FWI在许多实地数据集上取得了成功,但它仍然面临许多挑战。如FWI是基于与单散射假设相对应的线性化更新(也称为Born/玻恩近似),因此模型扰动有限(?)。所以FWI无法使用较差的初始模型重建模型。
以L2范数为目标函数的FWI方法具有高度非线性特征,且反演过程中为了减小计算量通常使用局部优化算法,当初始模型较差时,反演容易遇到周期跳变(cycle skipping)问题,无法获得准确的反演结果。当观测数据和合成数据之间的差值超过半个周期时,就会出现跳周期问题,从而导致FWI陷入局部最小值。
此外实际地震资料中往往缺乏低频信息,并含有一定强度的噪声,也会使得目标函数在反演过程中陷入局部极小值,影响反演结果的准确度。
在低频下,倾向于更凸,局部极小值更少。为确保稳定收敛,解决周期跳跃问题,通常从一个良好的初始模型开始,并采用多尺度方法对从低到高的连续频率带进行反演。多尺度策略意味着从低频数据开始反演,然后逐渐引入高频数据。低频通常会形成模型中包含大规模变化的低波数分量,在反演中加入较高频率将产生高分辨率细节。在许多情况下,地震数据缺乏有效建立模型低波数成分所需的低频和宽偏移,导致FWI的收敛不稳定,尤其是在复杂模型中。
为了缓解FWI的局限性,也有许多研究建议使用更稳健的目标函数,这些函数对周期跳跃更敏感。还有一些人建议在反演中加入一些地质知识作为正则化或约束条件。常用的正则化方法之一是全变分(TV)。
首先引入图像处理中的全变分去噪(Total Variation Denoising),全变分去噪的优点是既能去除噪声,又能保留图像中的边界等信息。其基本思想是,如果图像的细节有很多高频信息(如尖刺、噪点等),那么整幅图像的梯度幅值之和(全变分)是比较大的,如果能够使整幅图像的梯度积分之和降低,就达到了去噪的目的。
全变分(Total variation),也称为全变差,是图象复原中常用的一个名词。全变分TV可以保留地层的尖锐边缘。(TV)正则化的写法为
(2)
由于TV是非二次方程,其梯度具有奇异性/奇点,因此需要添加一个小数来稳定问题。TV这个数值表示的是一个图像的平滑程度,通常,TV值越小,平滑度越高,可以想象,一张每个像素点值都相同的图像,即这张图像没有任何起伏,其全变分为0。
然而在盐区,如果初始模型中没有盐体、频率较低且偏移较长,则使用FWI建立速度模型是不可行的,因为初始模型中盐体的缺失将不可避免地导致FWI产生跳循环解。FWI最多能构建出盐后沉积物和ToS边界,但通常会产生较差的盐下层信息,包括BoS。
因此,传统的做法是通过自上而下的工作流程将盐边界(ToS和BoS)纳入初始模型,然后再进行低频和长偏移的FWI反演。更先进的方法是基于FWI可以捕捉ToS这一事实,从而实现自动淹没。然而,如果频率不够低,偏移不够长,这些方法就无法检测到BoS,因此仍需要人工干预来控制泛洪量。
基于上面的情况,这篇论文提供了一种在低频缺失和偏移有限的挑战性情况下 反演盐下速度的方法。
我们假设盐后沉积物被很好地回收,并且ToS也正确无误被选择用于淹没;因此,我们的主要关注点是检测BoS,并为盐下沉积物提供良好的预测。
在盐反演中,FWI通常与TV正则化相结合,以保持盐边界的尖锐边缘。将FWI(方程1)和TV(方程2)应用于淹没模型得出:
(3)
这里是平衡两个范数贡献的系数。最小化目标函数会揭示BoS的一些特征,例如BoS深度处的速度急剧下降。这些特征(速度下降)可以使用神经网络自动捕捉,以便解除BoS处的盐层。 如果以回归方式训练网络,则网络将估计盐下速度,从而在接下来的FWI中实现更好的反演效果。具有良好的初始盐下速度减少了使用长偏移和低频的要求。我们在图1中说明了这个工作流程。
图1:所提出方法的工作流程。从淹没模型开始,我们使用FWI和TV进行处理。然后,网络将解除模型的淹没状态。最后,实现了另一个FWI对模型进行微调。
为了去除盐的影响,我们采用了U-net架构作为我们的神经网络。U-net通常用于分割任务,并作为分类器广泛用于盐检测。它由对称的编码器块和解码器组成,编码器块在提取特征的同时压缩输入的大小,解码器块用于恢复大小。通常U-net应用于2D图像。在这里,我们通过使用一维卷积层而不是2D来修改结构以接受1D输入。
该网络如图2所示。它由四个编码器和四个解码器块组成。蓝/灰色框表示 feature map;红色箭头表示卷积组合操作,用于特征提取,包含两个卷积层,Relu激活函数,批归一化。灰色箭头表示 skip-connection,用于特征融合。黄色朝下的箭头表示最大池化操作,用于降低维度。黄色朝上的箭头表示上采样upsample,用于恢复维度。绿色箭头表示在最后一层应用sigmoid激活函数来产生输出。典型的U-net在编码器中具有数量增加的信道,而在解码器中具有数量减少2倍的信道。这项工作中使用的通道数分别为16、32、64、128和256。
图2:一维 U-net架构
网络的输入由两个通道组成:淹没模型的FWI结果(即方程3的解: 将FWI和TV应用于淹没模型得出)和 用于反演的初始模型。通过使用初始模型的信息,将初始模型包含在输入中会影响不含盐区域的预测(?)。网络的输出将是未淹没模型。未淹没过程可以表示为:
(4)
其中代表了淹没模型的FWI反演,表示网络。
对于训练,我们使用真实模型作为我们的目标。通过最小化均方误差(MSE)损失来训练网络:
(5)
其中N表示批量大小。与通常用于分类的交叉熵损失不同,他只能捕获盐边界,而MSE还将近似于盐下速度。
训练网络需要庞大而多样的数据集来覆盖应用程序中的所有可能场景。我们网络的输入是FWI结果;因此,我们将需要在各种合理的模型上实现许多FWI。因此,我们将训练重点放在一维模型上,即FWI需要对单次采集进行建模。考虑到淹没和未淹没通常是沿着垂直方向处理的。此外,在1D模型中,可以通过横向叠加梯度来计算梯度,这模拟了全褶皱覆盖效果。
我们创建了8000个随机分层模型,其中至少有五层。为了模拟海洋设置,模型从1.5km/s的水流速度开始,通常随着深度的增加而增加。我们随机平滑了几个剖面,以增加训练样本的多样性。然后,将盐层以4.5km/s的速度随机添加到一些样本中。盐的厚度和位置也是随机确定的。留下一些不含盐体的样本,让网络学会区分含盐和不含盐的剖面。
为了将FWI与TV一起应用于生成的模型,我们使用8Hz主频的Ricker子波为每个模型合成一次震波源。由于我们假设岩盐后模型是已知的,因此我们使用真实模型作为我们FWI的初始模型,除了盐层以下,在那里我们淹没盐层速度。然后将反演结果用于训练网络。
图3:BP 2004盐模型的左侧部分。
我们在BP 2004基准模型的左侧部分测试了所提出的方法,如图3所示。我们将BP模型下采样到其原始大小的一半,同时保持原始纵横比。我们使用恒定密度波动方程来模拟表面上相隔70m的200个炮点。
图4:(a) 用于模拟BP模型数据的Ricker子波,(b) 它的频率内容。注意到低频率是缺失的。
目标地震数据的最大偏移量高达5km,最小频率为5Hz,但这通常不适合用于矫正被淹没的盐下层(why?)。使用主频为8Hz的Ricker子波作为源(图4(a))。采用截止频率为5Hz的高通巴特沃斯滤波器来去除低频。子波的频谱如图4(b)所示。
图5:(a)0 km位置震源的炮检集和(b)其平均光谱。我们可以看到,数据缺少低频率。
拖缆的最大偏移量为5km,接收器间距为20m。图5(a)和5(b)分别显示了从位于0km处的震源获得的炮道集及其平均频谱。该频谱进一步表明数据缺少低频。
图6:(a)在FWI中用作初始模型的淹没BP模型,(b)是反演结果。由于缺乏低频和使用短偏移,FWI未能成功反演盐下速度。然而,我们可以观察到BoS现在可以很容易被识别,如白色箭头所示。
然后我们在图6(a)所示模型的淹没版本进行了带有TV的FWI。这种反演是使用数据的所有可用频率来实现的,没有使用多尺度方法,因为目的是获得BoS的印记。 图6(b)显示了反演结果。正如预期的那样,FWI无法校正盐下速度。然而,我们可以看到BoS的特征,如白色箭头所示。
我们做了三个实验。三个实验之间的区别在于训练数据集。上一节提供了生成训练数据集的一般属性。改变速度模型的平均值和范围会对性能产生很大影响。表1 说明了三个实验之间的主要差异。在第一个实验中,数据是在上述准随机模型中创建的。在第二个实验中,我们在训练数据集中包括了BP模型的一些特征,如水深、最大泥沙流速和流速随深度的快速增加。为了在第三个实验中创建训练数据,我们使用BP速度的平均深度值(不包括盐)作为背景。
实验一 | 数据是任意创建的,没有关于目标BP模型的地质知识 |
实验二 | 对一些特征进行了修改,以更好地匹配BP模型,如水深和沉积物的最大速度 |
实验三 | 在创建训练数据集时,沉积物的平均速度(不包括盐)被用作一般趋势 |
表1:三个实验之间的差异
图7:三个实验的损失和R2分数。每一列显示了一个实验的损失和R2分数,从第一个实验到第三个实验。batch_size=32,epochs=100
所有实验的训练超参数是相同的。数据被划分为80%用于训练,20%用于验证。当验证达到平稳状态时,我们开始使用0.1的学习率进行训练,学习率会下降。我们使用32个样本的批量大小对100个epochs进行训练。我们观察到所有实验的训练收敛行为相似,如图7第一行所示的损失曲线所示。在这里我们使用决定系数,也称为R2分数,作为准确度指标,并在所有实验中获得大于98%的分数。表示的平均值。
图8(a)、8(b)和8(c)分别显示了第一、第二和第三个实验验证集的一些样本。绿色虚线是FWI中使用的初始模型。由于初始模型与盐上方的真实模型相同,我们只在淹没区域看到绿色虚线。黑线绘制的FWI清楚地显示了一些BoS的特征。我们观察到FWI甚至影响某些样本中的盐块。网络的非淹没预测(红线)修复了FWI破坏的盐分,并捕捉到了BoS。将预测结果与真实模型(蓝线)进行比较,可以看出该网络预测了盐下速度的总体趋势。对于不含盐的样本(图8中的最后一列),我们在网络中输入了FWI及其初始值的真实模型,这教会了网络如何处理非盐模型。对盐后沉积物、盐层和非盐模型的准确预测,这些模型涵盖了大部分训练点,这些都证明了我们获得相对较高的R2分数是合理的。
图8:验证集样本及其对应的U-net去除淹没情况的示例,分别对应(a)第一次实验,(b)第二次实验和(c)第三次实验。黑色和绿色虚线是FWI结果及其初始模型,用作网络的输入。红线是U-net的未淹没预测,蓝线是真实模型给出的目标。当模型不包含盐(如最后一列中的样本)时,FWI及其初始模型与目标相同。
我们将三个经过训练的网络应用于图6中的反向BP模型。
图9:(a)使用第一个实验的网络对BP模型进行解淹没,以及(b)对模型进行微调的后续FWI。该网络捕获了BoS,但未能预测盐下速度。因此,尽管在回收盐体方面有所改善,但微调FWI也未能建立盐下速度。
图10:(a)使用第二个实验的网络对BP模型进行解淹没,以及(b)对模型进行微调的后续FWI。该网络捕获了BoS,并近似了盐下速度,这使得FWI即使在有限的偏移和缺乏低频的情况下也能更好地重建盐下模型。
图11:(a)使用第三个实验的网络对BP模型进行的去淹没和(b)对模型进行微调的后续FWI。与第二个实验类似,网络设法估计盐下速度,使随后的FWI能够恢复盐下速度而不受数据的限制。
在这些特征中,有迹象表明盐下6~8km位置之间有一个低速区域,以及4km左右的低速层。这可以在图12中观察到,图12显示了4.5和7.3km处的垂直速度剖面,我们将三个实验的结果与真实模型进行了比较。
第三个实验中真实模型和最终反演之间的RMS(均方根)差异()为0.26,低于第二个和第一个实验,后者分别具有0.32和0.43的RMS差异。第一个实验的真实模型和最终反演之间的R2得分为0.85,第二个实验为0.91,第三个实验为0.94。RMS和R2得分表明,最后的实验取得了三者中最好的反演结果。
图12:(a)4.5 km和(b)7.3 km处的垂直速度剖面图(右)。黑线表示真实的模型,而绿色、蓝色和红色线分别表示第一、第二和第三个实验的最终反演。在大多数情况下,盐下区域的反演捕捉到(a)中的低速层,并在(b)中显示出低速区域的迹象,尤其是对于第三个实验。
对于这三个实验,神经网络在三个数据集上表现的性能是相似的。然而,当将网络应用于BP模型时,它们会产生不同的结果。这是由于生成的数据和BP模型之间的统计数据存在差异。比较平均值±标准偏差的简单测试如图13所示。请注意,这些平均值±标准偏差曲线不包括盐层。
图13:训练数据随深度的平均值±标准偏差(红色)与 BP模型的平均值+标准偏差(黑色)之间的比较(不包括盐层)。第一个实验(a)中两条线之间的差距说明了盐下层的预测结果不佳。在第二个实验(b)中,训练数据覆盖了盐下区域的BP模型曲线,这说明盐下层的预测结果有所改善。在最后的实验(c)中,训练数据和BP模型相互匹配。
理想情况下,训练数据集应该覆盖测试数据集中的所有可能值,在我们的例子中是BP模型。这意味着图13中代表生成数据集的红色区域应包含与BP模型对应的黑色区域。
我们在第一个实验中看到情况并非如此(图13(a))。事实上,生成的数据集中的最大速度约为3.5 km/s,低于BP模型的最大沉积物速度,这可能解释了为什么网络无法估计图9(a)中的盐下速度。
在第二个实验中(图13(b)),生成的数据集曲线在水层之后与BP模型略有偏离,但在较深的一半开始匹配。 训练数据和深度BP模型之间的这种匹配证明了反向BP模型的改进是合理的,因为该区域是盐和盐下层存在的地方。
第三个实验如图13(c)所示,是为了与 BP 的平均值±标准差相匹配而特意构建的。它提出了一种保持BP模型平均背景速度的方法。
在我们的实现中,我们基于特定的模型统计设计训练数据集,如果在生成训练数据集时使用多个模型统计,则可以更好地推广网络。尽管如此,我们使用的1D训练方法并不昂贵,并且我们促进训练以处理特定区域和相应的地震数据。在这种情况下,生成训练集所需的统计数据可以从该地区无盐区域的任何层析成像或 FWI 实现中推导出来。论文中的方法假设一些处理和成像已经应用于数据,其中一些需要到达淹没盐模型。
在实际应用中,我们可以利用对该地区的一些先验知识来生成训练数据集。使用一些油井的平均速度或层析成像速度作为生成训练数据集的总体趋势,可以复制实验 3,从而获得均匀的盐下层速度。然而,当油井速度与盐下层速度不同时,使用部分信息(如预期最大速度)是更安全的选择,这与实验 2 相似。不过,在这种情况下,可能需要进行一些水平平滑处理,以消除网络产生的垂直条纹。
论文中的方法取得成功的关键因素是准确映射 ToS,并应用反演来保留 ToS。对于后者,我们建议应用TV正则化。需要注意的是,使用 TV 正则化仅仅是为了保留边缘,在解淹没工作流程中并不起主要作用。不过,如果不在反演中使用,也不应在训练数据中使用。即使使用 TV 正则化,我们也可以看到,在第一次 BP 反演(图 6(b))位置 =9 km 处,盐边界因 FWI 而变形。这影响了所有实验中的解淹没,导致网络检测到错误的 BoS。在 7 至 8 千米之间的区域,所有实验都观察到了另一种错误。造成这种错误的原因是,BP 在该区域有两个盐层,而我们的网络只在包含一个盐层的数据集上进行了训练。解决两层盐(或更多)问题的办法是在训练数据集中加入有两层盐(或更多)的模型。用 FWI 跟踪预测的未淹没模型,有助于解决网络的一些错误预测。
我们建议使用深度学习,特别是U-net架构,自动疏通盐层。该网络使用FWI获得的速度模型,以回归方式进行训练,这与通常的盐检测网络不同,后者是作为地震图像上的分类器进行训练的。使用回归机制直接对速度进行训练,使网络能够检测到BoS并估算盐下速度。为了进行训练,我们创建了许多一维盐和非盐模型,并在淹没盐后对它们进行了全波成像/FWI。网络的输入是FWI的结果以及相应的初始模型,输出是真实的速度模型。
我们在生成训练数据集时考虑了三种情况。
1)在第一种情况下,生成的数据不包含任何与我们要应用网络的相关模型(即我们示例中的BP模型)有关的先验地质知识。这导致生成数据和BP模型的统计数据不匹配,从而导致性能不佳,尤其是在估算盐下速度方面。
2)第二次实验包含了BP模型的部分知识,如最大速度和相似水深。第二次实验中的数据在较深的部分显示出与BP相似的统计数据;因此,该网络在对盐下速度进行合理估计的情况下对盐进行了泄洪 / 该网络通过对盐下速度的公平估计来消除盐。
3)第三次实验中的数据是使用BP沉积物的平均速度创建的,不包括作为背景的盐。在现实生活中,这可以通过取不同井位测得的速度平均值来复制。在这种情况下,生成数据和相关模型的基本统计数据是相似的。由此得出的解淹结果显示,对盐下层速度的估算是均匀的,与该深度的BP平均速度相近。
我们的研究表明,当该方法成功估算出盐下速度时,即使没有低频和足够的偏移量,后续的FWI也能提供良好的盐下模型。这一点非常重要,因为许多地震数据并不具备成功进行FWI所需的频率和偏移量。