论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod

2018 Geophysical Journal International

1 Intro

1.1 Motivation

  • 地震检测和定位是地震学的基础。
    • 地震目录的质量主要取决于到达时间测量的数量和准确性。
    • 地震到达时间测量或相位选择通常由网络分析员执行,他们根据专家判断和多年经验选择相位。
    • 随着地震仪部署速度的不断加快; 网络分析员分析的速度跟上数据流增加的速度得越来越困难。
  •  地震的相位选择尤其受到 S 波的挑战,因为它们不是最先到达的波,而是从 P 尾波的散射波中出现的。
    • S 波到达时间特别有用
      • 它们可用于减少仅基于 P 波的地震位置的深度-震源权衡
      •  S 波结构对于强地面运动预测很重要。 

1.2 related works

  • 很多研究致力于自动地选择地震的相位
    • 基于振幅、标准差、能量
      • 短期平均-长期平均模型是一个广泛使用的模型(STA/LTA short-term average/long-term average)(Allen 1978)
        • 他记录短期窗口和长期窗口之间能量的比例
        • 比例大于一个阈值的话,就表明P或者S波的到达
        • ——>这种方法虽然有效,导师易受噪声的干扰,同时对到达时间的准确度不高(尤其是对剪切波 shear wave的到达时间的准确度)
      • Baer & Kradolfer (1987) 使用包络(envelope)作为特征函数改进了 STA/LTA 方法。

      • Sleeman & Van Eck (1999) 对噪声和地震信号应用联合自回归 (AR) 建模,并使用 Akaike 信息准则来确定地震信号的开始。

    • 统计模型
      • 基于高阶统计(包括峰度 kurtosis和偏度 skewness)的方法来识别从高斯性到非高斯性的转变,这与地震事件的发生相吻合,即使存在噪声

    • 浅层神经网络
      • Gentili & Michelini (2006) 根据四个手动定义的特征对传统的浅层神经网络进行了测试,以选择 P 和 S 阶段:

        • 方差

        • 偏度的绝对值

        • 峰度

        • 基于滑动窗口预测的偏度和峰度的组合。

      • 大多数相位选择算法都关注 P 波, Ross & Ben-Zion (2014) 利用极化分析(polarization)来区分 P 波和 S 波,主要是为了改进 S 波到达时间的测量。

    • ——>尽管做出了上述大量努力,但自动相位选择算法的准确性仍落后于经验丰富的分析师。

      • 这是由于地震波形由于多种效应而高度复杂,包括震源机制(source mechanism)、应力降(stress drop)、散射(scattering)、场地效应(site-effects)、相位转换(phase conversion)和来自多种噪声源的干扰。

      • 传统的自动相位选择算法使用手动定义的特征,需要仔细的数据处理,如带通过滤和设置激活阈值。

1.3 Paper‘s idea

    • 这篇论文提出了一种用于地震相位拾取的深度神经网络算法 PhaseNet。

      • 深度神经网络不使用手动定义的特征,而是从标记数据中学习特征

      • 模型根据经验丰富的分析师挑选的P波 和 S波 到达时间进行训练。

      • 未经过滤的三分量地震波形是 PhaseNet 的输入(垂直、南北、东西分量)

      • PhaseNet 经过训练可输出三种概率分布:P 波、S 波和噪声。

        • P 波和 S 波概率分布中的峰值被设计为对应于预测的 P 和 S 到达时间。

      • PhaseNet 为 P波和 S波的 选择提供了高准确率和召回率,并且与传统的 STA/LTA 方法相比取得了显着的改进。 

         2 数据

2.1 数据介绍

  • 地震档案包括大量手动拾取的 P 波和 S 波到达时间,它们代表了非常丰富的有标记数据训练集,非常适合深度学习(图 1)。
    • 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第1张图片
  • 论文使用北加州地震数据中心地震目录 (NCEDC 2014) 收集的数字地震波形数据。
    • 使用具有 P 和 S 到达时间的三分量数据。
      • ——>779 514 条记录。
      • 基于站点分层抽样,将数据集分为训练、验证和测试数据集,分别有 623 054、77 866 和 78 592 个样本。
        • 训练集和验证集用于训练、微调参数和模型选择。
        • 测试集仅用于评估PhaseNet的最终性能和结果。
    • 该数据集具有多样性的波形特征。 它包括北加州地震台网中不同类型的仪器,涵盖了广泛的信噪比 (SNR) 范围。
      • 各仪器在数据集中所占比例如图2所示
        • 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第2张图片
      • 信噪比分布如图3所示
        • 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第3张图片
        • 信噪比由P波到达后5s和前5s的标准差之比计算得出
      • ——>数据集的复杂性使得自动相位选择具有挑战性,
      • ——>数据集的复杂性同时提供了更全面的性能评估。

2.2 数据预处理

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第4张图片

  • 随机选择一个包含 P波 和 S波 到达时间的 30 秒时间窗口作为 PhaseNet 的输入。
    • 窗口P波和S波内到达的位置是变化的,以确保算法不只是学习窗口方案。
    • 所有数据均以 100 Hz 采样,这是原始数据集中最常见的采样率,因此 30 秒输入波形的每个分量都有 3001 个数据点。
    • 通过去除其均值并将其除以标准偏差来对每个分量波形进行归一化。
  • 数据集中分析师手动选择的P波S波到达的时间可能不是真正的 P/S 到达时间,可能具有一定的不确定性。
    • 出于这个原因,论文认为手动选择的P波S波到达的时间满足一个高斯分布。
      • 分析师选择的到达时间概率最高,而附近的数据点概率逐渐降低。
      • 高斯分布的标准偏差设置为 0.1 秒。
      • ——>以概率表示手动选择的P波S波到达的时间
        • ——>减少数据集中挑选错误的影响
        • ——>增加了 P波S波到达时间的拾取中相对于噪声的信息量,并有助于加速收敛
          • 噪声表示所有不是P波和S波的点
          • Prob(noise) = 1 Prob(P) Prob(S)
    • 使用高斯分布掩码转换后,我们可以从 PhaseNet 预测的概率分布的峰值中提取到达时间。 

3 模型

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第5张图片

  • PhaseNet的架构是修改 U-Net得到的
    • U-net 是一种用于生物医学图像处理的深度神经网络方法,旨在定位图像中的属性。
    • 映射到这篇论文的setting中,就是将时间序列的属性定位为三类:P波、S 波 和噪声。
  • 输入是已知地震的三分量地震图。 输出是 P 波、S 波和噪声的概率分布。
    • 输入和输出序列包含3001 个数据点(30 秒长,以 100 Hz 采样)。
  • 输入的地震数据经过四个下采样阶段和四个上采样阶段。
    • 在每个阶段内,应用一维卷积和整流线性单元 (ReLU) 激活函数。
    • 下采样过程旨在从原始地震数据中提取有用信息并将其缩小到更少量的神经元
      • ——>最后一层中的每个神经元感受野很广
    • 上采样过程将此信息扩展并转换为每个时间点的 P 波、S 波和噪声的概率分布。
    • kernel size为7。
    • 下采样的stride为4
    • 最后一层接一个softmax以进行概率的生成
      • 1,2,3分别代表噪声、P波和S波 
      • x论文没说,我觉得应该是t,也就是时刻(个人觉得是每一时刻的三个分量做softmax,结果是一个3*3001的矩阵)

  • 损失函数是预测分布q(x)和实际分布p(x)的交叉熵 
    • 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第6张图片

4 实验

4.1 metric

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第7张图片

  • 如果预测的和实际的,相差间隔在0.1秒以内,那么就认为是true positive
  • F1 分数是精确率和召回率之间的平衡标准。
    • 例如,如果我们为 positive picks 设置一个非常高的阈值,只有最好的 picks 被报告为 positive,这只占总 true picks 的一小部分,这样我们可以获得非常高的精度但非常低的召回率。
    • 非常低的阈值的相反情况将导致低精度但高召回率。
    • 对于这两种情况,F1 分数都会很低
      • ——>使用F1可以更准确地评估算法的性能

4.2 比较结果

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第8张图片

PhaseNet取得了显着的改进,特别是对于 S波。 因为 S 波从 P 尾波的散射波中出现,所以选择 S 到达对于自动方法来说更具挑战性。 

4.3 自动和人工标记的 P 和 S到达时间的时间残差分布

 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第9张图片

  •  图 6 显示了自动和人工标记的 P 和 S到达时间的时间残差分布。
  • P picks 的残差分布比 S picks 窄得多,这与 P 波到达预计更清晰因此更容易挑选的事实一致。
  • 与 AR 选择器的结果相比,PhaseNet 的 P 和 S 选择的残差分布明显更窄并且没有明显的偏差。

 4.4 在不同仪器类型上的性能

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第10张图片

  • 图 7 显示了 PhaseNet 在不同仪器类型上的性能。
  • 训练集还是所有类型的仪器采集的数据,而测试数据集是根据每种仪器类型划分的。
  • 在不改变任何参数或阈值的情况下,PhaseNet 的性能在不同的仪器上都很稳健。 尽管短周期和宽带、高增益和低增益、加速度计和地震计之间存在波形差异,但 PhaseNet 学习了检测 P 和 S 相位所需的共同特征并选择了正确的到达时间。 

4.5 不同 SNR(信噪比)的 PhaseNet 的性能变化

 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第11张图片

  •  图 8 显示了具有不同 SNR(信噪比)的 PhaseNet 的性能变化。
  • 根据 log10(SNR) 的值将测试集分为 10 个不同的类别。 为每个类别计算精度、召回率和 F1 分数。
  • 三个评估指标都随着信噪比的提高而增加。
    • 当 log10(SNR) 的值超过 0.5 时,P 的 F1 分数超过 0.9,S 的 F1 分数超过 0.8。
    • 即使对于低 SNR 数据,PhaseNet 的精度也很高,而召回率变得相对较小。
    • ——>这反映了这样一个事实,即对于噪声数据,地震信号可能会被噪声淹没,变得更难检测。

4.6 可视化结果(好的-不好的-数据标注可能有误的)

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第12张图片

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第13张图片 

 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第14张图片

 

  • 图 9 显示了来自测试数据集的良好示例。
  • 对于不同的波形特征和 P-S 时间间隔,PhaseNet 成功地拾取了 P 和 S 到达。 预测分布的峰值与分析师标记的 P 和 S 精选准确对齐。

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第15张图片

 

图 10 显示了一些明显失败的案例。 P 和 S 初至更难区分,波形比图 9 中的波形更嘈杂和复杂。

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第16张图片

 

图 11 显示了一些有趣的情况,其中分析人员选择的 P 或 S 到达时间可能不正确。 神经网络的预测显得更加合理和一致。 由于在地震相位选择中存在主观因素,分析人员可能会使用不同的标准来选择到达。 同一分析师的选择在不同时间也可能有所不同。

4.7 分析PhaseNet学到的特征

  • 为了分析 PhaseNet 学习到的表示,我们训练了另一个没有skip-connection的模型,它强制所有信息通过最深层,并将 PCA(主成分分析)应用于最深层的神经权重。
  • 神经网络将来自高维原始波形的知识浓缩为最深层的几个参数,这意味着这些低维神经权重应该包含确定 P 与 S 到达所需的信息。
  • 这里输入具有 P 波、S 波或仅噪声的地震数据,并在最深层记录相应的矢量。 PCA 可视化显示这些压缩向量分组到 P pick、S pick 和噪声的不同区域。
  • 论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第17张图片
  • 结果表明神经网络已经学会从原始数据中提取特征以区分 P pick、S pick 和噪声,并将它们捕获到最深层的压缩神经权重中。

 4.8 连续数据的地震监测

论文笔记:PhaseNet: a deep-neural-network-based seismic arrival-time pickingmethod_第18张图片

  • PhaseNet 预测时间序列中每个数据点的 P 和 S波 的概率分布,因此它可以应用于地震检测的连续数据。
  • 论文通过叠加八个不同事件的波形创建了连续的地震数据。 移动这些事件以使相邻事件之间的到达时间间隔等于 6 秒。
  • 用STA/LTA 和 PhaseNet 方法进行比较。
    • STA/LTA 方法的短滑动窗口和长滑动窗口分别设置为 0.2 和 2 s。
    • PhaseNet不需要滑动窗口,而是将整个60s波形作为P pick、S pick和noise三个概率序列的输入和输出。
  • 图 13 中的输出序列表明,PhaseNet 产生与 STA/LTA 方法相似的尖峰,后者通常用于地震检测; 然而,PhaseNet 也可以区分 P 和 S 到达。
    • 此信息还可用于减少错误检测,因为与 STA/LTA 报告的未区分的尖峰相比,同时具有 P 和 S 选择的事件更有可能是真正的地震。 

 

你可能感兴趣的:(论文笔记,论文阅读,深度学习,神经网络)