【论文阅读笔记】Automatic recognition and classification of microseismic waveforms based on computer vision

【论文阅读笔记】Automatic recognition and classification of microseismic waveforms based on computer vision

摘要

  • 微震 波形可以分解为时间-幅度图像,也可以转换为频谱图

  • 使用深度学习方法准确分类 VGG resnet alexnet 以及集成学习模型

  • 不同模型在识别噪音电信号微震有差异

Introduction

  • 强调微震技术的应用:预测岩体的不稳定性,捕捉岩体裂缝时间,位置,幅度,估计潜在岩爆位置

  • 缺点:大多数微震信号的识别和分类依赖于人工,效率低,处理错误,时效性不好

  • 使用源参数作为分类特征:地震矩,能量,静态应力降,表现应力,不适用于实时处理系统

  • 使用原始波形数据特征来区分地震信号。极限学习机,胶囊神经网络,支持向量机等

  • 深度学习:将原始波形图像作为神经网络的输入,深度学习模型处理更快,准确性更好

  • 针对微震信号,时间域和频域特征或者是图像的分类,深度学习可以提高准确性

  • 当数据集全部是图像的时候,更容易操作,但是时间幅度数据转换为频谱图会出现模糊和泄露现象

  • 噪音和干扰信号也可以提供一些有效的岩体信息:环境噪音中可以获取有效信息,比如边坡材料的S波速度

  • 总结:

    • 研究是用来微震数据 爆破波形,电信号 噪音 鸣笛 还有在同一个通道中混合了微震、电信号、噪声的波形
    • 研究使用了AlexNet VGGNet 残差网络ResNet以及相关的集成模型,用于识别和分类相同实验环境中不同信号的波形图像和频谱图
    • 波形图像是通过截屏获得,频谱图是通过时间-幅度数据进行Stockwell变换得到的
    • 分类过程中,两种图像被直接输入模型中,没有进行去噪处理,充分利用了原始数据。
    • 所选择的深度学习模型具有一定的噪音容忍度,波形图象可以实时输入模型获得分类结果,实现波形形式的端到端识别和分类

Engineering background and data preparation

Engineering background

  • 关于研究中使用的微震监测数据来源的信息,这些数据来自中国陕西省的汉江至渭河工程项目
  • 工程采用了ESG生成的MS检测系统,收集数据之后,第一步需要进行波形分类

Data preparation

  • 统采集了许多不同类型的波形信号。最常见的类型包括微震事件、爆破事件、电信号事件、噪音事件(主要是施工过程中产生的噪音干扰信号)、鸣笛事件、施工干扰事件和人工敲击事件。这些不同类型的事件和信号可能同时存在于监测数据中
  • 数据集:电信号 爆破 微震 噪音 鸣笛,总共2505样本,将这些数据分别制作成原始波形图像数据集和频谱图数据集
  • 原始数据是手动选择符合不同信号特征的波形图像,这些是通过截屏和分类生成原始波形图像数据集。同时,将时间-幅度数据转换成与波形图像匹配的频谱图,使用Stockwell变换完成。最后,将原始波形图像和频谱图输入到模型中进行学习。这个过程用于准备不同类型信号的样本以供深度学习模型进行训练和测试。通过这些不同类型的数据集,研究可以探索哪种数据类型在分类和特征提取方面表现更好,以及它们对于工程中的微震监测的实际应用的适用性。

Image preprocessing

  • 统一图像尺寸,比如:256x 256 x 3 方便输入到模型中进行训练
  • 图像标准化,让数据有相似的分布,使得模型泛化效果更好
  • 归一化:像素缩放到0-1之间,加速模型的收敛,提高训练效率

Computer vision model

  • 在图5的特征提取示意图中,图5(a)展示了模型的输入,即电信号、爆破信号、微震信号、噪音和鸣笛的波形(或频谱图),这里以微震事件为例。图像进入模型,计算机通过读取图像的数据矩阵来获取图像信息(图5(b))。卷积核被用来提取图像的特征。在这里,我们以一个3×3的卷积核作为示例。卷积核越大,越注重图像的整体信息,卷积核越小,越注重细节。通道的数量表示提取的特征图的数量。如图5©所示,如果输出通道的数量为3,将生成三个特征图层。卷积神经网络通过大量的波形图像和频谱图来学习电信号、爆破信号、微震信号、噪音和鸣笛事件的特征。学习的主要目的是通过损失函数反向传播错误,以训练最佳的卷积系数。在CNN的训练过程中,无需人工选择特征,神经网络会通过卷积自动学习图像波形特征和背景特征。基于CNN的深度学习算法,实现了端到端模型的识别。如图6(a)所示,图像数据被输入到模型中。CNN模型逐层抽象这些数据,生成所需的特征表示,最终将特征映射到任务目标上。与传统的数据识别方法相比,计算机视觉方法更直观、更简单。

  • 根据图6(b)的描述,波形图像和频谱图数据集通过之前的方法建立,并经过数据预处理方法进行转换,包括图像尺寸转换、图像标准化和正规化。基于CNN的计算机视觉方法可以分为序贯模型和残差模型。序贯模型由AlexNet和VGGNet代表,而残差网络由ResNet代表。由于序贯和残差结构的不同,以及序贯结构中的不同深度和卷积核尺寸,神经网络对电信号、爆破信号、微震信号、噪音和鸣笛类别的理解存在差异。因此,我们训练了不同的模型进行比较分析。根据不同模型对相同波形事件的学习差异,综合判断了对每个事件的理解和预测。使用测试集,这项研究使用准确率、精确度、召回率和F1分数来综合评估基于AlexNet、VGGNet和ResNet对微震和其他事件进行学习的模型的泛化能力。这些指标有助于评估模型的性能和其在不同事件类别上的表现。

  • 介绍ALEXNET VGG RESNET模型 一大段 水论文?

  • 集成学习模型:同一张图片被三个模型进行预测,获得三个模型的结果,最后通过投票(少数服从多数)获得最后结果

实验

Training process

  • VGG和ResNet的训练步数更少

  • ResNet的模型参数远远小于其他两个

  • 混淆矩阵:每行的总和是每个类别的测试集数量,横坐标是预测标签,纵坐标是真实标签,主要的错误源是电信号 噪音 鸣笛

  • 介绍一堆评价指标

  • AlexNet和ResNet模型的预测能力弱于集成模型和VGGNet

  • 集成模型结合了单一模型在电力 爆破 微震 和噪声分类的有点 提高了综合判断的结果

Evaluation of training results of spectrogram datasets model

  • 频谱图和原始波形图的测试结果几乎没有变化,所以可以直接使用原始波形图进行分类

  • 图11(a)展示了AlexNet的第一卷积层从MS原始波形中提取的特征。第一卷积核的大小为11×11,通道数为96,所以在这一层网络会提取96层特征。显示了前12层的特征图。大多数特征图像都已被提取出来,如红色框内所示的突出部分。图11(b)显示了第二卷积层卷积核的大小为5×5,通道数为256,将从网络中提取256个特征图。显示了前12层的特征图。观察提取的特征图,可以看到第二层卷积主要用于提取波形的能量集中特征,通道1和通道4学会了能量集中之外的背景图像。将图11的特征提取图与经过Stockwell变换的MS图像(图3(b))相结合,可以看到卷积提取特征图和频谱图之间存在明显的相似性。也就是说,Stockwell变换是一种人工执行的特征转换,对于原始波形卷积层自动学习了相似的特征。因此,原始波形数据集的测试结果基本与Stockwell变换频谱图数据集的测试结果相同

讨论

  • 从图13可以看出,在原始数据集下,VGG16模型对这两种混合MS信号的正确识别率仅约为0.2至0.3。对于噪声-MS信号,有59.92%的数据被分类为噪声信号;对于电-MS信号,有43.85%的信号被分类为电信号,但在未受干扰的MS信号的识别中没有出现错误。原始模型将大多数混合信号分类为干扰信号类型,而在混合中识别MS信号的能力较弱,因此忽略混合信号会降低模型准确识别MS信号的能力。这强调了处理复杂混合信号的重要性,尤其是在工程监测中,因为实际情况可能会包括多种信号类型的混合。

总结

  • 使用基于CNN的计算机视觉方法,可以准确学习每个MS事件的无噪声数据集的特征,并能够准确预测测试数据,其中AlexNet、VGG16、ResNet 18和集成模型的识别准确度分别为0.96、0.98、0.96和0.98。

  • 通过对比原始波形图像和经过Stockwell变换的频谱图数据集的测试实验,发现这两个数据集之间的预测准确度没有明显差异。在波形分类过程中,可以省略使用时域-幅度数据绘制波形图像和变换频谱图,以实现端到端的自动识别和分类。

  • 针对每个单一模型,对于电信号、爆破信号、地震信号、噪音和鸣笛信号的学习能力存在差异,这表现为精确度和召回率的波动。单一模型中预测能力较差的类别可以通过集成模型来改进。最终的模型需要根据实际情况进行适当的选择。

  • 这个模型不仅可以对地震信号和爆破信号进行分类,还可以明确识别和分类电信号、噪音和鸣笛信号,从而实现高精度的分类。这为地震监测工程波形的自动分类提供了参考。最后,还讨论了地震数据和混合的电信号和噪音数据。结果显示,实验环境的数据集需要不断更新,并且尽可能与实际工程场景保持一致,以确保模型的稳健性。

你可能感兴趣的:(#,论文,论文阅读,笔记,计算机视觉)