故障分类中的特征提取效果浅见

0 前言

首先说明基本情况,本人入坑轴承故障诊断一年多,对于很多问题可定认识还不到位,研究的也不够彻底,所以这篇文章算是自己的阶段性认知,不一定正确,希望各位道友批评指正。

当初之所以选择这个方向,第一是因为我之前的工作就是机械方向,二是人工智能比较热门,三是我认识到这个方向的门槛可能没有那么高。

第三点其实很重要,因为我本身不是学机械的,学校和导师这边也没有支持,靠自学想毕业的话只能找自己力所能及的方向。在前期看书的过程中,很多书里都有这么一种说法:“深度学习的方法不需要复杂的人工特征提取过程,而是能够自行对有用特征进行提取,因此不需要很多先验知识”。这也许就是很多跨专业、跨领域的人纷纷来使用深度学习方法的原因吧。

事实上是不是这样呢?先抛出我个人的结论,很多传统的人工特征提取方法似乎都是一种花架子,和深度学习差距较大,很多人工特征+深度学习的方法也是在拖深度学习的后腿而已。

这个结论是人工智能技术或者说深度学习带来的,目前的自然语言处理领域里,现在能见到几个语言学专家呢?图像识别领域,你又能找到几个专门进行图像人工特征提取的?大家都是在尽力增强模型的能力,因为人工提取特征的能力早就已经被深度学习技术超越了,这个是不争的事实。

1 评判标准

以西储大学轴承数据集(CWRU)为基础数据集,目前用这个的比较多,也能相对客观一些。故障分类准确率这个标准太低,因为绝大多数方法都能在故障分类上做到99.5%以上,甚至100%,所以很难区分方法优劣。当然,目前有些人工特征提取的方法连99%都还达不到,确实有点摸不到及格线的意思。这里大家不妨去查一下近几年一些人工特征提取方法,不管论文中说的多好,实际效果实在一般。

目前能拉开一点差距的测试方法就是不同工况间的迁移学习效果,也就是说取三种工况,在一种工况下训练模型,再在另外两个工况上直接测试,最终取平均值,反映的是模型本身的泛化能力,如图所示。

方法

人工特征+SVM

WDCNN

CBAM-Inception

ShuffleNetV2

ShuffleNet-DELM

A-B

86.80%

92.20%

96.60%

98.70%

99.26%

A-C

71.00%

91.00%

99.80%

98.37%

98.62%

B-A

92.80%

95.10%

92.90%

97.52%

98.89%

B-C

79.40%

91.50%

98.00%

97.45%

98.99%

C-A

63.80%

78.10%

84.00%

93.26%

97.29%

C-B

70.80%

85.10%

93.40%

96.62%

98.63%

均值

77.10%

90.00%

94.10%

95.11%

95.47%

目前我能看到的方法平均准确率普遍在95%以上,高的能到98%多一点。我自己用的新模型,比如说Resnext、ShuffleNetV2、Vit、Convnext、Swin—Transformer等效果都很好,当然都需要比较费劲的调参过程。但是确实说明一个问题,在图像识别领域比较厉害的模型,应用到轴承故障分类中依然有优势。后续我的验证中就以ShuffleNetV2模型为准。

2 我所理解的人工特征优势

人工特征提取方法或者说数据强化方法普遍的说法就是能够使故障特征更加明显,这里我们以希尔波特黄(Hilbert-Huang)方法为例。首先取负载为1,转速为1772的工况中的内圈故障文件106。从时域看是这样的。

故障分类中的特征提取效果浅见_第1张图片

肉眼确实很难看出问题,我们截取其中2048个点放大再看,似乎能明显一点。

故障分类中的特征提取效果浅见_第2张图片

​传统方法中主要靠寻找特征频率来确定故障性质,经过计算,这段数据的故障特征频率应该是159.93Hz,也就是说在这个频域图中,这个频率以及其倍频处会有明显特征。对该段数据进行常规频域变换(FFT)得

故障分类中的特征提取效果浅见_第3张图片

全频域图示

故障分类中的特征提取效果浅见_第4张图片

取1024Hz前放大观察

如上图所示,在全频域中,我们标记出1-4倍频的位置,似乎还算准确。但是放大以后观察,发现找的好像不是很准,比较大的凸起并没有找到。

接下来我们看看希尔波特黄方法的表现,如图所示

故障分类中的特征提取效果浅见_第5张图片

故障分类中的特征提取效果浅见_第6张图片

如图所示,变换后的频谱图能量主要集中在低频部分,而放大以后观察,1-4倍频对于特征频率找的也非常准确。

但是这样真的表示该方法更好吗?

3 比较验证

我们分别将常规FFT的数据和经过希尔波特黄方法处理的数据放入深度学习模型查看分类结果

故障分类中的特征提取效果浅见_第7张图片

5次实验取平均值

从结果上来看,希尔波特黄方法并没有更好,反而明显较差。

同样在我学习的一本书中,佘博博士使用双树复小波方法提取的特征数据与直接fft数据输入自己搭建的DCVAEN模型,结果也是反而下降了一些。

4 结论

  • 传统的人工提取特征方法并不一定更好,有时候看上去像那么回事,实际上可能只是“人眼”易于观察而已,对于机器或者模型而言,反而可能因此损失了更加重要的一些特征信息。

  • 更多的人工特征方法可以尝试,但是人工提取特征的方法确实比较麻烦,还需要很多基础理论支撑。对于像我这样的跨学科、不想从基础理论开始学习的人来说,不如把精力放在模型的研究上,毕竟模型本身的适用性和通用性有更大的价值。

深度学习模型本质上就是一种用来提取特征的滤波器,代替人工也是意料之中的事。既然有那么多大佬在这个赛道研究并且开源,只会有更好、更优秀的模型出现,并且其中的机理也会逐渐清晰。我们普通人能够用好就已经足够了。

你可能感兴趣的:(故障诊断,西储大学,分类,人工智能,深度学习,python,卷积神经网络)