摘要:文章中提出一种改进胶囊网络特征提取结构和反向传播损失计算方法的滚动轴承故障诊断模型,应用多尺度卷积核Inception结构和空间注意力机制替代传统胶囊网络单一卷积层进行特征提取,得到不同尺度下、重点区域突出的特征数据,利用胶囊结构构建向量神经元,通过动态路由的特征传递方式,得到分类结构数字胶囊,实现故障诊断。
一、Inception结构
Inception结构是一种高效表达特征的稀疏性结构。基于底层的相关性高的单元,通常会聚集在局部区域(通常CNN底层卷积提取的都是局部特征),这就相当于在单个局部区域上,去学习他的特征,然后在高层用l1卷积代替这个区域,当然某些相关性可能是隔得比较远的,通过使用大的卷积核学习即可。
原始Inception结构如下:
Inception v1结构:
原始Inception结构中所有卷积核都在上一层的所有输出上来做,5*5的卷积核所需要的计算量太大,造成了特征图的厚度很大,为并避免这种情况,在3x3前、5x5前、max pooling后分别加上1x1的卷积核,以起到降低特征图厚度的作用,这就形成了Inception v1的网路结构。相比于原始Inception结构,v1结构的计算量大大减小。
以上图片取自于:详解Inception结构:从Inception v1到Xception_红鲤鱼与绿驴的博客-CSDN博客_inception结构详细介绍了GoogLeNet中Inception模块网络结构的发展历程,包括了Inception v1,Inception v2,Inception v3,Inception v4,Xception结构及特点。https://blog.csdn.net/weixin_44772440/article/details/122952961?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522166252546616782390518608%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=166252546616782390518608&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduend~default-2-122952961-null-null.142%5Ev47%5Epc_rank_34_1,201%5Ev3%5Econtrol&utm_term=inception%E7%BB%93%E6%9E%84%E5%9B%BE&spm=1018.2226.3001.4187
二、注意力机制(代码实现)
注意力机制模仿人观察事物关注重点部位的特点,广泛应用于图像识别、自然语言处理等领域。注意力机制可以分为通道注意力机制、空间注意力机制以及二者结合。常见的实现方式有SENet,CBAM,ECA等。
首先通过平均池化和最大池化(用来汇总特征图的空间信息)得到平均池化特征和最大池化特征,然后将两个池化特征传入共享网络(SharedMPL:有一个隐含层)生成通道注意力特征图,隐含层的激活大小设置为,r为缩减率,经过共享网络后得到的结果,通过元素的求和并输出特征向量。
通道注意力公式为:
是sigmoid函数。MPL的权重和对于两个输入是共享的,后面是ReLu激活函数。
2.2空间注意力模块
首先沿着通道轴进行平均池化和最大池化操作,并将它们连接起来生成一个有效特征描述符(每个都表示整个通道的平均池化和最大池化特征)。在连通的特征描述符上,经过一个7x7的卷积层,激活函数为Sigmoid生成二维空间注意图(权重系数),将权重系数与特征相乘即可得到缩放后的先特征从而对原特征进行了强调或抑制。
空间注意力公式:
2.3注意力机制的应用
注意力机制是一个即插即用的模块,理论上可以放在任何一个特征层后面,可以放在主干网络,也可以放在加强特征提取网络。
三、胶囊网络。
四、改进的胶囊网络如下图所示:
第一部分是针对原始数据进行降维以及胶囊网络前期初级特征提取的改进,将原本双卷积结构调整为Inception结构。
第二部分是引入了人空间注意力机制。
第三部分是胶囊网络。
五、数据处理部分
文中采用单个数据文件重复采样的方式减小样本间的不平衡问题。在实验中采用单个数据文件中单次选取6000个点,每次向后移动500个点的形式进行采样,采样后数据进行时频变换(短时傅里叶变换),由一维数据变换为二维数据,短时傅里叶变换公式为:
其中f和g为信号和窗函数,输出结果S为时域数据,自变量为时间,变量w为频率,变量为移动窗口设置量。
变换二维后,为避免数据转图像格式容易出现格式转换误差问题,文章中直接按数组形式保存使用,不转换图像类型。
六实验结果
在文章中将改进的胶囊网络与双卷积胶囊网络和传统卷积神经网络做对比结果如下:
从表中可以看出改进胶囊网络虽然在模型训练时间上没有明显增加,但是训练集正确率有了一定的提升。
采用正常信噪比信号作为训练集样本,训练好的卷积神经网络、双卷积胶囊网络和改进胶囊网络3个模型,输入三种不同信噪比的数据作为诊断验证集,模型的诊断情况如下:
从图中可以看出SAP-CapsNets具有一定的抗噪能力,在信噪比-3dB的情况下,仍能达到80%以上的正确率,相比与另外两种能够达到更好的特征提取和故障诊断效果。
以上内容为学习《改进胶囊网络的滚动轴承故障诊断方法》的学习记录。