深度学习与西储大学轴承数据集(一)

0.写在前面的话

去年这个时候开始萌生了用深度学习进行机械故障诊断的想法,虽然目前勉强入门,但是回过头来看,确实走了不少弯路。整个学习过程几乎全靠网络上的资源,因此,写这篇文章除了回顾学习过程、总结提高,更重要的是也想帮到曾经像我一样迷茫的人。

1.针对的人群

说实话,当初我个人的起点真的是相当低,总想着找一些0基础入门的教程,无奈很多基础常识都很缺乏,学起来还是很吃力的。朋友们可以看一看我的条件,如果正准备开始入坑,相比之下应该能建立一些信心。

  • 本科电子类,非机械,编程基础几乎为零

  • 毕业十年后来脱产读研

  • 导师非工科专业、第一次带研究生、平时很忙,更我无法指导我(一开始甚至不知道我的专业毕业要求。。。。)

  • 没有师兄师姐!!!没有实验室!!!

  • 已成家、诸事繁杂

  • 天临加持,论文倒查十年,无法摸鱼

今年3月份开始总算是水了个EI会议、发了2个容易点的中文核心期刊,毕业算是稳一些了,整体效率还算可以。

所以打算往这个方向做研究的同志们完全不需要有心理负担,估计也没几个人比我读研的困难大了。

2.数据集介绍

(1)西储大学数据集的优点

  • 最大的优势就是用的人多,这样资源非常好找,也有很多人愿意分享自己的经验,论文多也好学习和比较。

  • 数据集大小合适,只有650M,且包含各种工况、故障。(相比之下,好多数据集是轴承运行全程的数据,故障种类不全或者重叠,更适合做预测。如辛辛那提轴承数据、西安交通大学轴承数据等)

  • 数据质量合适,能够有效区分出模型性能高低。(有些模型随便一整就是100%准确率,这就没法做文章了)

(2)了解数据集

找到数据集比较简单,它长这个样子。

深度学习与西储大学轴承数据集(一)_第1张图片

数据集解压后看到的

深度学习与西储大学轴承数据集(一)_第2张图片

12kHz DE端数据

我见过已经认为合并处理过的,但是不好找,个人觉得也没有必要,处理数据是必须要经历的一个学习过程。

首先它由4个文件夹组成,前3个分别是:12kHz采样率下电机端轴承的故障数据(DE)60个、12kHz采样率下风扇端轴承的故障数据(FE)45个、48kHz采样率下电机端轴承的故障数据(DE)52个,还有正常运转的轴承数据4个。以12kDE数据为例,大家基本也都在这个数据集下做验证。

深度学习与西储大学轴承数据集(一)_第3张图片

​12kDE数据

如图所示,左边第一列是4种故障尺寸,由于第4种故障缺少外圈故障,所以一般选取前3种尺寸,这样内圈、滚动体、外圈3种故障就有3*3也就是9种故障分类,再加上正常状态就是最常见的10分类方式。不考虑故障尺寸进行4分类的比较少见,主要是这样的话难度降低不少,结果提升的空间不大,毕竟10分类也没有麻烦多少。(图中标红的请忽略,这几个数据在一篇论文中被认为是质量不佳甚至有问题的,有待进一步研究)

左边第二、第三列代表的就是常说的工况了,实际上就是负载、转速的不同,这就造成了数据一定程度的差异,这个差异不大,正好可以研究。区分工况是常见的做法,很多人取3种工况,也有取4种的,大家可以自己决定。我个人见的3种的多,主要用来做迁移学习或验证泛化能力,3种工况一般已经足够说明问题了。

外圈故障又细分为3种,建议大家取6点钟的就足够了,不同方向的差异时间上并不大,进行区分也没有那么多必要性。我在一开始为了包含所有情况,导致写的程序过于麻烦,浪费了不少时间,最后看来完全没有必要。

以上是12kDE数据,单独使用FE数据的我没见过,使用48kDE数据的也有,但确实不多,也没有必要,有论文研究指出这两组数据除了采样率不同,其余是几乎一样。

(3)处理数据集

我之前没啥编程基础,所以准备直接用Python完成数据处理和模型搭建。当时这方面愿意分享Python程序的实在不多,很多是以前用Matlab语言,而我的Python基础不够,一开始就盯着几个博主写的模仿,实在是吃力。

首先文件的后缀是mat,用Python就能直接读取,可当你打开时才发现是三组数据?

深度学习与西储大学轴承数据集(一)_第4张图片

matlab读取界面

在Python里会变成一组字典,可以根据名称选取需要的部分。

这里我有个疑问一直没看到确切说法,105.mat这个文件照理说是在12kDE里的,但是文件却同时包含了FE和BA保持架的数据,也就是说还得再进行一次选取,这里的FE数据不知道和12kFE文件里的是不是一回事。而且当你打开12kFE里的文件时,发现还是包含DE、FE和BA三种。

深度学习与西储大学轴承数据集(一)_第5张图片

​12kFE中的文件270.mat

打开正常数据是,发现是DE和FE两种。

深度学习与西储大学轴承数据集(一)_第6张图片

正常运行的数据

目前就写到这里,后续再细说就要涉及具体的python程序了,比较麻烦,我得好好整理一下,希望大家多多支持,点赞加收藏。

你可能感兴趣的:(深度学习,卷积神经网络)