用于轴承复合故障诊断的零试学习

Zero-shot learning for compound fault diagnosis of bearings

用于轴承复合故障诊断的零试学习

由于各种故障的并发性和耦合性,可能的故障模式的数量呈指数增长,因此复合故障诊断是轴承故障诊断中的一个难题。当存在大量的有标签的复合故障样本时已有的深度学习模型能够提取故障特征。在工业场景中,收集和标注大量的复合故障样本是不切实际的。利用单一故障样本训练的模型来识别未知的复合故障具有挑战性和创新性。为了解决这个问题,我们提出了轴承复合故障诊断的零样本学习模型。我们设计了一个编码的方法根据故障的特征去表达单个故障和复合故障的语义。发展了一个卷积神经网络提取复合故障信号的时频特征。然后我们将故障的语义特征嵌入到故障数据的视觉空间欧几里得距离被用来测量复合故障的信号特征和语义特征之间的距离以识别未知类的复合故障。为了验证所提出的方法,在自建的测试床上进行实验。结果证明,复合故障的识别准确率达到了77.73%当在没有任何复合故障样本对模型进行训练时。

引言

轴承是工业装备中不可缺少的基本元素。根据统计,大约30%的旋转机械故障是由于轴承损坏引起的。轴承故障诊断对于确保设备和人员的安全非常重要。在复杂的工业设备中,复合故障是指机械设备同时发生两个或两个以上相互关联、相互影响的故障。轴承的复合故障是由于各种故障类型的并发和耦合,可能的故障模式数呈指数增长。因此,轴承的复合故障很常见,并很难提取和识别。

传统的复合故障诊断方法主要包括基于分析模型的方法,基于定性经验和基于信号分析的复合故障诊断。分析模型为某些特定故障建立了精确的物理或数学模型。定性经验法利用不完全先验知识建立诊断的定性模型推理。信号分析方法通过分析复合故障信号来识别复合故障的特征。这些方法要求先验知识,导致很难在真实世界工业场景中应用

深度神经网络在没有先验知识的情况下提供了一个端到端的方法将原始数据映射为期望的输出。近年来,深度神经网络模型已经识别故障和协助诊断方面取得了很好的发展。大多数基于深度学习的方法侧重于单一故障诊断,而用于复合故障诊断的方法主要关注于设计不同结构的深度神经网络。这些模型从大量有标注的样例训练以实现满意的性能。复合轴承故障由于各种类型故障并发和耦发,可能故障模式的数量呈指数增加。然而,在实际工作条件中,复合故障的故障模式数呈指数增长,故障特征多样化。除此之外,复合故障样本很难收集和标注,这限制了现有的基于深度学习复合故障诊断方法的应用

一个可行的策略是获取单个故障轴承标注样本这是易于实现的。这个问题变成了使用故障数据样本识别不可知复合故障。黄等,提出了一个深度集成胶囊网络(DECN用于智能复合故障诊断,这个网络有效的将复合故障解耦为两个单独的故障。还有人提出了一种用于零样本复合故障诊断的标签描述(LDS)嵌入模型。该方法利用局部连通受限玻尔兹曼机(LCRBM)提取单个故障样本的特征。建立LDS时,维数等于单个故障类型的数量。通常,使用这种方法构建的LDS的维数相对较低,这限制了其性能。

为了解决从单一故障数据中学习未知复合故障的问题,本文在特征和语义之间引入了一个共享的中间层嵌入。提出的模型使用一个从单个故障学习的模型来最小化故障特征和信号衍生语义之间的差异,从而实现复合故障分类。不像DECN要求大量的传感器去收集振动信号和一个预先训练的胶囊网络模型集合,该方法利用一个传感器采集的信号提取距离特征进行模型开发,大大降低了模型的复杂度。

这一篇文章主要的贡献概述如下:

  1. 提出了单个故障振动信号训练的零试学习复合故障诊断模型去识别未知复合故障。它可以实现无或极度罕见样本复合故障的诊断;
  2. 我们设计了故障语义来表达单一故障和复合故障的先验知识。利用单个故障的振动信号构造故障语义,而复合故障的故障语义是从单个故障的故障语义派生出来的。这样可以从单一故障示例中学习,并对复合故障进行分类。
  3. 我们的零试学习方法映射故障语义,使其具有与信号特征匹配的维度。该方法的训练过程将单个故障的信号特征与其故障语义相匹配。训练后的模型通过计算信号特征和故障语义之间的欧氏距离来识别复合故障。

相关工作

基于嵌入模型的零试学习:零试学习是一种解决训练集和测试集不相交时类别标签缺失问题的目标分类技术。零试学习的基本思想是利用一些可见类别的数据,辅以相关的一般知识信息或先验知识作为属性标签,训练一定的学习模型,最终识别未知类别的数据。

目前流行的实现方法是本文中使用的基于嵌入模型的方法。模型嵌入所有的特征和类别标签的语义属性到一个确定的空间,然后根据相似性方法分类样本。已有的已出版的工作可以划分为3个方向:语义空间嵌入模型,公共空间嵌入模型和视觉空间嵌入模型

基于语义空间的方法:基于语义空间的方法,直接将样本的特征映射到语义空间,使用相似性度量找到语义空间中最接近特征的语义,然后标记相应的类别。

基于公共空间的方法:基于公共空间的方法将样本的特征和语义映射到一个子空间。在这个子空间中,模型尽可能地保存原始空间中地语义和视觉特征信息,然后根据语义和特征地匹配分类。

基于视觉空间地方法:基于视觉空间的方法将样本的语义映射到视觉空间,能够解决语义空间引起的枢纽度问题

零试学习的属性定义方法

在基于嵌入模型的方法中,类别标签语义属性的定义是核心问题。语义属性是一类重新表示对象具体类别的先验知识。这里有两个一般的策略定义语义属性:属性学习和人工定义

属性学习的方法主要包括单词嵌入和文本嵌入单词嵌入方法使用自然语言处理模型,如:Word2Vec和GloVe,将类别标签名嵌入到值空间中,以获得他们的向量度量表示。文本嵌入方法对类别的文本进行描述,然后将文本描述转化为类别的故障语义。人工定义的方法通过对数据的特征对类别的某些属性进行编码,以获得故障语义。从而,他们仅适合图像数据因为图像数据的特征如:颜色,位置,和习惯都可以通过视觉看到。

尽管已经存在的属性定义方法在图像数据上已经取得了不错的结果,然而,它们不能很好地适应故障诊断领域中振动数据的故障类别属性。主要有如下几个原因:

  1. 如果我们使用人工的方法定义故障语义,我们一般使用故障频率、峰值、峰峰值等,去描述故障特征,但是特征的类别太少,无法描述故障类别属性因此人工定义的方法不能够准确的表示不同故障的语义属性。
  2. 如果采用属性学习的方法定义故障语义,由于相似的单词在语义空间非常相近,如图1所示,故障语义很难被区分,尤其是在故障领域,内圈、外圈和滚动体故障,在语义空间非常相邻。该模型很难找到最接近视觉特征的故障语义,从而严重降低了模型的分类能力。

用于轴承复合故障诊断的零试学习_第1张图片

用于轴承复合故障诊断的零试学习_第2张图片

用于轴承复合故障诊断的零试学习_第3张图片

用于轴承复合故障诊断的零试学习_第4张图片

 

用于轴承复合故障诊断的零试学习_第5张图片

 模型结构:为了克服复合故障样本难以收集和标注的问题,提出了一种轴承零试学习复合故障诊断模型,通过对轴承单故障数据进行训练来识别复合故障。如图3所示,模型由三个部分组成:特征提取模块、语义处理模块和语义嵌入模块

用于轴承复合故障诊断的零试学习_第6张图片

 特征提取模块:由于CNN提取的故障特征有良好的识别能力,我们选择CNN作为特征提取工具。网络由归一化卷积层、池化层、展平层和归一化的全连接层组成。为了方便,我们使用C,P,F和FC分别表示归一化的卷积层、池化层、展平层和归一化的全连接层。特征提取器的输入是一个二维的时频矩阵。最后一个全连接层的输出是特征向量。CNN的结构见表1。

用于轴承复合故障诊断的零试学习_第7张图片

用于轴承复合故障诊断的零试学习_第8张图片

用于轴承复合故障诊断的零试学习_第9张图片

 用于轴承复合故障诊断的零试学习_第10张图片

用于轴承复合故障诊断的零试学习_第11张图片

 模型的训练和应用:我们提出的算法见表2。在训练阶段,使用小波变换将单故障数据样本变换为二维时频图,从中提取特征。大量连续的数据点被选择,并通过语义处理模块编码去获取一个向量。语义嵌入模块嵌入故障语义到视觉语义空间。最后,训练的模型使特征和故障语义相匹配。

 在测试阶段,测试样本的复合故障数据使用小波变换变换成一个时域图。然后特征提取器提取时频图的特征。通过单故障语义的逻辑或运算,获取复合故障语义。通过计算过视觉特征和故障语义之间的欧几里的距离识别样本的故障类。

用于轴承复合故障诊断的零试学习_第12张图片

总结

为了解决复合故障数据在实际工业情境中难以收集和标注的困难,我们提出了一个零试学习复合故障诊断模型,其使用单样本故障去预测复合故障类。通过两层CNN提取故障振动数据的高维特征,设计故障语义特征去表达故障类别信息。我们在特征空间和故障语义空间之间引入了人一个共享中层语义嵌入空间。提出的模型复合故障特征和复合故障语义之间的相似性度量分类复合故障样本。

你可能感兴趣的:(零试学习,故障诊断,深度学习,人工智能)