智能维护的目标是为了解决生产制造中出现的问题,包括设备的停机、部件的损坏,质量的不良以及能量的低利用率。我们要解决这些问题并不能从这些问题产生的表象入手,而是要关注产生这些表象的原因,我们一般称这些原因为不可见问题。不可见问题包括零件的磨损、腐蚀、泄露、人为操作甚至是环境因素,这些因素有多种多样的表征形式,这些因素很可能会互相耦合、交叉,共同作用产生这些失效。对于这种情况,我们要从源头入手来避免这些问题。 要避免这些问题,需要利用监控、分析甚至是决策支持手段来去解决这些问题。那么,如何避免不可见问题的发生呢?很重要的一点就是做预测。
维护策略的演进按照上面几个步骤进行:
随着维护技术的发展,设备生命周期内的维护成本是逐渐降低的,但是模型的复杂程度会逐渐升高,即系统的智能化程度不断升高。
PHM是一种系统工程学科,它聚焦于对复杂工程系统健康状态的检测、预测与管理。PHM所关注的问题可概括为以下几个方面:
失效发生的平均时间(MTBF)是可靠性里面的重要概念。这个概念所针对的是被大批量生产、重复性比较大的设备,我们单纯基于时间就可以统计出可靠性的指标(MTBF)。在PHM中,我们关心的不是失效的平均间隔时间,而是失效发生之前发生衰退的时间(MTBD)。
从特征空间中我们可以看到,如果设备处于一个健康的状态,它会处于一个特定的分布范围内;如果设备失效的话,则会在特征空间发生漂移,如果我们的设备的状态进行实时监测,我们就可以预测出什么时候跑出失效边界,从而预测剩余寿命。
那么,是不是所有的系统都可以做剩余使用寿命预测?做剩余使用寿命预测需要全生命周期的数据。
上图展示了不同层次的PHM系统功能
开发流程如下:
为什么需要进行数据预处理?
数据预处理的目标:降低工业数据“3B”问题对建模的影响
工况分割
工况分割目的:将设备在不同运行状态下的数据能够分割出来,来做后续有针对性的特征提取
常见的工况参数:速度(流速、转速)、环境参数(湿度、温度)、负载、Task/Recipe
数据清洗与平滑
数据清洗:将数据中的异常点尽可能去除,降低其对模型训练的干扰
4种基于数据分布的异常点检测算法:
针对时间序列数据,往往采用数据平滑的方法降低噪声的影响
(振动)数据质量检测
分析振动信号数据是否正常,对不正常的振动信号做一些特别的处理
数据归一化
数据归一化:将数据中不同的变量/特征值转换到同样的分布或者取值区间中
目的:提高数据建模的精度;加速模型训练的参数优化求解过程
典型案例:将CNC机床主轴振动信号的不同特征值做归一化处理以便训练神经网络异常检测模型
数据样本平衡
通过数据过采样、重采样或者欠采样改善数据不同类别的平衡性,提高建模的精度
典型案例:通过过采样增加电力电子器件故障预测模型的故障样本数据
数据分割
将数据集分割成训练集、验证集与测试集,以用作不同的目的。尤其是对于分类模型,需要采样分层抽样的方法,来确保各个数据集之间不同类型的样本的比例是基本保持一致的
特征提取的目的是通过采用合适的特征提取方法从原始数据中提取与建模相关的有效特征来建立模型。常用的特征提取方法包括:
时域特征包括:RMS、峰峰值、峭度、裕度、歪度、均值、均方根、脉冲因数、波形因数、波峰因数。
上图(a)展示了四种不同健康条件下的轴承振动信号,从振动信号波形图中可直观看出轴承健康程度不同对应信号波形特征以及幅值大小也不同。
上图(b)展示了柴油机四种不同健康状态下振动信号的特征参数,可以看出:不同状态下特征参数存在差异。
频域特征提取主要包括:
上图一是轴承正常状态下所对应的FFT频谱,上图二是轴承出现磨损情况下所对应的FFT频谱,从这两个图中,我们可以清晰的看到:当轴承出现磨损的时候,会在4000Hz8000Hz这个区间出现共振频带,所以,我们可以将4000Hz8000Hz这个频段的能量作为区分发电机轴承磨损与正常状态下的特征参数。另外,我们可以对这个共振频带进行解调得到包络谱,在包络谱中,我们可以看到轴承对应的故障特征频率,如:下图一与下图二。从包络谱中,我们可以看到外圈故障特征频率(BPFO)与内圈故障特征频率(BPFI),因此,我们可以将特征频率作为特征参数来提取特征频率所对应的幅值。
常用的时频域分析方法包括:短时傅里叶变换(STFT)、小波分析。时频域分析适用于分析非平稳信号,针对非平稳信号的特征提取可考虑时频域分析。时频域分析的优点在于可以从时域、频域、幅值三个维度来观察信号的特征。
某典型非平稳信号的STFT结果如图所示:
在E1、E2、E3、E4这四个位置出现了能量比较集中的区域,对应的频率、时刻均不相同,所以,我们可以将E1、E2、E3、E4所对应的能量作为该信号的一个特征用于后续分析。可以将该区域所对应的幅值相加来作为该区域所对应的能量。
小波对齿轮箱高速端振动信号时频域分析如下图所示:(选用不同的小波。分析结果不同)
小波分析不同于短时傅里叶变换(STFT),小波分析所采用的的基函数是一种幅值衰减、可伸缩、可平移的一种小波基;而短时傅里叶变换(STFT)是基于FFT进行的,FFT的基函数是一种不限长的正弦函数,所以,通常情况下,小波分析要优于短时傅里叶变换,但是小波分析也有自身的缺点,比如小波基比较难以选择,当我们选择不同的小波基时,最后所产生的结果不相同。如上图一,采用Cmor3-3小波进行分析,我们可以在A这个位置清晰的发现齿轮箱啮合频率,而上图二并没有提取出齿轮箱啮合频率。对比上面两图,我们可以发现:采用不同的小波对最后的结果会产生比较大的影响。在实践中,我们可以尝试多种小波,选择分析效果最好的小波作为小波基。
特征选择的目的:
特征选择的常用方法:
基于经验方法
利用专家领域知识选择相应的变量(如:轴承特征参数通常选RMS、峰峰值、峭度值、歪度,与风电机组振动相关的参数包括:功率、转速、风速)。当轴承出现磨损时,轴承的RMS、峰峰值、峭度值、歪度就会发生变化,所以,我们可以将轴承的RMS、峰峰值、峭度值、歪度作为有效特征来进行选择。风电机组同理
基于封装的特征选择方法
过滤法
互信息法:某个特征与某类之间的互信息越大,表明该特征越有效,后续选择该特征进行建模
Fisher score:选择得分高的特征作为有效特征。
Fisher score原理是通过判断每个特征和各类样本之间方差大小来对各特征进行评分,若该特征与某类样本方差小,与其他类样本方差大,则该特征得分高,属于有效特征,利于数据分析。
Fisher score的计算方法如下:
式中, n k n_k nk表示第 k k k类样本的个数, f j , i f_{j,i} fj,i表示第 i i i个特征在第 j j j个样本里的值, u f i u_{f_i} ufi表示第 i i i个特征 f i f_i fi的均值, u f i k u_{f_i}^k ufik表示第 i i i个特征 f i f_i fi在第 k k k类中的均值。
柴油机燃爆故障检测:
对四冲程柴油机的四个冲程进行分割
定义燃烧段:从喷射燃油到排气冲程开始
测量信号:缸内压力信号、柴油机振动信号
下图给出了柴油机不同故障状态下特征参数的Fisher Score,柱状图给出了各特征参数的得分,得分越高表明该参数的有效性越高
降维的目的:
常用的降维的方法是基于PCA的降维,通过空间转换将高维数据转化为低维数据,通过PCA降维可减少原参数之间的相关性。PCA降维是寻找能代表原特征参数绝大部分信息的主成分。
健康评估的目标是将高维特征向量转换为单个健康指数(健康状态、健康置信度CV等)。健康指标类型有
以物理量作为健康指标
基于概率的健康指标
虚拟健康指标
数据驱动的健康评估分为两个阶段:训练阶段与验证阶段。训练阶段是基于历史数据训练健康评估模型。验证阶段是将当前转台与已训练好的健康评估模型计算得到健康值。
逻辑回归
线性回归:自变量线性组合估计因变量
y = α + β 1 x 1 + β 2 x 2 + . . . + β i x i y=\alpha+\beta_1x_1+\beta_2x_2+...+\beta_ix_i y=α+β1x1+β2x2+...+βixi
逻辑回归:自变量线性组合估计因变量的概率
I n ( P r ( y = 1 ) 1 − P r ( y = 1 ) ) = α + β 1 x 1 + β 2 x 2 + . . . + β i x i In(\frac{Pr(y=1)}{1-Pr(y=1)})=\alpha+\beta_1x_1+\beta_2x_2+...+\beta_ix_i In(1−Pr(y=1)Pr(y=1))=α+β1x1+β2x2+...+βixi
训练:需要健康和故障的带标签数据
最终的健康值为: C V ( x ) = e x p ( α + β 1 x 1 + β 2 x 2 + . . . + β k x k ) 1 + e x p ( α + β 1 x 1 + β 2 x 2 + . . . + β k x k CV(x)=\frac{exp(\alpha+\beta_1x_1+\beta_2x_2+...+\beta_kx_k)}{1+exp(\alpha+\beta_1x_1+\beta_2x_2+...+\beta_kx_k} CV(x)=1+exp(α+β1x1+β2x2+...+βkxkexp(α+β1x1+β2x2+...+βkxk)
统计模式识别(只有健康数据而没有故障数据时,会使用这个方法来计算健康值)
计算当前特征分布和健康特征分布的偏移程度(假设符合高斯分布)。 对于非高斯分布的情况,使用高斯混合模型进行拟合
高斯混合模型(GMM):一种混合分布密度估计的概率模型
H ( x ) = ∑ i = 1 n p i h ( x ; θ i ) H(x)=\sum_{i=1}^np_ih(x;\theta_i) H(x)=∑i=1npih(x;θi)
每个分量模型可以用以下参数表达:
健康值CV:多个高斯模型L2距离的平均值
在高斯混合模型中,模型选择的个数是一个重要的超参数,会用到一些参数选择的指标/准则-AIC准则与BIC准则,会用于平衡模型的复杂度与模型的准确度,惩罚过多的模型变量。
A I C = 2 K − 2 l n ( L ) B I C = K l n ( n ) − 2 l n ( L ) AIC=2K-2ln(L)\\BIC=Kln(n)-2ln(L) AIC=2K−2ln(L)BIC=Kln(n)−2ln(L)
自组织映射神经网络(SOM)
将高维数据转化为U-matrix,数据可视化效果突出,可用于无监督或有监督问题
自联想神经网络:数据重构,用于挖掘多维特征之间的非线性关系
基本思想是训练出健康状态的模型,将当前状态的数据放到模型中,计算出模型拟合的残差,残差值越大表明离健康状态的偏移值越高
三杯风速计是风资源评估研究的行业标准。风力资源评估是风场开发的第一步。风电开发商将其用于估算拟建场地的未来能源产量。风速仪受损或者超出公差范围都将影响到对风场能源产量的准确评估,尤其是无法及时监测到受损风速仪将会严重影响投资回报率的评估,例如,年平均风速估计值的2%误差可能导致发电量差异达到6%,这直接影响投资回报率。
数据( 2011年PHM数据竞赛-风速仪健康评估数据)结构:
将训练数据进行数据过滤、数据归一化后,放入自联想神经网络(AANN)中进行训练,并将训练的模型保存进来。将测试数据经过同样的处理后也放到训练好的模型里,计算得到残差。最后,做一个残差的聚类,观察有没有工况的变化,最后就可以得出风速仪是否是正常的。
这里的数据归一化是将不同高度的风速转换到相同高度
这里的模型集成了多个AANN模型,降低了不确定性
残差信号的K-Means聚类:双峰分布
上图是残差的频次统计直方图,从直方图上可以看出是双峰的分布,因此,可以猜想这是由于连个工况导致的,需要计算当前状态的风速仪偏移某一个状态的距离,即计算残差和正常分布的偏移度,设定失效阈值。
故障诊断是通过检查观察到的症状来确定问题的本质。故障诊断的目标是将高维特征向量转换为状态标识(健康状态、失效模式1、失效模式2、…、失效模式N)。在数据驱动的故障诊断中分为两个阶段:
支持向量机的核心思想:找到最优分类面将正负样本分开,使得样本到分类面的距离尽可能远。SVM在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并且能够推广应用到函数拟合等其他机器学习问题中。
SVM对于二维空间非线性可分数据,可以引入核函数技巧,利用核函数把低维特征映射到高维空间,实现线性可分。
同时,它也可以解决多分类的故障诊断问题。
机器学习中也有其他常用的分类算法:
“自组织”指的是学习和组织信息的能力,不需要为输入模式提供相应的依赖输出值,是一种无监督式学习。SOM是一种常见的神经网络技术,优点在于能够不断学习训练数据的内在模态与模式,形成神经网络的模型,将一些高维的特征矩阵转化成二维的蜂窝状的映射图(SOM可视化效果非常好),实现故障的分类。
SOM的核心机制是竞争学习,训练过程为:根据训练数据样本大小与特征维度来构造初始的SOM网络的模型结构,数据训练出U-matrix,用当前状态的特征向量放入U-matrix中,查看位置处于何处,找到离它最近的best matching unit(bmu),当前位置与bmu的欧氏距离即为MQE,MQE用于评估其健康状态。
SOM在做故障诊断与健康评估是有区别的。
SOM优点:
SOM的缺点:
前面两种方法都是从数据本身出发,不要数据本身的先验知识;而在工业大数据场景下,有一些非常重要的机理,贝叶斯网络可以将这些机理统计起来形成条件概率。
P ( A ∣ B ) = P ( A , B ) P ( B ) P(A|B)=\frac{P(A,B)}{P(B)} P(A∣B)=P(B)P(A,B)
贝叶斯网络是一种图模型结构将复杂系统内所有可能发生的情况结构化的表达出来。有向无环图如下:
这样就会得出统计所有的图上的依赖关系,去得到一个条件概率分布图(表)。
构建贝叶斯网络的流程如下:
轴承是一种典型的旋转机械,它具有多种模式的振动信号,有可能是多种故障耦合在一起,所以无法直接从数据中得到。
对于振动信号,我们一般采用频域分析与时频域分析,提取频域上与时频域上的特征来进行故障诊断。
常见的故障类型有:
轴承故障诊断步骤(自组织映射神经网络故障诊断步骤):
准备数据集,确定类标签
根据需要的详细程度确定显示大小
选择SOM模型的网格样式
设置超参数
训练数据生成SOM模型
用Hit-point来测试SOM模型
剩余使用寿命预测就是估计监测对象从当前到失效的时间。每一个设备或部件都有一个额定的运行时长,当使用到一定程度时,部件就会失效。所以,剩余使用寿命预测的目标就是根据当前已经积累的运行数据来预测部件接下来的衰退模式即该部件距离某一种故障模式还有多长时间,来指导部件的预测性维护,实现更精准的部件备件的管理。
与故障诊断模型不一样的是,在做剩余使用寿命预测时,故障还没有完全发生,还在演进期的过程中,所以,我们在做剩余使用寿命预测时,往往采用回归的建模方法。
从机理上讲,大部分机械设备的衰退都是符合“浴缸”曲线的。大约90%都是处于性能平稳期,在寿命剩余10%时,寿命会快速衰退直到最后的失效。所以,剩余使用寿命预测通常在快速演进期内做预测。
在建立剩余使用寿命预测模型有三种技术路径:
线性回归与非线性回归
在使用回归算法时,会使用健康值或者特征值作为自变量来预测未来的健康值。即使用过去的数据来预测未来的数据
自回归积分滑动平均(ARIMA),ARIMA的本质也是线性的多项式
X t = ∑ j = 1 p a j X t − j + ∑ j = 0 q b j ϵ t − j X_t=\sum_{j=1}^pa_jX_{t-j}+\sum_{j=0}^qb_j\epsilon_{t-j} Xt=∑j=1pajXt−j+∑j=0qbjϵt−j
这个模型常用于短时预测,好处是针对带有随机波动的时间序列会有好的预测效果,预测使用的数据较少。
基于轨迹相似度的剩余寿命预测方法(TSBP)
该方法通过多组全生命周期的数据来构建性能衰退曲线。测试时,滑动的寻找测试数据在曲线上的最相似的区间,以此作为测试数据当前的运行状态,并通过测试曲线剩余的时间作为设备的剩余使用寿命。
TSBP算法流程:
TSBP算法的优点:
剩余寿命评估指标用于衡量算法预测结果与真实值之间的偏差
航空发动机寿命预测,训练数据是多条发动机全生命周期的数据,测试数据是发动机一部分时间的衰退数据,而且在测试数据中缺少工作条件信息,在这种情况下,我们无法建立全局通用的模型来解释数据中存在不同的衰退模式,而且很难找到一个标准的失效阈值来设定发动机是否失效。所以,我们采用了基于轨迹相似度建模的TSBP算法来建立剩余使用寿命模型。
案例流程:
、
剩余寿命评估指标用于衡量算法预测结果与真实值之间的偏差