基于PCA的线性监督分类的故障诊断方法-T2与SPE统计量的计算

基于PCA的线性监督分类的故障诊断方法

  • 基于PCA的线性监督分类的故障诊断方法
    • 数据预处理
    • $T^2$统计量的计算
      • 故障判定
      • 参考链接:
    • SPE统计量(也称Q统计量)的计算
      • 故障判定
      • 参考链接:

基于PCA的线性监督分类的故障诊断方法

数据预处理

训练集样本(只有正样本)为 X n ∗ m {{\rm{X}}_{{\rm{n*m}}}} Xnm (需要列均值为零,采用z-score归一化即可),每行一个样本,样本数目n,特征维度m。

计算m个特征之间的协方差矩阵(也有文献是除以n):
∑ m ∗ m = 1 n − 1 X T X {\sum _{{\rm{m*m}}}}{\rm{ = }}\frac{1}{{{\rm{n - 1}}}}{{\rm{X}}^{\rm{T}}}{\rm{X}} mm=n11XTX
求协方差矩阵的特征值 λ i \lambda_i λi与特征向量 p i p_i pi,并将特征值按从小达到顺序排列:
λ 1 ≥ λ 2 ≥ ⋯ ≥ λ k ≥ λ k + 1 ≥ ⋯ ≥ λ m {\lambda _{\rm{1}}} \ge {\lambda _{\rm{2}}} \ge \cdots \ge {\lambda _k} \ge {\lambda _{k + 1}} \ge \cdots \ge {\lambda _m} λ1λ2λkλk+1λm
将特征向量按照对应的特征值重新排列。假设排序后为:
V m ∗ m = [ p 1 , p 2 , ⋯   , p m ] {{\rm{V}}_{{\rm{m*m}}}}{\rm{ = [}}{p_1},{p_2}, \cdots ,{p_m}{\rm{]}} Vmm=[p1,p2,,pm]
按照某个原则(如特征值累计和的占比),选择前k个特征值进行PCA降维。令前k个从大到小的特征值构成对角阵 S k ∗ k S_{k*k} Skk,k个对应的特征向量组成降维矩阵 P m ∗ k P_{m*k} Pmk。即:
S k ∗ k = d i a g ( λ 1 , λ 2 , ⋯   , λ k ) {{\rm{S}}_{{\rm{k*k}}}}{\rm{ = diag(}}{\lambda _{\rm{1}}}{\rm{,}}{\lambda _{\rm{2}}}{\rm{,}} \cdots ,{\lambda _k}) Skk=diag(λ1,λ2,,λk)

P m ∗ k = [ p 1 , p 2 , ⋯   , p k ] {{\rm{P}}_{{\rm{m*k}}}}{\rm{ = [}}{p_1},{p_2}, \cdots ,{p_k}{\rm{]}} Pmk=[p1,p2,,pk]

PCA降维之后,样本数目仍为n,特征数目变为k,降维公式:
X ~ n ∗ k = X P {{\rm{\tilde X}}_{{\rm{n*k}}}}{\rm{ = XP}} X~nk=XP
注:重构公式是(X’是X降维后重构得到的矩阵):
X ′ = X ~ n ∗ k P T = X P P T {\rm{X' = }}{{\rm{\tilde X}}_{{\rm{n*k}}}}{{\rm{P}}^{\rm{T}}}{\rm{ = XP}}{{\rm{P}}^{\rm{T}}} X=X~nkPT=XPPT

T 2 T^2 T2统计量的计算

对于新样本 x n e w ( m ∗ 1 ) x_{new(m*1)} xnew(m1),(注:应使用训练样本归一化的参数对新样本归一化操作),其 T 2 T^2 T2统计量计算公式如下:
T 2 = x n e w T P S − 1 P T x n e w = ∥ S − 1 / 2 P T x n e w ∥ 2 2 {\rm{T2 = }}x_{new}^T{\rm{P}}{{\rm{S}}^{{\rm{ - 1}}}}{{\rm{P}}^T}{x_{new}}{\rm{ = }}\left\| {{{\rm{S}}^{ - 1/2}}{{\rm{P}}^T}{x_{new}}} \right\|_2^2 T2=xnewTPS1PTxnew=S1/2PTxnew22
其中 S − 1 / 2 S^{-1/2} S1/2表示对矩阵中每个非零元素(非零的那些 λ \lambda λ)取-1/2指数。 ∥ ∙ ∥ 2 {\left\| \bullet \right\|_2} 2是向量2范数。

T 2 T^2 T2统计量的控制限计算公式:
T α = k ( n 2 − 1 ) n ( n − k ) F α ( k , n − k ) {{\rm{T}}_\alpha }{\rm{ = }}\frac{{{\rm{k(}}{{\rm{n}}^{\rm{2}}}{\rm{ - 1)}}}}{{{\rm{n(n - k)}}}}{F_\alpha }({\rm{k,n - k}}) Tα=n(nk)k(n21)Fα(k,nk)
其中, 1 − α {1-\alpha} 1α是置信度, F α ( k , n − k ) {F_\alpha }({\rm{k,n - k}}) Fα(k,nk)是服从第一自由度为k,第二自由度为n-k的F分布。

注:由于不同地方似乎对 α \alpha α称呼不一致,此处特指满足一下概率公式的 α \alpha α
P { F ( n 1 , n 2 ) > F α ( n 1 , n 2 ) } = α P{\rm{\{ F(}}{{\rm{n}}_{\rm{1}}}{\rm{,}}{{\rm{n}}_{\rm{2}}}{\rm{) > }}{{\rm{F}}_\alpha }{\rm{(}}{{\rm{n}}_{\rm{1}}}{\rm{,}}{{\rm{n}}_{\rm{2}}}{\rm{)\} = }}\alpha P{F(n1,n2)>Fα(n1,n2)}=α
所以,在此定义下, α \alpha α取值通常为0.01左右。由于定义相反,有的文献则是0.99左右。

故障判定

如系统正常运行,则样本的 T 2 T^2 T2值应该满足 T 2 < T α {T^2}<{T_{\alpha}} T2<Tα,反之,可认为出现故障。

参考链接:

https://wenku.baidu.com/view/b9ef2df9dd3383c4bb4cd2e0.html

SPE统计量(也称Q统计量)的计算

对于新样本 x n e w ( m ∗ 1 ) x_{new(m*1)} xnew(m1),其 S P E SPE SPE统计量计算公式如下:
S P E = x n e w T ( I − P P T ) x n e w {\rm{SPE = }}x_{{\rm{new}}}^{\rm{T}}({\rm{I - P}}{{\rm{P}}^{\rm{T}}}){x_{{\rm{new}}}} SPE=xnewT(IPPT)xnew
S P E SPE SPE统计量的控制限计算公式:
Q α = θ 1 [ c α h 0 2 θ 2 θ 1 + 1 + θ 2 h 0 ( h 0 − 1 ) θ 1 2 ] 1 / h 0 {{\rm{Q}}_\alpha }{\rm{ = }}{\theta _1}{[\frac{{{c_\alpha }{h_0}\sqrt {2{\theta _2}} }}{{{\theta _1}}} + 1 + \frac{{{\theta _2}{h_0}({h_0} - 1)}}{{\theta _1^2}}]^{1/{h_0}}} Qα=θ1[θ1cαh02θ2 +1+θ12θ2h0(h01)]1/h0
其中:
θ r = ∑ j = k + 1 m λ j r ( r = 1 , 2 , 3 ) {\theta _{\rm{r}}}{\rm{ = }}\sum\limits_{j = k + 1}^{\rm{m}} {\lambda _j^r(r = 1,2,3)} θr=j=k+1mλjr(r=1,2,3)

h 0 = 1 − 2 θ 1 θ 3 3 θ 2 2 {h_0} = 1 - \frac{{2{\theta _1}{\theta _3}}}{{3\theta _2^2}} h0=13θ222θ1θ3

c α c_{\alpha} cα是标准正态分布的置信极限,满足如下公式:
P { N ( 0 , 1 ) > N c α ( 0 , 1 ) } = c α P{\rm{\{ N(0,1) > }}{{\rm{N}}_{{{\rm{c}}_\alpha }}}{\rm{(0,1)\} = }}{{\rm{c}}_\alpha } P{N(0,1)>Ncα(0,1)}=cα
所以,这种定义方式下 α \alpha α也是取值0.01左右。

故障判定

如系统正常运行,则样本的 S P E SPE SPE值应该满足 S P E < Q α {SPE}<{Q_{\alpha}} SPE<Qα,反之,可认为出现故障。

参考链接:

https://wenku.baidu.com/view/b9ef2df9dd3383c4bb4cd2e0.html

https://wenku.baidu.com/view/f8b6c51c08a1284ac9504339.html

你可能感兴趣的:(故障诊断,机器学习)