异常检测-T² (Hotelling‘s T-squared) 统计量和SPE (Squared Prediction Error) 统计量

T² 统计量和 SPE 统计量

  • 一、T² (Hotelling's T-squared) 统计量:
  • 二、SPE (Squared Prediction Error) 统计量:

基于主成分分析 (PCA) 的故障诊断是一种常见的统计方法,用于检测和识别过程中的异常情况。在这种方法中,T² (Hotelling’s T-squared) 统计量和SPE (Squared Prediction Error) 统计量是两个核心指标。

一、T² (Hotelling’s T-squared) 统计量:

1、定义与意义: T² 统计量是一种多变量统计方法,用于判断给定的观测值是否与其他观测值的中心位置有显著的偏差。换句话说,它测量了一个样本点与数据集中心之间的距离。

2、计算: T² 的计算通常基于样本的主成分得分。在PCA上下文中,它的定义通常是:

T 2 = x T P Λ − 1 P T x   T ^ 2 =x T PΛ ^{−1} P T x \ T2=xTPΛ1PTx 

其中, x x x是观测值, P P P是主成分加载矩阵,而 Λ Λ Λ是主成分的方差(特征值)对角矩阵。

3、应用: T² 通常与一个临界值比较,该临界值基于F-分布确定。如果一个样本的T² 值超过这个临界值,那么该样本被视为异常或偏离中心。

4、T² (Hotelling’s T-squared) 控制限的计算:
T²统计量的分布在大样本情况下接近于F分布。对于主成分分析中的T²统计量,其控制限
U C L T 2 UCL_{T^2} UCLT2通常通过以下公式计算:
U C L T 2 = ( n − 1 ) p n − p F α , p , n − p UCL_{T^2} = \frac{(n-1)p}{n-p} F_{\alpha,p,n-p} UCLT2=np(n1)pFα,p,np

其中:
α \alpha α 是样本数。
p p p 是主成分的数量。
F α , p , n − p F_{\alpha,p,n-p} Fα,p,np 是在给定的显著性水平 α \alpha α 下,自由度为 p p p n − p n-p np 的F分布的临界值。

二、SPE (Squared Prediction Error) 统计量:

1、定义与意义: SPE 用于度量观测值与通过PCA模型预测的值之间的差异。它测量了样本点与PCA模型平面之间的距离,反映了数据中没有被PCA模型捕获的信息量。

2、计算: 在PCA的上下文中,SPE可以被定义为:
S P E = ∥ x − x r e c o n s t r u c t e d ∥ 2 SPE = \| x - x_{reconstructed} \|^2 SPE=xxreconstructed2
其中, x x x 是原始的观测值,而 x r e c o n s t r u c t e d x_{reconstructed} xreconstructed 是通过PCA模型重构的观测值。

3、应用: 与T² 类似,SPE的值可以与一个临界值进行比较,以确定观测是否与模型的预测存在显著差异。如果SPE的值超过临界值,则样本可能包含重要的、未被PCA模型捕获的信息,因此可能被视为异常。

4、SPE (Squared Prediction Error) 控制限的计算:
SPE的分布是非中心的,并不遵循任何已知的常见分布。但其控制限
可以使用如下方法估计:
U C L S P E = ϕ λ k + 1 UCL_{SPE} = \phi \sqrt{\lambda_{k+1}} UCLSPE=ϕλk+1
其中:
λ k + 1 \lambda_{k+1} λk+1 是被舍弃的第一个主成分的特征值。
k k k 是在PCA模型中使用的主成分的数量。
ϕ \phi ϕ 是一个常数,通常选择在3到5之间,取决于需要的控制限的严格性。

你可能感兴趣的:(机器学习,算法,人工智能,机器学习)