平方预测误差(Squared prediction error,SPE)和霍特林统计量(Hotelling’s T2)原理

读Paper读的头炸(原因:太菜),坚持每天简单通俗总结一下!

故障检测是多变量过程监控的第一步。

通常,SPE(或Q-统计量)和霍特林的T2指数分别用于监测RS和PCS的正常变异性。

应注意的是,PCA或PLS建模不要求数据为高斯分布。高斯假设仅用于推导故障检测指数的适当控制限值。此外,在推导控制限值时,不需要样本的时间独立性,因为仅指定I类错误来控制假警报率。当涉及II类错误时,监测测量的时间独立性是必要的,即未检测到的故障率。

当测量值假设为高斯分布时,通常适合使用马氏距离来定义故障检测的正常区域,例如,在主分量子空间中。然而,由于过程数据通常高度相关,这使得剩余分量的方差接近于零,因此在RS中使用马氏距离将是病态的。因此,Q统计量或SPE使用欧几里德距离来定义故障检测的正常区域。由于这两个指标的互补性,还提出了用于故障检测和诊断的组合指标。

以下,我总结了这些故障检测指标。

平方预测误差(Squared prediction error,SPE)

SPE指数测量样本向量在剩余子空间上的投影,

S P E ≡ ∥ x ~ ∥ 2 = ∥ ( I − P P T ) x ∥ 2 (1) \mathrm{SPE} \equiv\|\tilde{\boldsymbol{x}}\|^{2}=\left\|\left(\mathbf{I}-\mathbf{P} \mathbf{P}^{T}\right) \boldsymbol{x}\right\|^{2}\tag{1}S P E ≡∥x ~∥2 =∥∥​(I −P P T )x ∥∥​2 (1 )

如果出现以下情况,则该过程视为正常

S P E ⩽ δ 2 (2) \mathrm{SPE} \leqslant \delta^{2}\tag{2}S P E ⩽δ2 (2 )

其中 δ 2 \delta^{2}δ2 表示SPE的控制限值。Jackson和Mudholkar(1979)提出了控制极限 δ 2 \delta^{2}δ2 的表达式,该表达式近似于三阶矩的SPE分布。

当故障发生时,故障样本向量 x \mathbf{x}x 由与故障部分叠加的正常部分组成。故障会使SPE大于 δ 2 \delta^{2}δ2 ,从而导致检测到故障。

霍特林统计量(Hotelling’s T2)

Hotelling的T 2 T^2 T 2测量了在主分量(PCS)中的变化,

T 2 = x T P Λ − 1 P T x (3) T^{2}=\boldsymbol{x}^{T} \mathbf{P} \boldsymbol{\Lambda}^{-1} \mathbf{P}^{T} \boldsymbol{x}\tag{3}T 2 =x T P Λ−1 P T x (3 )

在正态数据服从多元正态分布的情况下,T 2 T^2 T 2统计量与F F F分布有关

N − l l ( N − 1 ) T 2 ∼ F l , N − l (4) \frac{N-l}{l(N-1)} T^{2} \sim F_{l, N-l}\tag{4}l (N −1 )N −l ​T 2 ∼F l ,N −l ​(4 )

如果数据点的数目N较大,则T 2 T^2 T 2指数可以很好地近似于具有l l l个自由度的χ 2 \chi^2 χ2卡方分布,即,

T 2 ⩽ χ l 2 (5) T^{2} \leqslant \chi_{l}^{2}\tag{5}T 2 ⩽χl 2 ​(5 )

在正常情况下。在过程监控中,通常情况下,N非常大。因此,χ 2 \chi^2 χ2控制限值是足够的,并且经常在过程监控文献中使用。

当来自过程数据的分数不符合多元正态性假设时,T 2 T^2 T 2的限值在实践中是不可靠的。相比之下,残差的表现要好得多。

综合指标(Combined Indices)

在实践中,有时最好使用一个指标而不是两个指标来监控流程。

有的论文中建议采用组合统计,但不给出控制限。

也有论文,如在Yue和Qin(1998)、Yue和Qin(2001)中,提出了一种用于故障检测的组合指标,它将 SPE和T 2 T^2 T 2结合在一起,如下所示:

φ = SPE ⁡ ( x ) δ 2 + T 2 ( x ) χ l 2 = x T Φ x (6) \boldsymbol{\varphi}=\frac{\operatorname{SPE}(\boldsymbol{x})}{\delta^{2}}+\frac{T^{2}(\boldsymbol{x})}{\chi_{l}^{2}}=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x}\tag{6}φ=δ2 S P E (x )​+χl 2 ​T 2 (x )​=x T Φx (6 )

其中,

Φ = P Λ − 1 P T χ l 2 + I − P P T δ 2 (7) \mathbf{\Phi}=\frac{\mathbf{P} \mathbf{\Lambda}^{-1} \mathbf{P}^{T}}{\chi_{l}^{2}}+\frac{\mathbf{I}-\mathbf{P} \mathbf{P}^{T}}{\delta^{2}}\tag{7}Φ=χl 2 ​P Λ−1 P T ​+δ2 I −P P T ​(7 )

注意,Φ \mathbf{\Phi}Φ 是对称的和正定矩阵。

前辈大佬得出的控制极限,该结果提供了一个近似分布,其前两个矩与精确分布相同。作为二次指数,Φ \mathbf{\Phi}Φ 近似如下:

φ = x T Φ x ∼ g χ h 2 (8) \varphi=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x} \sim g \chi_{h}^{2}\tag{8}φ=x T Φx ∼g χh 2 ​(8 )

其中系数

g = tr ⁡ ( S Φ ) 2 tr ⁡ ( S Φ ) (9) g=\frac{\operatorname{tr}(\mathbf{S} \Phi)^{2}}{\operatorname{tr}(\mathbf{S} \Phi)}\tag{9}g =t r (S Φ)t r (S Φ)2 ​(9 )

以及χ 2 \chi^2 χ2分布的自由度
h = [ tr ⁡ ( S Φ ) ] 2 tr ⁡ ( S Φ ) 2 (10) h=\frac{[\operatorname{tr}(\mathbf{S} \Phi)]^{2}}{\operatorname{tr}(\mathbf{S} \Phi)^{2}}\tag{10}h =t r (S Φ)2 [t r (S Φ)]2 ​(1 0 )
在计算g g g和h h h之后,可以得到给定置信水平下的控制极限 φ \varphi φ 。

SPE和T 2 T^2 T 2共同定义的控制区域与组合指数的控制区域非常相似。然而,综合指标定义了一个更符合数据多正态性假设的椭圆区域。是单独使用组合指标,还是联合使用 SPE和T 2 T^2 T 2,取决于应用情况。

Original: https://blog.csdn.net/weixin_44333889/article/details/119449882
Author: 府学路18号车神
Title: 平方预测误差(Squared prediction error,SPE)和霍特林统计量(Hotelling’s T2)原理

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/694568/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球