平方预测误差(Squared prediction error，SPE)和霍特林统计量（Hotelling’s T2）原理

2023年7月15日下午3:44 • 人工智能 • 阅读 67

读Paper读的头炸（原因：太菜），坚持每天简单通俗总结一下！

故障检测是多变量过程监控的第一步。

通常，SPE（或Q-统计量）和霍特林的T2指数分别用于监测RS和PCS的正常变异性。

应注意的是，PCA或PLS建模不要求数据为高斯分布。高斯假设仅用于推导故障检测指数的适当控制限值。此外，在推导控制限值时，不需要样本的时间独立性，因为仅指定I类错误来控制假警报率。当涉及II类错误时，监测测量的时间独立性是必要的，即未检测到的故障率。

当测量值假设为高斯分布时，通常适合使用马氏距离来定义故障检测的正常区域，例如，在主分量子空间中。然而，由于过程数据通常高度相关，这使得剩余分量的方差接近于零，因此在RS中使用马氏距离将是病态的。因此，Q统计量或SPE使用欧几里德距离来定义故障检测的正常区域。由于这两个指标的互补性，还提出了用于故障检测和诊断的组合指标。

以下，我总结了这些故障检测指标。

平方预测误差(Squared prediction error，SPE)

SPE指数测量样本向量在剩余子空间上的投影，

S P E ≡ ∥ x ~ ∥ 2 = ∥ ( I − P P T ) x ∥ 2 (1) \mathrm{SPE} \equiv\|\tilde{\boldsymbol{x}}\|^{2}=\left\|\left(\mathbf{I}-\mathbf{P} \mathbf{P}^{T}\right) \boldsymbol{x}\right\|^{2}\tag{1}S P E ≡∥x ~∥2 =∥∥(I −P P T )x ∥∥2 (1 )

如果出现以下情况，则该过程视为正常

S P E ⩽ δ 2 (2) \mathrm{SPE} \leqslant \delta^{2}\tag{2}S P E ⩽δ2 (2 )

其中 δ 2 \delta^{2}δ2 表示SPE的控制限值。Jackson和Mudholkar（1979）提出了控制极限 δ 2 \delta^{2}δ2 的表达式，该表达式近似于三阶矩的SPE分布。

当故障发生时，故障样本向量 x \mathbf{x}x 由与故障部分叠加的正常部分组成。故障会使SPE大于 δ 2 \delta^{2}δ2 ，从而导致检测到故障。

霍特林统计量（Hotelling’s T2）

Hotelling的T 2 T^2 T 2测量了在主分量（PCS）中的变化，

T 2 = x T P Λ − 1 P T x (3) T^{2}=\boldsymbol{x}^{T} \mathbf{P} \boldsymbol{\Lambda}^{-1} \mathbf{P}^{T} \boldsymbol{x}\tag{3}T 2 =x T P Λ−1 P T x (3 )

在正态数据服从多元正态分布的情况下，T 2 T^2 T 2统计量与F F F分布有关

N − l l ( N − 1 ) T 2 ∼ F l , N − l (4) \frac{N-l}{l(N-1)} T^{2} \sim F_{l, N-l}\tag{4}l (N −1 )N −l T 2 ∼F l ,N −l (4 )

如果数据点的数目N较大，则T 2 T^2 T 2指数可以很好地近似于具有l l l个自由度的χ 2 \chi^2 χ2卡方分布，即，

T 2 ⩽ χ l 2 (5) T^{2} \leqslant \chi_{l}^{2}\tag{5}T 2 ⩽χl 2 (5 )

在正常情况下。在过程监控中，通常情况下，N非常大。因此，χ 2 \chi^2 χ2控制限值是足够的，并且经常在过程监控文献中使用。

当来自过程数据的分数不符合多元正态性假设时，T 2 T^2 T 2的限值在实践中是不可靠的。相比之下，残差的表现要好得多。

综合指标（Combined Indices）

在实践中，有时最好使用一个指标而不是两个指标来监控流程。

有的论文中建议采用组合统计，但不给出控制限。

也有论文，如在Yue和Qin（1998）、Yue和Qin（2001）中，提出了一种用于故障检测的组合指标，它将 SPE和T 2 T^2 T 2结合在一起，如下所示：

φ = SPE ⁡ ( x ) δ 2 + T 2 ( x ) χ l 2 = x T Φ x (6) \boldsymbol{\varphi}=\frac{\operatorname{SPE}(\boldsymbol{x})}{\delta^{2}}+\frac{T^{2}(\boldsymbol{x})}{\chi_{l}^{2}}=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x}\tag{6}φ=δ2 S P E (x )+χl 2 T 2 (x )=x T Φx (6 )

其中，

Φ = P Λ − 1 P T χ l 2 + I − P P T δ 2 (7) \mathbf{\Phi}=\frac{\mathbf{P} \mathbf{\Lambda}^{-1} \mathbf{P}^{T}}{\chi_{l}^{2}}+\frac{\mathbf{I}-\mathbf{P} \mathbf{P}^{T}}{\delta^{2}}\tag{7}Φ=χl 2 P Λ−1 P T +δ2 I −P P T (7 )

注意，Φ \mathbf{\Phi}Φ 是对称的和正定矩阵。

前辈大佬得出的控制极限，该结果提供了一个近似分布，其前两个矩与精确分布相同。作为二次指数，Φ \mathbf{\Phi}Φ 近似如下：

φ = x T Φ x ∼ g χ h 2 (8) \varphi=\boldsymbol{x}^{T} \mathbf{\Phi} \boldsymbol{x} \sim g \chi_{h}^{2}\tag{8}φ=x T Φx ∼g χh 2 (8 )

其中系数

g = tr ⁡ ( S Φ ) 2 tr ⁡ ( S Φ ) (9) g=\frac{\operatorname{tr}(\mathbf{S} \Phi)^{2}}{\operatorname{tr}(\mathbf{S} \Phi)}\tag{9}g =t r (S Φ)t r (S Φ)2 (9 )

以及χ 2 \chi^2 χ2分布的自由度
h = [ tr ⁡ ( S Φ ) ] 2 tr ⁡ ( S Φ ) 2 (10) h=\frac{[\operatorname{tr}(\mathbf{S} \Phi)]^{2}}{\operatorname{tr}(\mathbf{S} \Phi)^{2}}\tag{10}h =t r (S Φ)2 [t r (S Φ)]2 (1 0 )
在计算g g g和h h h之后，可以得到给定置信水平下的控制极限 φ \varphi φ 。

SPE和T 2 T^2 T 2共同定义的控制区域与组合指数的控制区域非常相似。然而，综合指标定义了一个更符合数据多正态性假设的椭圆区域。是单独使用组合指标，还是联合使用 SPE和T 2 T^2 T 2，取决于应用情况。

Original: https://blog.csdn.net/weixin_44333889/article/details/119449882
Author: 府学路18号车神
Title: 平方预测误差(Squared prediction error，SPE)和霍特林统计量（Hotelling’s T2）原理

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/694568/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

知识图谱 ppt_送你浙大陈华钧教授《知识图谱导论》课程系列PPT

来源：专知本文约 1500字，建议阅读 10分钟。本文为你介绍了浙江大学计算机学院陈华钧教授的课程《知识图谱导论》。知识图谱是人工智能的前沿科技之一，近两年非常火热。无论你是…

人工智能 2023年6月1日
0068
《动手学深度学习》—线性回归的从零开始实现的一些理解

目录前言步骤一、人工生成噪声数据二、写一个函数获取批量数据三、定义训练需要的函数四、训练过程前言内容来自李沐大神的b站内容：08 线性回归 + 基础优化算法【动手学…

人工智能 2023年7月23日
0077
前端安全：CSRF、XSS该怎么防御？

近几年随着业务的不断发展，前端随之面临很多安全挑战。我们在日常开发中也需要不断预防和修复安全漏洞。接下来，梳理一些场景的前端安全问题和对应的解决方案。 XSS攻击介绍 XSS是后端…

人工智能 2023年6月29日
0086
机器学习中的七种分类算法

目录 1 分类任务的类型 1.1 二元分类 1.2 多元分类 1.3 多标签分类 1.4 不平衡分类 2 分类算法如何工作 3 数据预处理 4 创建测试集和训练集 5 选择模型 6…

人工智能 2023年6月23日
0098
多元线性回归详解

入门小菜鸟，希望像做笔记记录自己学的东西，也希望能帮助到同样入门的人，更希望大佬们帮忙纠错啦~侵权立删。目录一、问题描述二、问题分析三、解决问题 —— 找w和b 1、向量形…

人工智能 2023年6月13日
00102
二十一. 智能驾驶之基于视觉识别和点云聚类的障碍物检测

一. 背景介绍在智能驾驶领域, 根据使用的传感器的不同，对障碍物的检测和识别通常有三种做法： 1.一种是基于相机图像和点云鸟瞰图的纯图像障碍物检测, 比如YOLO三维; 2.一种…

人工智能 2023年5月31日
00106
如何用算法预测世界杯？

预测2021欧洲世界杯世界杯预测结果预测的原理是什么？ * 周易算卦原理 – 算命可以解决的问题善易者不卜人工智能预测原理 – 预测模型：逻辑回归 …

人工智能 2023年5月31日
0095
【Python 实战基础】Pandas中Series的创建和数据类型转换

一、实战场景二、主要知识点文件读写基础语法 Pandas的Series对象 DataFrame Pandas numpy 三、菜鸟实战 1、创建 python 文件，用Num…

人工智能 2023年7月7日
0096
（2022）异常检测新任务《Anomaly Clustering: Grouping Images into Coherent Clusters of Anomaly Types》

文章目录 * – 原文地址 – 初识 – 相知 – 回顾原文地址 https://arxiv.org/abs/2112.11573…

人工智能 2023年6月2日
00127
Pandas学习笔记

一、Pandas 1.介绍与安装关系型、标记型数据的数据分析工具；以numpy为基础，借助其在计算方面高性能的优势，还基于matplotlib进行画图。 Pandas 优点：增…

人工智能 2023年7月18日
0056
Android Studio实现一个简单的健身系统

文章目录一、系统背景二、系统概述三、开发环境四、系统结构五、详细设计 * 5.1、RecycleView 5.2、ViewPager 5.3、OkHttp 六、运行演示 …

人工智能 2023年5月30日
0090
人工智能导论实验3——汉诺塔&八皇后问题

人工智能导论实验——汉诺塔&八皇后问题目录人工智能导论实验——汉诺塔&八皇后问题一、汉诺塔问题二、八皇后问题实验目的及要求：本项目要求能够理解人工智能的…

人工智能 2023年7月27日
0071
数据库课设——企业员工人事管理系统

数据库课程设计——企业员工人事管理系统（刚结束数据库的课设上机，因为最近特别特别忙，所以数据库课设也没有特别认真在做，前后只用了几天，发表在这里只是为了记录成长历程，不用作任何商…

人工智能 2023年7月30日
0065
《知识图谱概念与技术》读书笔记：isA关系补全

读完可以回答以下问题： isA关系缺失的常见原因有哪些？ 2.常用的isA关系补全方法有哪些？如何进行补全？ 3.概念图谱中的错误成因有哪些？如何纠正？人类知识浩如烟海，知识表达…

人工智能 2023年6月1日
0072
对两种类型的蘑菇图像进行识别与分类——使用SVM分类器（matlab）

该项目已免费开源！点个收藏和赞吧！https://gitee.com/zhengzsj/mushroom-classification-system-based-on-matlab…

人工智能 2023年7月1日
00113
推荐系统笔记（二）：常用数据集Movielens学习

介绍 movielens数据集是电影推荐数据集，数据集有多种大小和目的使用的数据集。按照使用目的可以分为两类，一类数据集适用于推进最新研究的数据，一类数据集是用于高校研究和教育科研…

人工智能 2023年7月15日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

平方预测误差(Squared prediction error，SPE)和霍特林统计量（Hotelling’s T2）原理

平方预测误差(Squared prediction error，SPE)

霍特林统计量（Hotelling’s T2）

综合指标（Combined Indices）

大家都在看