奇异值分解（SVD）与主成分分析（PCA）

2023年7月16日上午5:46 • 人工智能 • 阅读 52

线性映射同构于矩阵乘。线性空间的一组基α = ( α 1 , ⋯ , α n ) \alpha=(\alpha_1, \cdots, \alpha_n)α=(α1 ,⋯,αn )，一个点的坐标为x = ( x 1 , ⋯ , x n ) x=(x_1,\cdots,x_n)x =(x 1 ,⋯,x n )，那么点可以记做两者内积α ⋅ x = ∑ i = 1 n x i α i \alpha \cdot x = \sum_{i=1}^{n} x_i\alpha_i α⋅x =∑i =1 n x i αi 。注意，基不一定是向量，可以是任何线性无关的对象（比如，三角函数）。

线性映射A : U → V \mathscr A :\mathbb U \rightarrow \mathbb V A :U →V，在空间U U U下的基( α 1 , ⋯ , α n ) (\alpha_1, \cdots, \alpha_n)(α1 ,⋯,αn )下和空间V V V下的基( β 1 , ⋯ , β m ) (\beta_1, \cdots, \beta_m)(β1 ,⋯,βm )的矩阵是A A A，在空间U U U下的基( α ~ 1 , ⋯ , α ~ n ) (\tilde \alpha_1, \cdots, \tilde \alpha_n)(α~1 ,⋯,α~n )下和空间V V V下的基( β ~ 1 , ⋯ , β ~ m ) (\tilde \beta_1, \cdots, \tilde \beta_m)(β~1 ,⋯,β~m )的矩阵是B B B，即
A ( α 1 , ⋯ , α n ) = ( β 1 , ⋯ , β m ) A A ( α ~ 1 , ⋯ , α ~ n ) = ( β ~ 1 , ⋯ , β ~ m ) B \mathscr A(\alpha_1, \cdots, \alpha_n) = (\beta_1, \cdots, \beta_m)A\ \mathscr A(\tilde \alpha_1, \cdots, \tilde \alpha_n) = (\tilde \beta_1, \cdots, \tilde \beta_m)B\A (α1 ,⋯,αn )=(β1 ,⋯,βm )A A (α~1 ,⋯,α~n )=(β~1 ,⋯,β~m )B
假设( α 1 , ⋯ , α n ) (\alpha_1, \cdots, \alpha_n)(α1 ,⋯,αn )到( α ~ 1 , ⋯ , α ~ n ) (\tilde \alpha_1, \cdots, \tilde \alpha_n)(α~1 ,⋯,α~n )的过渡矩阵为P P P，( β 1 , ⋯ , β m ) (\beta_1, \cdots, \beta_m)(β1 ,⋯,βm )到( β ~ 1 , ⋯ , β ~ m ) (\tilde \beta_1, \cdots, \tilde \beta_m)(β~1 ,⋯,β~m )的过渡矩阵为Q Q Q，即
( α 1 , ⋯ , α n ) P = ( α ~ 1 , ⋯ , α ~ n ) ( β 1 , ⋯ , β m ) Q = ( β ~ 1 , ⋯ , β ~ m ) (\alpha_1, \cdots, \alpha_n)P=(\tilde \alpha_1, \cdots, \tilde \alpha_n)\ (\beta_1, \cdots, \beta_m)Q=(\tilde \beta_1, \cdots, \tilde \beta_m)(α1 ,⋯,αn )P =(α~1 ,⋯,α~n )(β1 ,⋯,βm )Q =(β~1 ,⋯,β~m )
那么B = Q A P B=QAP B =Q A P（相抵），相抵矩阵代表相同的线性映射。对于基α \alpha α下坐标为x x x的点P 1 ∈ U P_1 \in \mathbb U P 1 ∈U，映射到了P 2 = A ( α ⋅ x ) = A ( α ) ⋅ x = ( β 1 , ⋯ , β m ) A x P_2 = \mathscr A(\alpha \cdot x) = \mathscr A(\alpha) \cdot x = (\beta_1, \cdots, \beta_m)Ax P 2 =A (α⋅x )=A (α)⋅x =(β1 ,⋯,βm )A x，在基β \beta β下点P 2 ∈ V P_2 \in \mathbb V P 2 ∈V的坐标为y = A x y=Ax y =A x

线性变换A : V → V \mathscr A :\mathbb V \rightarrow \mathbb V A :V →V，空间V V V的两组基( α 1 , ⋯ , α n ) , ( α ~ 1 , ⋯ , α ~ n ) (\alpha_1, \cdots, \alpha_n),(\tilde \alpha_1, \cdots, \tilde \alpha_n)(α1 ,⋯,αn ),(α~1 ,⋯,α~n )，若
A ( α 1 , ⋯ , α n ) = ( α 1 , ⋯ , α n ) A A ( α ~ 1 , ⋯ , α ~ n ) = ( α ~ 1 , ⋯ , α ~ n ) B \mathscr A(\alpha_1, \cdots, \alpha_n) = (\alpha_1, \cdots, \alpha_n)A\ \mathscr A(\tilde \alpha_1, \cdots, \tilde \alpha_n)= (\tilde \alpha_1, \cdots, \tilde \alpha_n)B\A (α1 ,⋯,αn )=(α1 ,⋯,αn )A A (α~1 ,⋯,α~n )=(α~1 ,⋯,α~n )B
假设从基α \alpha α到基α ~ \tilde \alpha α~的过渡矩阵为可逆方阵P P P，即
( α 1 , ⋯ , α n ) P = ( α ~ 1 , ⋯ , α ~ n ) (\alpha_1, \cdots, \alpha_n)P=(\tilde \alpha_1, \cdots, \tilde \alpha_n)(α1 ,⋯,αn )P =(α~1 ,⋯,α~n )
那么B = P − 1 A P B=P^{-1}AP B =P −1 A P（相似），相似矩阵代表相同的线性变换。对于基α \alpha α下坐标为x x x的点P 1 ∈ V P_1\in \mathbb V P 1 ∈V，映射到了P 2 = A ( α ⋅ x ) = A ( α ) ⋅ x = ( α 1 , ⋯ , α n ) A x P_2 = \mathscr A(\alpha \cdot x) = \mathscr A(\alpha) \cdot x = (\alpha_1, \cdots, \alpha_n)Ax P 2 =A (α⋅x )=A (α)⋅x =(α1 ,⋯,αn )A x，在基α \alpha α下点P 2 ∈ V P_2\in \mathbb V P 2 ∈V的坐标为y = A x y=Ax y =A x

对角化：对于n n n维方阵A A A，如果存在n n n个线性无关的特征向量w 1 , ⋯ , w n w_1,\cdots,w_n w 1 ,⋯,w n ，以及对应的特征值λ 1 ≤ ⋯ ≤ λ n \lambda_1 \le \cdots \le \lambda_n λ1 ≤⋯≤λn ，那么可以表示为：A = W Σ W − 1 A=W \Sigma W^{-1}A =W ΣW −1，其中W = [ w 1 , ⋯ , w n ] W=[w_1,\cdots,w_n]W =[w 1 ,⋯,w n ]，Σ = d i a g ( λ 1 , ⋯ , λ n ) \Sigma=diag(\lambda_1,\cdots,\lambda_n)Σ=d i a g (λ1 ,⋯,λn )

一个 实对称矩阵（A = A T ∈ R n × n A=A^T \in R^{n\times n}A =A T ∈R n ×n），它满足：

因此，一个n n n阶实对称方阵中一定可以找到n n n个 单位正交特征向量！或者说，存在W T W = I W^TW=I W T W =I（酉矩阵，这里是共轭转置）

对于长矩阵A ∈ R m × n A \in R^{m \times n}A ∈R m ×n，有

特征值分解：

奇异值分解（Singular Value Decomposition，SVD）：

一般地，特征值分解以及奇异值分解都将Σ \Sigma Σ中的特征值或奇异值按照从大到小的顺序排列。并且，奇异值会快速衰减（前10%甚至1%的奇异值的加和，可以占全部奇异值之和的99%以上），可用于压缩数据。

用 numpy计算，

import numpy as np

A = np.array([[-1, 1, 1],
              [-4, 3, 2],
              [1, 0, 3]])

eigenvalue, featurevector = np.linalg.eig(A)
index = list(reversed(np.argsort(eigenvalue)))
eigenvalue = eigenvalue[index]
featurevector = featurevector.T[index]
print("特征值：\n", eigenvalue)
print("特征向量：\n", featurevector)

det = np.linalg.det(W)
print("det:",det)
W_inv = np.linalg.inv(W)
print("W_inv:\n",W_inv)

Sigma = np.diag(eigenvalue)
print("Sigma:\n",Sigma)

A2 = W@Sigma@W_inv
print("A2:\n",A2)

其实，更简单的


S,W = np.linalg.eig(A)
print("\nW = \n",W)
print("\nS = \n",S)
print("\nA2 = \n",(W*S)@np.linalg.inv(W))

A = np.array([[-1, 1, 1, 5],
              [-4, 3, 2, -2],
              [1, 0, 3, 1]])

U, S, VT = np.linalg.svd(A)
print("\nU = \n",U)
print("\nS = \n",S)
print("\nV.T = \n",VT)
Sigma = np.zeros(A.shape)
for i,s in enumerate(S):
    Sigma[i,i]=s
print("\nA2 = \n",U@Sigma@VT)

主成分分析（Principal Component Analysis，PCA）是非常经典的降维算法。

对于A ∈ R m × n A \in R^{m \times n}A ∈R m ×n，它表示m m m维特征空间中的n n n个数据点，但特征的维度m m m过大

方法一：

方法二：

PCA的含义：由于截取的k k k个特征值较大，这意味着，在对应的特征向量的方向上的 方差较大。由于P P P是由特征向量按行组合的，且这些特征向量彼此 单位正交，所以Y = P A Y = PA Y =P A其实就是将m m m维空间中的n n n个数据点， 正交投影到这些特征向量张成的k k k维子空间中（内积就是投影系数），矩阵P ∈ R k × m P \in R^{k \times m}P ∈R k ×m是从m m m维空间到k k k维子空间的线性变换。我们认为这k k k维子空间上的投影是消息本身，而另外m − k m-k m −k维补空间内的投影则是噪音。

选取合适的 主成分个数k k k：
1 − ∑ i = 1 k Σ i i ∑ i = 1 n Σ i i ≤ t 1 – \frac{\sum_{i=1}^k \Sigma_{ii}}{\sum_{i=1}^n \Sigma_{ii}} \le t 1 −∑i =1 n Σi i ∑i =1 k Σi i ≤t
这里的t t t是误差大小，选取t = 0.01 t=0.01 t =0 .0 1表示主成分保留了至少99 % 99\%9 9 %的原始信息。

代码实现，

def PCA(X,k):
    'X是m*n长矩阵，m维空间中的n个数据点'
    X_mean = np.mean(X,1)
    X2 = np.array(X,dtype=float)
    for i,x in enumerate(X2):
        X2[i] = x-X_mean[i]
    U, S, VT = np.linalg.svd(X2)
    tmp = 0
    for i in range(k):
        tmp += S[i]
    t = 1 - tmp/np.sum(S)
    P = U[:,:k].T
    return P@X, t

Original: https://blog.csdn.net/weixin_44885334/article/details/124438873
Author: 山登绝顶我为峰 3(
Title: 奇异值分解（SVD）与主成分分析（PCA）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/695814/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

RK3399 opencv4.5.0编译 Gstreamer访问摄像头

1、下载opencv源码我下载的是4.5.0版本的，开发板直接git的话，下载很慢。我选择用电脑下好再传给开发板，opencv-github，opencv4.5.0链接：http…

人工智能 2023年7月20日
0066
Anaconda 中使用 conda 配置虚拟环境与管理安装包

本文将介绍 Anaconda 的进阶使用：用 conda 配置虚拟环境、 package（安装包）的管理、以及导入或导出虚拟环境。如果您没用过 Anaconda，请先阅读上一篇文章…

人工智能 2023年7月4日
0080
PTA 浙大版《C语言程序设计（第4版）》题目集参考答案（编程题）

本答案配套详解教程专栏 😀😀 欢迎订阅😀😀 练习2-1 Programming in C is fun! (5 分) #include int main(){ printf(…

人工智能 2023年6月30日
00110
python的LabelEncoder

python的LabelEncoder 背景基础进阶建议参考文献从这篇博客你将学到 1，LabelEncoder的基本使用方法； 2，LabelEncoder多列编码； …

人工智能 2023年6月15日
00117
windows下完全离线安装Anaconda+Tensorflow

由于工作平台原因，需要在内网下安装深度学习框架，不联网的话，需要提前下载好第三方库的安装包，再离线安装。这里以Anaconda和Tensorflow为例，看过几个博客，坑不少，所以…

人工智能 2023年5月23日
0069
python对wine数据集分类_【Python】实训6：基于wine和wine_quality数据集练习sklearn构建模型方法（预处理、聚类、分类、回归）…

题目来源：《Python数据分析与应用》第6章使用 scikit-learn 构建模型实训部分【黄红梅、张良均主编中国工信出版集团和人民邮电出版社】本博客题目文字主要…

人工智能 2023年7月3日
00134
降维算法实战项目（2）—使用PCA对图像降维（Python代码+数据集）

在这部分练习中，我们将学习人脸图像上运行PCA，看看如何在实践中使用它来减少维度。老规矩，先放出数据集：链接：https://pan.baidu.com/s/1R0oiqoWH…

人工智能 2023年6月23日
0071
回归分析–线性回归模型

回归分析分类：简单一元线性回归模型与多元线性回归模型1、确定变量主要影响因素（自变量）2、建立预测模型(根据自变量与因变量建立模型）3、计算预测误差要进行一定个解释与说明。判定模…

人工智能 2023年6月17日
0047
win10下pytorch转ncnn手把手教程

前言最近需要把pytorch转为onnx再转为ncnn，整体流程大概为：1、pytorch转为onnx；2、使用onnx-simplifier工具简化onnx模型；3、onnx转…

人工智能 2023年7月19日
0060
Pandas学习笔记（4) Grouping and Sorting

1.Who are the most common wine reviewers in the dataset? Create a Series whose index is th…

人工智能 2023年7月18日
0044
Yolov5更换backbone，与模型压缩（剪枝，量化，蒸馏）

~~~欢迎各位交流、star、fork、issues~~~ 项目介绍：本仓库是基于官方yolov5源码的基础上，进行的改进。目前支持更换yolov5的backbone主干网络为…

人工智能 2023年6月16日
0083
16-Definition Extraction with LSTM Recurrent Neural Networks

翻译：用LSTM递归神经网络提取定义 Siliang Li，Bin Xu, Tonglee Chung. Definition Extraction with LSTM Recur…

人工智能 2023年6月1日
0052
linux|奇怪的知识—linux权限管理之数字权限和字母权限

linux的权限管理是比较复杂的，主要原因是linux系统是一个多用户的并且是一个多种权限的权限系统。以上这些构成了Linux系统的完整的权限系统。例如我们查看一个文件，ls …

人工智能 2023年6月29日
0078
Excel数据分析实战之开宗明义: Excel与数据分析实战

大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多…

人工智能 2023年7月14日
0034
Tensorflow中的数据对象Dataset.shuffle()、repeat()、batch() 等用法

batch size：指的就是更新梯度中使用的样本数。如果把batch_size设置为数据集的长度，就成了批量梯度下降算法，batch_size设置为1就是随机梯度下降算法一次…

人工智能 2023年5月26日
0054
Word2Vec——-CBOW连续词袋模型

Word2Vec原理 Word2vec使用单个隐藏层，完全连接的神经网络如下所示。隐藏层中的神经元都是线性神经元。输入层设置为具有与用于训练的词汇中的单词一样多的神经元，即整个词表…

人工智能 2023年5月28日
0093

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

奇异值分解（SVD）与 主成分分析（PCA）

大家都在看

奇异值分解（SVD）与主成分分析（PCA）