理解奇异值分解(SVD)的原理和数学原理是一个挑战性任务。

2024年4月12日下午7:04 • • • 阅读 28

奇异值分解（Singular Value Decomposition, SVD）

奇异值分解（Singular Value Decomposition, SVD）是一种用于矩阵分解的数学工具。它能够将一个矩阵分解为三个矩阵的乘积，通过这种分解，我们可以对原始矩阵进行降维、提取重要信息以及进行矩阵近似等操作。

SVD的基本原理是将一个m×n维的矩阵A分解为三个矩阵的乘积：

$A = U \Sigma V^{T}$

其中，$U$ 是一个m×m维的正交矩阵，称为左奇异矩阵；$\Sigma$ 是一个m×n维的对角矩阵，对角线上的元素称为奇异值；$V$ 是一个n×n维的正交矩阵，称为右奇异矩阵。

SVD的算法原理是通过迭代来逼近矩阵的奇异值和左右奇异矩阵，具体步骤如下：

计算矩阵的转置矩阵$A^{T}$
计算$A^{T}A$的特征值和特征向量，特征值的平方根即为$A^{T}A$的奇异值
将奇异值从大到小排列，对应的特征向量为矩阵$V$
计算矩阵$AA^{T}$的特征值和特征向量，特征值的平方根即为$AA^{T}$的奇异值
将奇异值从大到小排列，对应的特征向量为矩阵$U$
计算$\Sigma$，对角线上的元素为奇异值
得到分解后的矩阵$U$、$\Sigma$和$V$

下面通过数学公式的推导来理解SVD的原理。

公式推导

给定一个矩阵A，设 A 的行数为 m，列数为 n，我们要找到三个矩阵 U、Σ 和 V，使得 $A = U \Sigma V^{T}$。

1. 求解 $AA^{T}$ 的特征值和特征向量

矩阵 $AA^{T}$ 是一个 m×m 维的方阵，我们要找到它的特征值和特征向量。

特征向量满足 $AA^{T}x = \lambda x$，其中 $\lambda$ 是特征值，x 是特征向量。

将矩阵 A 带入上式得到 $AA^{T} = U \Sigma V^{T} (U \Sigma V^{T})^{T} = U \Sigma V^{T} V \Sigma U^{T} = U \Sigma^{2} U^{T}$。

所以，矩阵 $AA^{T}$ 的特征向量为 U，特征值为 $\Sigma^{2}$（矩阵 $\Sigma$ 中的对角线元素即为 $\Sigma^{2}$ 的平方根）。

2. 求解 $A^{T}A$ 的特征值和特征向量

矩阵 $A^{T}A$ 是一个 n×n 维的方阵，我们要找到它的特征值和特征向量。

特征向量满足 $A^{T}Ax = \lambda x$，其中 $\lambda$ 是特征值，x 是特征向量。

将矩阵 A 带入上式得到 $A^{T}A = V \Sigma^{T} U^{T} U \Sigma V^{T} = V \Sigma^{T} \Sigma V^{T}$。

所以，矩阵 $A^{T}A$ 的特征向量为 V，特征值为 $\Sigma^{T} \Sigma$。

根据奇异值分解的原理，我们将 $\Sigma^{T} \Sigma$ 的特征值从大到小排列，对应的特征向量为矩阵 V。

3. 求解 U 和 $\Sigma$

根据步骤1和2的推导，我们已经求得了矩阵 $AA^{T}$ 的特征向量 U 和特征值 $\Sigma^{2}$，矩阵 $A^{T}A$ 的特征向量 V 和特征值 $\Sigma^{T} \Sigma$。

我们可以对 $\Sigma^{2}$ 开方得到奇异值矩阵 $\Sigma$。

4. 求解 V

我们已经得到了 $A^{T}A$ 的特征向量矩阵 V。

由于 $AA^{T} = U \Sigma^{2} U^{T}$，我们可以将其两边同时左乘 V：

$AA^{T}V = U \Sigma^{2} U^{T}V$

由于 V 是正交矩阵，有 $V^{T}V = I$，所以我们可以得到：

$AA^{T}V = U \Sigma^{2}$
即 $A^{T}AV = V \Sigma^{2}$。

上式说明，矩阵 A 的列向量经过 A 的转置与 A 相乘后，与特征向量 V 的乘积等于奇异值乘以 V。

所以，我们可以通过求解矩阵 A 的列向量经 $A^{T}A$ 的右特征向量进行求解，即 V。

至此，我们已经得到了矩阵 A 的奇异值分解结果 U、$\Sigma$ 和 V。

Python代码示例

下面通过一个简单的示例来展示如何使用 Python 进行奇异值分解，并解释代码细节。

首先，我们需要导入需要的库：

import numpy as np
from scipy.linalg import svd

接下来，我们生成一个虚拟的矩阵 A：

A = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

然后，我们使用 svd 函数进行奇异值分解：

U, s, V = svd(A)

其中，U 是左奇异矩阵，s 是奇异值，V 是右奇异矩阵。

我们可以打印出分解后的矩阵 U、$\Sigma$ 和 V：

print("U:\n", U)
print("s:\n", s)
print("V:\n", V)

最后，我们可以使用分解后的矩阵 U、$\Sigma$ 和 V 来还原原始矩阵 A：

A_hat = U.dot(np.diag(s).dot(V))
print("A_hat:\n", A_hat)

我们可以看到，还原后的矩阵 A_hat 与原始矩阵 A 非常接近。

以上就是使用 Python 进行 SVD 的示例代码。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824947/

转载文章受原作者版权保护。转载请注明原作者出处！

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

20240412_1_如何选择合适的源领域和目标领域进行迁移学习？

问题介绍迁移学习是指将在一个任务中学到的知识或经验应用到另一个相关任务中的机器学习方法。在进行迁移学习时，我们需要选择合适的源领域和目标领域来进行知识的迁移。本文将详细介绍如何选…

• 2024年4月12日
0022
python pygame库入门

pygame提供的模块： pygame.display 访问显示设备 pygame.event 管理事件 pygame.draw 绘制形状、线和点 pygame.surface 管…

• 2023年9月17日
0077
20240412_1_理解深度学习的基本原理和概念

理解深度学习的基本原理和概念深度学习是一种机器学习方法，其核心思想是通过将多个神经网络层叠加在一起来构建一个深层的神经网络模型。深度学习的基本原理包括神经网络结构的设计、前向传播…

• 2024年4月12日
0024
理解生成对抗网络（GAN）的基本原理及工作方式

生成对抗网络（GAN）的基本原理与工作方式生成对抗网络（GAN）是一种用于生成新数据的无监督学习模型。它由一个生成器（Generator）和一个鉴别器（Discriminator…

• 2024年4月12日
0023
20240412_1_选择合适的超参数范围和步长进行搜索，以确保能够找到最优解。

问题简介在机器学习领域，超参数是指在模型训练过程中需要手动设置的参数。超参数的选择对模型的性能有着重要影响，因此选择合适的超参数范围和步长进行搜索是一项重要的任务。本文将介绍一种…

• 2024年4月12日
0029
20240412_1_理解强化学习的基本概念和原理

强化学习的基本概念和原理强化学习是一种机器学习方法，它通过试错的方式来训练智能体（agent）在某个环境下做出最优行为。与监督学习不同，强化学习没有给定准确的目标输出，而是通过与…

• 2024年4月12日
0021
20240412_1_选择合适的超参数范围和步长进行搜索，以确保能够找到最优解。

问题简介在机器学习领域，超参数是指在模型训练过程中需要手动设置的参数。超参数的选择对模型的性能有着重要影响，因此选择合适的超参数范围和步长进行搜索是一项重要的任务。本文将介绍一种…

• 2024年4月12日
0032
20240412_1_理解强化学习的基本概念和原理

强化学习的基本概念和原理强化学习是一种机器学习方法，它通过试错的方式来训练智能体（agent）在某个环境下做出最优行为。与监督学习不同，强化学习没有给定准确的目标输出，而是通过与…

• 2024年4月12日
0016
基于tensorflow实现图像描述

【基础翻译自：Attention Mechanism For Image Caption Generation in Python 借鉴于：Python中图像标题生成的注意机制实战…

• 2023年5月24日
0098
监督学习中的评估指标有哪些？如何选择适合的评估指标来衡量模型的性能

问题背景监督学习是一种常见的机器学习方法，它的目标是根据已知的输入与输出示例训练一个模型，然后利用该模型对未知的输入进行预测或分类。评估指标在监督学习中起着重要的作用，它用于衡量…

• 2024年1月2日
0067
微信天气预报小程序实战开发

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

• 2023年5月31日
00115
Python对图像的基础处理（opencv、PIL和numpy）

使用时导入包： import cv2 1.1 OpenCV读取图像 img = cv2.imread("test.jpg") 1.2 OpenCV转为PIL格式…

• 2023年8月27日
0074
Java面向对象项目飞机大战 Shoot

飞机大战 Shoot最终版 Shoot 第一天 MeShoot Shoot射击游戏第一天：1.创建了6个对象类，创建World类测试射击游戏需求:1.所参与的角色:英雄机、子弹、…

• 2023年9月22日
0092
CVPR2022 | 简单高效的语义分割体系结构

前言本文提出了一种简单的编码-解码器体系结构，具有类似ResNet的主干和一个小的多尺度头，其性能与复杂的语义分割体系结构（如HRNet、FANet和DDRNets）相当或更好。另…

• 2023年10月27日
0083
20240412_1_理解监督学习的基本原理和概念

理解监督学习的基本原理和概念监督学习是机器学习中最常用的方法之一，其基本目标是通过使用已知输入和输出（标签）的数据来构建一个函数，该函数可以将未知输入映射到相应的输出。监督学习算…

• 2024年4月12日
0020
对网络蒸馏的原理和算法理解不够深入，导致在实践中无法正确应用。

问题描述问题描述：我在使用网络蒸馏技术时，发现对网络蒸馏的原理和算法理解不够深入，导致在实践中无法正确应用。我希望能够了解网络蒸馏的详细原理和算法推导，同时可以通过Python代…

• 2024年4月12日
0036

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31