计算机视觉之PCA和特征脸

2023年6月16日上午11:09 • 人工智能 • 阅读 72

计算机视觉之PCA和特征脸

主成分分析(PCA）是一种统计/非监督机器学习方法，它使用一个正交变换将一组可能相关的变量的观测值转化为一组线性不相关的变量的值（称为主成分），从而在数据集中发现最大方向的方差（沿着主成分）。这可以用于（线性）降维（只有几个突出的主成分在大多数情况下捕获数据集中的几乎所有方差）和具有多个维度的数据集的可视化（在二维空间中）。PCA 的一个应用是特征脸，找到一组可以（从理论上）表示任意脸（作为这些特征脸的线性组合）的特征脸。

1.用 PCA 降维及可视化

我们将使用 scikit-learn 的数字数据集，其中包含 1797 张手写数字图像（每张图像大小为 8×8）。每一行表示数据矩阵中的一幅图像。用下面的代码加载并显示数据集中的前 25 位数字：

import numpy as np
import matplotlib.pylab as plt
from  matplotlib  import pylab
from sklearn.datasets import load_digits
from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.pipeline import Pipeline
digits = load_digits()

print(digits.data.shape)
j = 1
np.random.seed(2)
fig = plt.figure(figsize=(3,3))
fig.subplots_adjust(left=0, right=1, bottom=0, top=1, hspace=0.05,wspace=0.05)

for i in np.random.choice(digits.data.shape[0], 25):
     plt.subplot(5,5,j), plt.imshow(np.reshape(digits.data[i,:], (8,8)),cmap='binary'), plt.axis('off')
     j += 1
plt.show()

运行上述代码，输出数据集中的前 25 位手写数字，如图:

2.二维投影和可视化

从加载的数据集可以看出，它是一个 64 维的数据集。现在，首先利用scikit-learn 的 PCA()函数来找到这个数据集的两个主成分并将数据集沿着两个维度进行投影；其次利用 matplotlib 和表示图像（数字）的每个数据点，对投影数据进行散点绘图，数字标签用一种独特的颜色表示，如下面的代码所示：

plt.show()
pca_digits=PCA(2)
digits.data_proj = pca_digits.fit_transform(digits.data)
print(np.sum(pca_digits.explained_variance_ratio_))

plt.figure(figsize=(15,10))
plt.scatter(digits.data_proj[:, 0], digits.data_proj[:, 1], lw=0.25, c=digits.target, edgecolor='k', s=100, cmap=plt.cm.get_cmap('cubehelix',10))
plt.xlabel('PC1', size=20), plt.ylabel('PC2', size=20), plt.title('2D Projection of handwritten digits with PCA', size=25)
plt.colorbar(ticks=range(10), label='digit value')
plt.clim(-0.5, 9.5)

3.基于 PCA 的特征脸

加载 scikit-learn 包的 olivetti 人脸数据集，其中包含 400 张人脸图像，每
张图像大小为 64×64。如下代码显示了数据集中的一些随机人脸：


from sklearn.datasets import fetch_olivetti_faces
faces = fetch_olivetti_faces().data
print(faces.shape)
fig = plt.figure(figsize=(5,5))
fig.subplots_adjust(left=0, right=1, bottom=0, top=1, hspace=0.05, wspace=0.05)

j = 1
np.random.seed(0)
for i in np.random.choice(range(faces.shape[0]), 25):
     ax = fig.add_subplot(5, 5, j, xticks=[], yticks=[])
     ax.imshow(np.reshape(faces[i,:],(64,64)), cmap=plt.cm.bone,interpolation='nearest')
     j += 1
plt.show()

from sklearn.preprocessing import StandardScaler
from sklearn.decomposition import PCA
from sklearn.pipeline import Pipeline
n_comp =64
pipeline = Pipeline([('scaling', StandardScaler()), ('pca',PCA(n_components=n_comp))])
faces_proj = pipeline.fit_transform(faces)
print(faces_proj.shape)

mean_face = np.reshape(pipeline.named_steps['scaling'].mean_, (64,64))
sd_face = np.reshape(np.sqrt(pipeline.named_steps['scaling'].var_),(64,64))
pylab.figure(figsize=(8, 6))
pylab.plot(np.cumsum(pipeline.named_steps['pca'].explained_variance_ratio_) , linewidth=2)
pylab.grid(), pylab.axis('tight'), pylab.xlabel('n_components'),
pylab.ylabel('cumulative explained_variance_ratio_')
pylab.show()
pylab.figure(figsize=(10,5))
pylab.subplot(121), pylab.imshow(mean_face, cmap=pylab.cm.bone),
pylab.axis('off'), pylab.title('Mean face')
pylab.subplot(122), pylab.imshow(sd_face, cmap=pylab.cm.bone),
pylab.axis('off'), pylab.title('SD face')
pylab.show()

（1）特征脸

在主成分分析的基础上，计算得到的两 PC 方向相互正交，每个 PC 包
含 4096 个像素，并且可以重建成 64×64 像素的图像。称这些主成分为特征脸（因为它们也是特征向量）。可以看出，特征脸代表了人脸的某些属性。如下代码用于显示一些计算出来的特征脸：

fig = plt.figure(figsize=(5,2))
fig.subplots_adjust(left=0, right=2, bottom=0, top=5, hspace=0.07,wspace=0.005)

for i in range(25):
     ax = fig.add_subplot(5, 5, i+1, xticks=[], yticks=[])
     ax.imshow(np.reshape(pipeline.named_steps['pca'].components_[i,:],(64,64)), cmap=plt.cm.bone, interpolation='nearest')
     plt.savefig("C:/Users/zhuyupeng/Desktop/新建文件夹/hsdh.png",bbox_inches = 'tight')

运行上述代码，输出前 25 张特征脸，如图所示

（2）重建。

如下代码演示了如何将每张人脸近似地表示成这 64 张主要特征脸的线性
组合。使用 scikit-learn 中的 inverse_transform()函数变换回到原空间，但是只基于这 64 张主要特征脸，而抛弃所有其他特征脸。


faces_inv_proj = pipeline.named_steps['pca'].inverse_transform(faces_proj)

fig = plt.figure(figsize=(5,5))
fig.subplots_adjust(left=0, right=1, bottom=0, top=1, hspace=0.05,wspace=0.05)

j = 1
np.random.seed(0)
for i in np.random.choice(range(faces.shape[0]), 25):
     ax = fig.add_subplot(5, 5, j, xticks=[], yticks=[])
     ax.imshow(mean_face + sd_face*np.reshape(faces_inv_proj,(400,64,64))[i,:], cmap=plt.cm.bone, interpolation='nearest')
     j += 1

运行上述代码，从 64 张特征脸中随机选择 25 张重建的人脸图像，如图上所示。可以看到，它们看起来很像原始的人脸（没有很多明显的错误）。如下代码有助于更近距离地观察原始人脸，并将其与重建后的人脸进行对比，代码的输出结果如下图所示。可以看到，重建后的人脸与原始人脸近似，但存在某种程度的失真。

orig_face = np.reshape(faces[0,:], (64,64))
reconst_face =np.reshape(faces_proj[0,:]@pipeline.named_steps['pca'].components_, (64,64))
reconst_face = mean_face + sd_face*reconst_face
plt.figure(figsize=(10,5))
plt.subplot(121), plt.imshow(orig_face, cmap=plt.cm.bone, interpolation='nearest'), plt.axis('off'), plt.title('original', size=20)
plt.subplot(122), plt.imshow(reconst_face, cmap=plt.cm.bone, interpolation='nearest'), plt.axis('off'), plt.title('reconstructed', size=20)
plt.show()

Original: https://blog.csdn.net/weixin_53339428/article/details/126668489
Author: 表型组学
Title: 计算机视觉之PCA和特征脸

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/623628/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

逻辑回归算法——乳腺癌检测

这个数据集总共从病灶造影图片中提取以下 10 个关键属性。• radius 半径即病灶中心点离边界的平均距离• texture 纹理，灰度值的标准偏差。• perimeter …

人工智能 2023年6月17日
00130
[机器学习与scikit-learn-28]：算法-回归-评估指标详解

作者主页(文火冰糖的硅基工坊)：文火冰糖（王文兵）的博客_文火冰糖的硅基工坊_CSDN博客本文网址：https://blog.csdn.net/HiWangWenBing/art…

人工智能 2023年6月18日
0072
Python数据分析上机

一,Numpy数值计算上机 1．创建数组并进行运算。（1）创建一个数值范围为0~1，间隔为0.01的数组，并查看该数组的维度。（2）创建100个服从正态分布的随机数，并查看数组的类…

人工智能 2023年7月16日
0073
Python办公自动化-获取文件夹下文件的几种方法

在Python办公自动化的时候，经常会对本地文件进行一些操作。这里介绍几种方法，可以快速获取对应文件夹下的文件，返回一个列表。然后就可以用列表的切片方式，把列表里的文件名取出来，…

人工智能 2023年7月7日
0054
人工智能-机器学习-深度学习-概述

文章目录本文说明一：人工智能需要的基础和涉及内容二：数学基础 * （1）线性代数（2）概率论（3）数理统计（4）最优化方法（5）信息论三：机器学习 * （1）线性回…

人工智能 2023年7月29日
0059
基于Pytorch实现的声音分类

前言本章我们来介绍如何使用Pytorch训练一个区分不同音频的分类模型，例如你有这样一个需求，需要根据不同的鸟叫声识别是什么种类的鸟，这时你就可以使用这个方法来实现你的需求了。 …

人工智能 2023年6月16日
00101
python的三种输出格式

python的格式输出 python的三种输出格式 * 1. % （不推荐使用） 2. format 3. f-string python的三种输出格式环境：pycharm + …

人工智能 2023年7月6日
0090
【图像分割】使用np.where()实现多类别图像分割可视化

目录背景方法背景相比采用表格化数据定量分析，可视化是分割任务定性分析的主要手段。在多类别图像分割任务中，往往会涉及两种及以上的颜色，一种常用的方法就是使用RGB色彩填充分…

人工智能 2023年7月20日
0057
Opencv+Python学习记录7：图像加权和（内附详细代码）

一，介绍所谓图像加权和，就是在计算两幅图像的像素值之和时，将每幅图像的权重考虑进来，可以用公式表示为：dst=saturate（src1×α+src2×β+γ）式中，satura…

人工智能 2023年7月20日
0056
Six—pytorch学习—索引与切片

pytorch学习(3) 索引与切片普通索引冒号索引（切片） index_select 选择特定索引 masked_select 选择符合条件的索引 take 索引普通索引 …

人工智能 2023年6月4日
0077
手动绘制logistic回归预测模型校准曲线（Calibration curve）（1）

校准曲线图表示的是预测值和实际值的差距，作为预测模型的重要部分，目前很多函数能绘制校准曲线。一般分为两种，一种是通过Hosmer-Lemeshow检验，把P值分为10等分，求出每等…

人工智能 2023年6月16日
00107
nnunet详细预处理过程

重采样代码部分整理 import SimpleITK import numpy as np def get_target_spacing(spacings,sizes): ”’…

人工智能 2023年6月21日
0080
Encoder-Decoder 模型架构详解

文章目录概述 Seq2Seq（ Sequence-to-sequence ） Encoder-Decoder的缺陷 Attention 机制的引入 Transformer中的En…

人工智能 2023年6月23日
0097
ECCV 2022 旷视入选论文亮点解读（上）

近日，欧洲计算机视觉国际会议 ECCV 2022（European Conference on Computer Vision）发布了论文录用结果。本届 ECCV 2022论文有效…

人工智能 2023年6月25日
0075
目标检测第4步：显卡、GPU、CUDA、cuDNN的介绍及如何在Windows 10下安装cuDNN？

目录（请先看置顶博文）本博打开方式！！！请详读！！！请详读！！！请详读！！！_Cat-CSDN博客一、显卡和GPU的关系二、CUDA是什么？三、cuDNN是什么？四、cu…

人工智能 2023年7月9日
0080
使用 OpenCV 提取图像的 HOG、SURF 及 LBP 特征 (含代码)

HOG HOG 全称为 Histogram of Oriented Gradient，即方向梯度直方图，由于使用该特征进行行人检测的效果良好而被广泛应用。HOG 是一种在计算机视觉…

人工智能 2023年6月18日
0084

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

计算机视觉之PCA和特征脸

1.用 PCA 降维及可视化

2.二维投影和可视化

3.基于 PCA 的特征脸

（1）特征脸

（2）重建。

大家都在看