降维算法实战项目（2）—使用PCA对图像降维（Python代码+数据集）

2023年7月26日上午6:52 • 人工智能 • 阅读 76

在这部分练习中，我们将学习人脸图像上运行PCA，看看如何在实践中使用它来减少维度。

老规矩，先放出数据集：

链接：https://pan.baidu.com/s/1R0oiqoWHV2iR8sc3YHkMoA
提取码：6666

导入需要用到的包

from numpy import *
from scipy.io import loadmat
import matplotlib.pyplot as plt

导入数据

faces_data = loadmat('data/ex7faces.mat')
print(faces_data)
X=faces_data['X']
print(X.shape)

结果为：

{'__header__': b'MATLAB 5.0 MAT-file, Platform: PCWIN64, Created on: Mon Nov 14 23:46:35 2011', '__version__': '1.0', '__globals__': [], 'X': array([[ -37.86631387,  -45.86631387,  -53.86631387, ..., -110.86631387,
        -111.86631387,  -99.86631387],
       [   8.13368613,   -0.86631387,   -8.86631387, ...,  -34.86631387,
          -8.86631387,    0.13368613],
       [ -32.86631387,  -34.86631387,  -36.86631387, ..., -110.86631387,
        -111.86631387, -111.86631387],
       ...,
       [ -46.86631387,  -24.86631387,   -8.86631387, ...,   90.13368613,
          80.13368613,   59.13368613],
       [  19.13368613,   16.13368613,   14.13368613, ...,  -38.86631387,
         -41.86631387,  -46.86631387],
       [-108.86631387, -106.86631387, -102.86631387, ...,   17.13368613,
          17.13368613,   18.13368613]])}

(5000, 1024)

说明我们的数据集有5000个样本，每个样本有1024个特征。

可视化

我们可视化一下前100张人脸图像：

def plot_100_image(X):
    fig,ax=plt.subplots(nrows=10,ncols=10,figsize=(10,10))
    for c in range(10):
        for r in range(10):
            ax[c,r].imshow(X[10*c+r].reshape(32,32).T,cmap='Greys_r')
            ax[c,r].set_xticks([])
            ax[c,r].set_yticks([])
    plt.show()

plot_100_image(X)

结果如下图所示：

接下来我们应用PCA算法的步骤与之前在二维数据集上的步骤一致：
1.去均值化

2.计算协方差矩阵

3.计算特征值和特征向量

我们不再细致讲解，有需要的可以看我之前的博客：

https://blog.csdn.net/wzk4869/article/details/126074158?spm=1001.2014.3001.5502

直接放出对应的代码：

def reduce_mean(X):
    X_reduce_mean=X-X.mean(axis=0)
    return X_reduce_mean
X_reduce_mean=reduce_mean(X)

def sigma_matrix(X_reduce_mean):
    sigma=(X_reduce_mean.T @ X_reduce_mean)/X_reduce_mean.shape[0]
    return sigma
sigma=sigma_matrix(X_reduce_mean)

def usv(sigma):
    u,s,v=linalg.svd(sigma)
    return u,s,v
u,s,v=usv(sigma)
print(u)

def project_data(X_reduce_mean, u, k):
    u_reduced = u[:,:k]
    z=dot(X_reduce_mean, u_reduced)
    return z
z = project_data(X_reduce_mean, u, 100)

我们接下来还原数据，这里选择只保留100个特征：

def recover_data(z, u, k):
    u_reduced = u[:,:k]
    X_recover=dot(z, u_reduced.T)
    return X_recover
X_recover=recover_data(z,u,100)

我们看一下最后降维后的图像：

plot_100_image(X_recover)

我们对比两张图片，可以很明显的看出，第二张图片保留的特征较少，已经导致脸部有些模糊。

最后唠叨一句

如果不设置 cmap='Greys_r' 会很阴间：

最开始的100张人脸：

降维后的人脸：

Original: https://blog.csdn.net/wzk4869/article/details/126078119
Author: 旅途中的宽~
Title: 降维算法实战项目（2）—使用PCA对图像降维（Python代码+数据集）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/716466/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Linux基本命令(3)

Linux基本命令(3) 📟作者主页：慢热的陕西人🌴专栏链接：Linux📣欢迎各位大佬👍点赞🔥关注🚓收藏，🍉留言本博客主要讲解了最后一部分常用的Linux指令和一些热键，另外还介…

人工智能 2023年7月30日
0087
机器学习之逻辑回归（Logistic Regression）

在公众号「 python风控模型」里回复关键字：学习资料大家好！大家好，今天我们将看到机器学习技术中一个有趣的算法，称为逻辑回归。因此，在进入主题之前，我们需要复习一些基本术语…

人工智能 2023年6月13日
00108
Xshell+docker镜像/容器+tensorflow环境下的模型训练全过程

首先介绍实验背景，需要在远程服务器上搭建tensorflow1.0版本环境并训练一个实体识别模型 xshell 首先，查看本地服务器是否具有所需的映像。 [En] First, s…

人工智能 2023年5月24日
0077
脑电数据预处理，eeglab预处理采集的SSVEP数据

脑电数据预处理一般包括以下步骤，其中未添加链接的步骤本文未涉及：顺序步骤附注1导入数据 ·导入脑电数据以及手动导入电极信息和事件2定位电极 ·导入电极位置相关文件3删除无用电极 …

人工智能 2023年7月28日
00104
pandas.DataFrame.from_dict直接从字典构建DataFrame

pandas函数中pandas.DataFrame.from_dict 直接从字典构建DataFrame 。参数解析 DataFrame from_dict（）方法用于将Dict…

人工智能 2023年7月6日
0089
Fast R-CNN讲解

文章目录一：解决的问题二：模型结构三：训练步骤 * 1.预训练模型 2.Fine-tunning – + step1:转化预训练模型 step2:训练图像的RP搜…

人工智能 2023年6月24日
0086
下载markdown软件Obsidian（解决官网下载速度慢）

Typora要钱了，不想每次都点稍后再买。 Obsidian也很好用，官网是：https://obsidian.md/ 但是不太好下载，直接下载速度只有10kb/s左右，总共60多…

人工智能 2023年6月4日
00166
[机器学习]西瓜书&南瓜书学习（更新中）

什么是机器学习计算机视觉（computer vision, CV）：让计算机拥有视觉能力自然语言处理（Natural language processing, NLP）：让计算机…

人工智能 2023年6月15日
00106
深度学习的通道到底是什么？有什么用？（小白可看）

目录 1.什么是通道？ 1.输入通道数等于卷积核通道个数 2.卷积核个数等于输出通道个数 2.为什么要增加通道 3.补充 1.什么是通道？计算机在存储图片时是以数字矩阵的形式…

人工智能 2023年7月26日
0069
OpenCV调用工业相机

OpenCV调用工业相机 python调用海康工业相机并用opencv显示（整体实现） python调用Gige网口工业相机 opencv 文章目录 OpenCV调用工业相机前言…

人工智能 2023年5月26日
00101
全球及中国牙髓闭孔炉行业市场调查及投资风险预测报告2022-2028年

全球及中国牙髓闭孔炉行业市场调查及投资风险预测报告2022-2028年详情内容请咨询鸿晟信合研究网！【全新修订】：2022年3月【撰写单位】：鸿晟信合研究网1 牙髓闭孔炉行业概述…

人工智能 2023年7月16日
0056
数仓：事实表设计方法，原则和三种类型选择

关注公众号，回复关键字【资料】，获取【10万字大数据框架面试知识点】与【大数据开发的命令手册】 ; 事实表设计方法事实表作为数据仓库维度建模的核心，紧紧围绕着业务过程来设计。其…

人工智能 2023年6月11日
00216
两分钟快速安装 ShardingSphere-Proxy（5.2.1）

借本地虚机环境安装 ShardingSphere-Proxy 5.2.1 机会，记录了安装过程，供大家参考。 ShardingSphere 支持多种安装方式，如通过二进制包、使用 …

人工智能 2023年6月30日
0084
pandas基础课程-实操（了解字段含义以及初步观察数据)

1.4 知道你的数据叫什么 1.4.1 任务一：pandas中有两个数据类型DateFrame和Series，通过查找简单了解他们。然后自己写一个关于这两个数据类型的小例子🌰 im…

人工智能 2023年7月9日
0059
python opencv 图像处理 – 使用opencv图像二值化（完整代码体验）

最近继续学习了 python opencv 图像二值化处理的方法。同时做了 h5 版本的，如上图。可以随时预览，分享一下，希望多少有些帮助吧。目前只是个Demo，后面会逐步完善…

人工智能 2023年6月18日
0087
关于yolov5训练时参数workers和batch-size的理解

关于yolov5训练时参数workers和batch-size的理解 * – yolov5训练命令 – workers和batch-size参数的理解 &#…

人工智能 2023年6月16日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

降维算法实战项目（2）—使用PCA对图像降维（Python代码+数据集）

最后唠叨一句

大家都在看