基于主成分分析PCA的人脸识别

2023年6月21日上午1:40 • 人工智能 • 阅读 73

经过本人复现分析，该篇博客代码不全且存在部分错误，思路仅供参考，望周知。

主成分分析PCA

主成分分析（Principal Component Analysis,简称PCA）是最常用的一种降维方法。

PCA的主要目的是找到一个超平面（直线的高维推广）对所有样本数据进行表达，让样本点到这个超平面的距离足够近（最近重构性），以及让样本点在这个超平面上的投影能尽可能地分开（最大可分性），目的是在用低维的数据量表达高维的数据量的同时尽可能地保留原数据的特征。

PCA的主要思想是将n维特征映射到k维的空间上，我们把这新形成的k维特征叫做主成分。

举个例子，我们看到上图是一个二维空间的散点图，图上的数据点反映了它们本身的一些特征，现在我们可以用一条直线，也就是用一维的超平面去把这些特征给表现处理，下图就找到了这么一条直线，使得每一个原数据在这一条直线上的投影之间距离最大，也就是说，在这个方向上它们本身的特征体现得比较好。

那么我们怎么样才能够实现PCA的降维呢？

我们首先对需要降维的样本数据进行去中心化处理，即让样本中的每一个数据都减去样本数据的均值，再通过计算数据矩阵的协方差矩阵，然后得到协方差矩阵的特征值和特征向量（这个过程又称为特征值分解），让特征向量按照特征值的大小从小到大进行排列，选择前k个特征向量组成矩阵，然后用这个矩阵的转置左乘协方差矩阵，得到的新矩阵就是降维后的数据了。

在这次的人脸识别项目中，我们使用了PCA来对人脸数据进行降维，下图是识别率与前K个主成分之间的关系图，我们仔细观察这两者之间的线性图，不难发现，很有趣的是识别率在取到约前20个主成分的时候已经达到饱和了，就算后面再增加主成分的数量，识别率也不会有多大的改变，这初步体现了降维的优点所在。

基于PCA的人脸识别算法

我们首先从人脸数据库中读取图片，并把图片转换为数据存在矩阵中，然后把每一张图片的矩阵拉成列向量，把所有列向量装在一个矩阵里面。

然后用PCA对这个矩阵进行降维，即让矩阵中的每一个数据都减去数据的均值，然后对新形成的矩阵求它的协方差矩阵，再对这个协方差矩阵进行特征值分解得到特征值和特征向量，让特征向量按照特征值的大小进行从大到小的顺序排列，然后取前k个特征向量组成一个矩阵，让这个矩阵的转置左乘原来的协方差矩阵，得到的新矩阵就是降维后的数据。

然后分别读取一定数量的列向量（即图片）作为训练集图片，读取一定数量的作为测试集图片。之后用测试集里面的一张图片和训练集里面每一张图片的数据做差取绝对值，然后把得到的这些绝对值按从小到大的顺序进行排列。

之后用k近邻学习（k-Nearest Neighbor，简称kNN），选择排列在前k个最小距离所对应的图片序号，选择出现次数最多的图片序号，如果没有重复出现的，那么选择距离最小的，即排列第一的，最后把识别出来的图片序号和原本图片所属的序号进行比较，如果相等，则识别成功，反之，则识别错误。

这样就完成了图片的识别。

matlab代码

K=1;
Data=dir('C:\ORL56_46\*.bmp');%&#x4ECE;&#x5730;&#x5740;&#x4E2D;&#x8BFB;&#x53D6;&#x56FE;&#x7247;
lengthf=length(Data);%&#x8BFB;&#x53D6;&#x56FE;&#x7247;&#x7684;&#x6570;&#x91CF;
A=imread(Data(1).name);%&#x9010;&#x5F20;&#x8BFB;&#x5165;&#x56FE;&#x7247;
A=double(A);%&#x6539;&#x7CBE;&#x5EA6;
A=A(:);%&#x5C06;&#x56FE;&#x7247;&#x62C9;&#x6210;&#x5217;&#x5411;&#x91CF;
[m,~]=size(A);%&#x8BFB;&#x53D6;&#x5217;&#x5411;&#x91CF;&#x7684;&#x957F;&#x5EA6;
traindata=zeros(m,0);
trainlabel=zeros(1,0);
trainnumber=5;%&#x8BAD;&#x7EC3;&#x96C6;&#x6570;&#x76EE;
testnumber=5;%&#x6D4B;&#x8BD5;&#x96C6;&#x6570;&#x76EE;
X=zeros(m,0);
%&#x8BFB;&#x5165;&#x6240;&#x6709;&#x56FE;&#x7247;&#x6570;&#x636E;&#x5E76;&#x88C5;&#x5728;&#x4E00;&#x4E2A;&#x77E9;&#x9635;&#x4E2D;
for i=1:lengthf %&#x91CD;&#x590D;&#x8BFB;&#x56FE;&#x5FAA;&#x73AF;&#x7684;&#x6B21;&#x6570;&#x4E3A;&#x56FE;&#x7247;&#x7684;&#x6570;&#x91CF;
    A=imread(Data(i).name);%&#x9010;&#x5F20;&#x8BFB;&#x56FE;&#x8F6C;&#x4E3A;&#x77E9;&#x9635;
    A=double(A);%&#x5C06;&#x6570;&#x636E;&#x6539;&#x4E3A;&#x53CC;&#x7CBE;&#x5EA6;&#x6D6E;&#x70B9;&#x578B;
    A=A(:);%&#x5C06;&#x77E9;&#x9635;&#x62C9;&#x6210;&#x4E00;&#x7EF4;&#x5217;&#x5411;&#x91CF;
    X=[X,A];%&#x5C06;&#x6240;&#x6709;&#x5217;&#x5411;&#x91CF;&#xFF08;&#x5373;&#x6240;&#x6709;&#x56FE;&#x7247;&#xFF09;&#x88C5;&#x5728;&#x4E00;&#x4E2A;&#x77E9;&#x9635;&#x4E2D;
end
%PCA&#x4E3B;&#x7A0B;&#x5E8F;
X=X-ones(size(X,1),1)*mean(X);%&#x53BB;&#x4E2D;&#x5FC3;&#x5316;
c=X*X'/size(X,2);%&#x6C42;&#x534F;&#x65B9;&#x5DEE;&#x77E9;&#x9635;
[e,d]=eig(c);%&#x7279;&#x5F81;&#x503C;&#x5206;&#x89E3;
[dummy,order]=sort(diag(-d));%&#x7279;&#x5F81;&#x503C;&#x4ECE;&#x5927;&#x5230;&#x5C0F;&#x6392;&#x5217;
e=e(:,order);%&#x8BA9;&#x7279;&#x5F81;&#x5411;&#x91CF;&#x6309;&#x7279;&#x5F81;&#x503C;&#x6392;&#x5217;&#x987A;&#x5E8F;&#x8FDB;&#x884C;&#x6392;&#x5217;
e=e(:,1:50);%&#x53D6;&#x524D;k&#x4E2A;&#x4E3B;&#x6210;&#x5206;
X=e'*X;%&#x964D;&#x7EF4;&#x540E;&#x7684;&#x77E9;&#x9635;
%&#x8BFB;&#x5165;&#x8BAD;&#x7EC3;&#x96C6;&#x6570;&#x636E;
for j=1:10:lengthf
    for i=j:j+4%&#x53D6;&#x524D;n&#x5F20;&#x4F5C;&#x4E3A;&#x8BAD;&#x7EC3;&#x96C6;&#x6570;&#x636E;
        A=X(:,i);
        A=double(A);
        A=A(:);
        traindata=[traindata,A];%&#x5C06;&#x8BAD;&#x7EC3;&#x96C6;&#x6570;&#x636E;&#x5B58;&#x5230;&#x77E9;&#x9635;
        trainlabel=[trainlabel,j];%&#x5B58;&#x50A8;&#x6BCF;&#x5F20;&#x56FE;&#x7247;&#x7684;&#x5E8F;&#x53F7;
    end
end
testdata=zeros(m,0);
testlabel=zeros(1,0);

%&#x8BFB;&#x5165;&#x6D4B;&#x8BD5;&#x96C6;&#x6570;&#x636E;
for j=1:10:lengthf
    for i=j+5:j+9%&#x53D6;&#x540E;m&#x5F20;&#x4F5C;&#x4E3A;&#x6D4B;&#x8BD5;&#x96C6;&#x6570;&#x636E;
        A=X(:,i);
        A=double(A);
        A=A(:);
        testdata=[testdata,A];%&#x5C06;&#x6D4B;&#x8BD5;&#x96C6;&#x6570;&#x636E;&#x5B58;&#x5230;&#x77E9;&#x9635;&#x4E2D;
        testlabel=[testlabel;j];%&#x5B58;&#x50A8;&#x6BCF;&#x5F20;&#x56FE;&#x7247;&#x7684;&#x5E8F;&#x53F7;
    end
end
%&#x4EBA;&#x8138;&#x8BC6;&#x522B;&#x4E3B;&#x7A0B;&#x5E8F;&#xFF1A;&#x5C06;&#x6D4B;&#x8BD5;&#x96C6;&#x91CC;&#x7684;&#x56FE;&#x7247;&#x548C;&#x8BAD;&#x7EC3;&#x96C6;&#x91CC;&#x7684;&#x6BCF;&#x4E00;&#x5F20;&#x56FE;&#x7247;&#x505A;&#x5DEE;&#xFF0C;&#x7528;knn&#x8FDB;&#x884C;&#x90BB;&#x8FD1;&#x5206;&#x7C7B;
[~,Z]=size(testdata);%&#x8BFB;&#x53D6;&#x6D4B;&#x8BD5;&#x96C6;&#x6570;&#x636E;&#x91CF;
error=0;
for j=1:Z%&#x5BF9;&#x6D4B;&#x8BD5;&#x96C6;&#x91CC;&#x6BCF;&#x4E00;&#x5F20;&#x56FE;&#x7247;&#x8FDB;&#x884C;&#x4EE5;&#x4E0B;&#x64CD;&#x4F5C;
    [N,A]=size(traindata);%&#x8BFB;&#x53D6;&#x8BAD;&#x7EC3;&#x96C6;&#x6570;&#x636E;&#x91CF;
    dist=zeros(A,1);%&#x521D;&#x59CB;&#x5316;&#x77E9;&#x9635;&#x7528;&#x6765;&#x88C5;&#x8DDD;&#x79BB;
    %&#x6D4B;&#x8BD5;&#x96C6;&#x91CC;&#x7684;&#x4E00;&#x5F20;&#x56FE;&#x7247;&#x548C;&#x8BAD;&#x7EC3;&#x96C6;&#x7684;&#x6240;&#x6709;&#x56FE;&#x7247;&#x505A;&#x5DEE;
    for i=1:A
        Dist=0;
        for k=1:N
            Dist=Dist+(testdata(k,j)-traindata(k,i))^2;
        end
            dist(i,1)=Dist;
    end
        [~,B]=sort(dist);%&#x5C06;&#x8DDD;&#x79BB;&#x6392;&#x5E8F;
        C=[];
        %&#x5206;&#x51FA;&#x6700;&#x77ED;&#x8DDD;&#x79BB;&#x7684;&#x56FE;&#x7247;&#x6240;&#x5C5E;&#x5E8F;&#x53F7;
    for i=1:K
        Q=floor((B(i,1)-1)/trainnumber)*10+1;
        C=[C,Q];
    end
    [idx,M]=mode(C);%idx&#x4E3A;&#x4F17;&#x6570;&#xFF0C;M&#x4E3A;&#x4F17;&#x6570;&#x51FA;&#x73B0;&#x7684;&#x6B21;&#x6570;
    %&#x5982;&#x679C;&#x6CA1;&#x6709;&#x4F17;&#x6570;&#xFF0C;&#x90A3;&#x4E48;&#x53D6;&#x8DDD;&#x79BB;&#x6700;&#x5C0F;&#x7684;
    if M==1
       idx=C(1,1);
    end
    %&#x5982;&#x679C;&#x4E24;&#x5F20;&#x56FE;&#x7247;&#x5E8F;&#x53F7;&#x4E0D;&#x540C;&#xFF0C;&#x5219;&#x8BC6;&#x522B;&#x5931;&#x8D25;
    if idx~=testlabel(j,1)
       error=error+1;
    end
end
rate=(Z-error)/Z;%&#x8BA1;&#x7B97;&#x8BC6;&#x522B;&#x7387;
fprintf('%.2f%%\n',rate*100);

Original: https://blog.csdn.net/weixin_62264287/article/details/122975952
Author: Yezi Pro
Title: 基于主成分分析PCA的人脸识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/642218/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基于双目视觉的三维重建C++实战

就在一年前，在我开始写这篇文章之前，我观看了特斯拉人工智能总监 Andrej Karapathy 的一次演讲，他向世界展示了特斯拉汽车如何使用连接到汽车上的摄像头感知深度、在 3D…

人工智能 2023年6月19日
0081
AI：ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略

AI：ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略导读：ModelScope旨在打造下一代开源的模型即服务共享平台，汇集了行业领先的预…

人工智能 2023年6月23日
00647
ViT（Vision Transformer）全文精读

** 相关链接：原文链接：An Image is Worth 16×16 Words: Transformers for Image Recognition at Sc…

人工智能 2023年5月26日
0087
〖Python自动化办公篇④〗- 文件自动化管理 – 文件查找与基于文件内容查找文件

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月6日
0076
Python3.9环境下的dlib安装流程与错误解决

环境：windows10、Python3.9（Anaconda3）、Pycharm2018.3、 1.尝试在Pycharm中直接安装dlib库，失败 2.尝试在Anaconda中安…

人工智能 2023年7月5日
0066
pandas数据清洗：案例详解 fillna函数填补空缺值

pandas数据清洗：fillna函数填补空缺值 1 fillna函数简介 2 填补空缺值3种方法 * 2.1 构建学习数据 2.2 填补特定值 2.3 用前一个非空缺值填充 2….

人工智能 2023年7月7日
00140
数电笔记总结（二）（逻辑代数基础）

目录 * – 基本逻辑运算 – + 1.”与”运算（逻辑乘） + 2.”或”运算（逻辑加） + 3.&#82…

人工智能 2023年6月26日
0074
Pandas的主要数学计算方法

可用于Series和DataFrame df = pd.DataFrame({‘key1’:np.arange(10), ‘key2’:np.random.rand(10)*10}…

人工智能 2023年7月8日
0090
什么是神经网络

人工智能 2024年1月6日
0096
宽带语谱图(wideband spectrogram)和窄带语谱图(narrowband spectrogram)的区别

1.概念区分宽带spectrogram:以3ms(或300Hz左右的带宽)左右进行分帧之后制成的spectrogram 窄带spectrogram:以20ms(或45Hz左右的带…

人工智能 2023年5月25日
0076
Python := 符号解析

是不是经常看到:=符号而又百思不得其解呢话不多说，我们直接上例子! a=321 print(a) print(v:=a) print(v) ”’ 321 321 321 ”’…

人工智能 2023年7月5日
0087
【YOLOv4运行demo.py报错】：cv2.error: OpenCV(4.5.5) :-1: error: (-5:Bad argument) in function ‘rectangle‘

一、问题描述最近在linux服务器上部署YOLOv4项目（），配置好环境以后，运行demo.py进行测试，报错如下： Traceback (most recent call la…

人工智能 2023年6月19日
0072
分类问题为什么用交叉熵损失不用 MSE 损失

本文说明以下问题 MSE 损失主要适用与回归问题，因为优化 MSE 等价于对高斯分布模型做极大似然估计，而简单回归中做服从高斯分布的假设是比较合理的交叉熵损失主要适用于多分类问题…

人工智能 2023年6月17日
00104
PyTorch实现基于ResNet18迁移学习的宝可梦数据集分类

一、实现过程 1、数据集描述数据集分为5类，分别如下：皮卡丘：234 超梦：239 杰尼龟：223 小火龙：238 妙蛙种子：234 自取链接：https://pan.baid…

人工智能 2023年7月1日
0095
【NLP】非监督文本匹配算法——BM25

在信息搜索中，我们做的第一步就是检索。对于文本检索中，第一步就是数据库中的内容与检索的内容进行匹配，符合匹配要求的话就根据相关业务处理。在NLP中，我们可以认为是要让机器去理解检…

人工智能 2023年5月27日
0073
一个能让你免费问诊的python库

随着科技的发展，网上问诊也越来越火爆，各种网上付费的项目也是层出不穷，虽然有一定的效果，但是花费也是不少的，有的图片在线问诊需要花费上百元。这样让许多人感到了看病的压力。小编在上…

人工智能 2023年6月1日
0092

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

基于主成分分析PCA的人脸识别

主成分分析PCA

基于PCA的人脸识别算法

matlab代码

大家都在看