模式识别作业–人脸识别（python+PCA+pytorch神经网络）

2023年7月12日下午9:56 • 人工智能 • 阅读 62

模式识别作业–人脸识别（python+PCA+pytorch）

1、实验原理

该实验通过PCA降维+BP神经网络的算法实现对人脸数据集中人脸数据的识别

2、实验步骤

1、图片预处理

首先将测试集和训练集图片转化为灰度图，为了减少背景对实验结果的影响，使用OpenCV中继承好的 CascadeClassifier级联分类器从原始的灰度图中识别并将人脸切取出来并保存。由于人脸的不规则性所以切取出来的人脸数据图片的大小并不一致，所以将图片reshape为200×200的像素大小。

2、PCA降维

经过预处理后的图片已经有统一的格式，都有200×200个像素，即40000个特征，我们的目标是通过PCA算法建立映射空间将原始数据映射到低维空间中从而实现对初始数据的降维，并保存降维后的训练数据和测试数据，便于后期神经网络的分类运算，步骤如下：

1、设有n训练集中的图片，每张训练集图片的像素为c=a×b(200×200)
2、将每张图片的ab矩阵转换c维列向量的形式构成n列的矩阵X（c×n）
3、对矩阵X进行均值、中心化操作、并求得协方差矩阵
4、求取协方差矩阵的特征值并取k个特征值(k:取值于使累计贡献率>90%的特征值数量)所对应的特征向量V（特征脸）。
5、将K个特征向量合并成特征空间T(c×k)
6、将原始数据矩阵投射到该特征空间得到降维矩阵。

3、BP神经网络实现对图像的分类

使用pytorch框架构建神经网络，并进行训练分类，步骤如下：

1、重写Getloader类，使用Dataloader迭代器处理训练数据和测试数据，构建用于模型训练和测试的数据结构，便于后期的使用和扩展。
2、构建一个k×200×350×500×625的神经网络。（k为将为后的图片的特征数，即输入神经元的个数，200、300、500为隐藏层的神经元个数，625为输出神经元的个数）
3、用训练数据训练模型。
4、用测试训练集的数据进行分类并计算分类的准确性。

3、实验过程详解

1、人脸识别的基本流程

; 2、读入数据库并剪切人脸

main.py


import os
import cv2
import time

def getAllPath(dirpath, *suffix):
    PathArray = []
    for r, ds, fs in os.walk(dirpath):
        for fn in fs:
            if os.path.splitext(fn)[1] in suffix:
                fname = os.path.join(r, fn)
                PathArray.append(fname)
    return PathArray

def readPicSaveFace(sourcePath, targetPath,  *suffix):
    try:
        ImagePaths = getAllPath(sourcePath, *suffix)

        count = 1

        path = "haarcascade_frontalface_alt2.xml"
        face_cascade = cv2.CascadeClassifier(path)
        for imagePath in ImagePaths:

            filename = os.path.split(imagePath)[1]
            img = cv2.imread(imagePath, cv2.IMREAD_GRAYSCALE)
            if type(img) != str:
                faces = face_cascade.detectMultiScale(img)

                for (x, y, w, h) in faces:

                     if w >= 128 and h >= 128:

                        X = int(x)
                        Y = int(y)
                        W = min(int((x + w)), img.shape[1])
                        H = min(int((y + h)), img.shape[0])
                        f = cv2.resize(img[Y:H, X:W], (W - X, H - Y))
                        f = cv2.resize(f, (200, 200))
                        cv2.imwrite(targetPath + os.sep + filename, f)
                        count += 1

    except IOError:
        print("Error")

    else:
        print('Find ' + str(count - 1) + ' faces to Destination ' + targetPath)

if __name__ == '__main__':
    start = time.time()
    sourcePath = r'G:\FaceRcogImg\TrainSourceImg'
    targetPath = r'G:\FaceRcogImg\TrainFaceData'
    readPicSaveFace(sourcePath, targetPath, '.jpg', '.JPG', 'png', 'PNG')
    sourcePath = r'G:\FaceRcogImg\TestSourceImg'
    targetPath = r'G:\FaceRcogImg\TestFaceData'
    readPicSaveFace(sourcePath, targetPath, '.jpg', '.JPG', 'png', 'PNG')
    end = time.time()
    print('程序运行时间是：{}'.format(end-start))

此程序用于将原始图片进行人脸剪切并将其图片大小标准化为200×200的像素大小的格式。该过程耗时较长，大概需要10分钟左右。（图5是成程序运行成果）剪切的结果如下图所示。

原始数据

处理后的照片

由于采用级联分类器进行剪切，会不可避免的出现下图的干扰结果，但是在所有的处理后的图像中该种类的图像个数很少，并不会影响最终的实验结果，这里我们忽略其对实验的影响（或者可以手动删除）。

3、pca特征提取

首先我们要先将图片集转换为矩阵形式

ImgPaths, label = getAllPath(sourcePath, *suffix)
imageMatrix = []
count = 0
for imgpath in ImgPaths:
    count += 1
    img = cv2.imread(imgpath, cv2.IMREAD_GRAYSCALE)

    mats = np.array(img)

    imageMatrix.append(mats.ravel())
imageMatrix = np.array(imageMatrix)

接着按行求图片矩阵的均值，即这个训练集的平均脸，


imageMatrix = np.transpose(imageMatrix)
imageMatrix = np.mat(imageMatrix)

mean_img = np.mean(imageMatrix, axis=1)

mean_img1 = np.reshape(mean_img, IMAGE_SIZE)
im = Image.fromarray(np.uint8(mean_img1))
im.show()

平均脸图片如下图所示

4、计算协方差矩阵和特征向量

此处我们将样本中心化之后(减去平均脸)


imageMatrix = imageMatrix - mean_img

imag_mat = (imageMatrix.T * imageMatrix) / float(count)
W, V = np.linalg.eig(imag_mat)

V_img = imageMatrix * V

此处需要介绍一下求取协方差矩阵和特征向量的取巧之处，按照协方差矩阵公式，

可知协方差矩阵的维度为40000 X 40000，这意味着求取协方差的特征值和特征向量的运算量会很大，我自己电脑上会超出内存。所以我们进行一些转化，推导如下图所示。

的特征向量，然后根据上面的推导求出协方差的特征向量。这大大减少了建立投影子空间的运算量。

下面是按照对应特征值降序排序后所得的部分特征脸的图片

我们可以发现前面三张特征脸看上去要比后面三张特征脸”清楚”得多，也就是说前三张特征脸所包含的”信息”要比后三张所包含的”信息”多。其实这是由于这些特征向量对应的特征值的大小不同造成的，特征值越大，则人脸越”清晰”。

5、选取部分特征值

从前面我们知道有些特征脸所携带的”信息”十分少，那么我们可以将所得到的所有特征脸按照特征值的大小排序，选取累计贡献值大于90%的前k个特征脸，这样一来在尽可能小的影响模型精度的情况下对特征空间降维。


axis = W.argsort()[::-1]
V_img = V_img[:, axis]

number = 0
x = sum(W)
for i in range(len(axis)):
    number += W[axis[i]]
    if float(number) / x > 0.9:
        print('累加有效值是：', i)
        break

V_img_finall = V_img[:, :62]

最后的结果是前62 个特征脸可以保留90%的人脸信息，这62个特征向量就构成了我们需要的特征空间，所以降维后的人脸信息维度是62。

我们将降维后的测试集和训练集图片信息保存为.csv文件，便于后续神经网络分类


projectedImage = V_img_finall.T * train_imageMatrix
np.savetxt('pca_train_matrix.csv', projectedImage, delimiter=',')

6、BP神经网络分类

此处构建的是很简单的BP神经网络，不再详细赘述，可以看代码中的注释，写的还是很详细的。其他的主要是重写了GetLoader类方法，用于多线程的处理训练数据，用以加速伸进网络的训练时间。


class GetLoader(torch.utils.data.Dataset):

    def __init__(self, data_root, data_label):
        self.data = data_root
        self.label = data_label

    def __getitem__(self, index):
        data = self.data[index]
        labels = self.label[index]
        return data, labels

    def __len__(self):
        return len(self.data)

train_set_ = GetLoader(train_set, train_lable)
test_set_ = GetLoader(test_set, test_lable)
train_data = DataLoader(train_set_, batch_size=64, shuffle=True)
test_data = DataLoader(test_set_, batch_size=32, shuffle=False)

4、实验结果

最终识别的准确率为94%左右。

代码下载地址

数据下载地址提取码: 6pn5

; 5、写在最后

最好将main函数中用到的级联分类器 haarcascade_frontalface_alt2.xml改成自己环境的安装目录中的，如下图所示（我是用anaconda配置的环境）

Original: https://blog.csdn.net/Thewindking/article/details/122176614
Author: 愤怒的potato
Title: 模式识别作业–人脸识别（python+PCA+pytorch神经网络）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/688477/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python pandas 数据处理：删除特定行、列

dropna() 方法过滤任何含有缺失值的行 pandas.DataFrame里，如果一行数据有任意值为空，则过滤掉整行，这时候使用 dropna()方法是合适的。下面的案例，任意…

人工智能 2023年7月6日
0057
目标检测论文中的ROI | 各种方法横向学习

包含的论文一览【Fast R-CNN】 RoI pooling（未施工）【Faster RCNN】Region Proposal Network 【Mask RCNN】 ROI…

人工智能 2023年5月28日
0077
【Pytorch神经网络理论篇】 20 神经网络中的注意力机制

同学你好！本文章于2021年末编写，获得广泛的好评！故在2022年末对本系列进行填充与更新，欢迎大家订阅最新的专栏，获取基于Pytorch1.10版本的理论代码(2023版)实现…

人工智能 2023年7月12日
0067
电脑wps可以语音录入吗_WPS怎么样？语音速记助你1分钟输入400字

作为记者、编辑、作家等文字工作者，或者勤奋的学生，总有一部分时间花在费时费力的工作上。 [En] As journalists, editors, writers and othe…

人工智能 2023年5月27日
00113
【OpenCV 例程200篇】62. 图像锐化——钝化掩蔽

【OpenCV 例程200篇】62. 图像锐化——钝化掩蔽欢迎关注『OpenCV 例程200篇』系列，持续更新中欢迎关注『Python小白的OpenCV学习课』系列，持续更新…

人工智能 2023年6月18日
0073
local_rank，rank，node等理解

node:代表物理节点，即电脑台数，一台电脑可以有多个GPU nnodes：物理节点数，就是电脑数量 node_rank：物理节点的序号，每个电脑的序号 nproc_per_nod…

人工智能 2023年7月29日
0052
【tensorflow2.x】tensorflow和keras的使用问题与入门YOLOv3

参考文：https://cloud.tencent.com/developer/article/1687398https://blog.csdn.net/javastart/art…

人工智能 2023年5月26日
0071
目标检测——yolov3论文精读

📝论文下载 Abstract(摘要) YOLOv3在YOLO的基础上做了一些更新，重点在于提升检测的精度。当图片的分辨率为320 × 320，YOLOv3只使用了22 ms进行…

人工智能 2023年6月17日
0088
100天精通Python（数据分析篇）——第51天：numpy函数进阶

### 回答1：这个问题的意思是询问一个学习 Python 数据分析_的 _100 天_计划，我的回答如下： _Python 数据分析_是非常重要的技能之一，学习它需要长时间的实…

人工智能 2023年7月14日
0053
EEG | EEGNet 神经网络分类脑电信号实战（附完整源码）

EEGNet + MNE 分类 Sample数据集一、环境配置 Package name Version Python3.7Tensorflow2.7.0mne0.24.1mat…

人工智能 2023年6月30日
00106
图片主色提取

文章目录提取主色 * 1. RGB Or HSV 2. KMeans 自适应 3. 整体过程及代码 4. 结果后续提取主色 [TencentCloudSDKException…

人工智能 2023年6月2日
00100
漫画 | 这个北欧小国发明的编程技术，竟然占领全世界了！

上世纪60年代，挪威计算中心。一个新来员工刚上班，发现有两个人居然在一楼的黑板前打架新员工立刻跑到电话接线员那里报告什么样的编程语言，能让两人大动肝火？当时Nygaard…

人工智能 2023年7月31日
0068
conda创建环境过程中出现“Solving environment: failed”报错的解决办法

前言在安装完Anaconda之后，打开Anaconda Prompt，若出现”（base）”说明Anaconda安装成功。具体Anaconda的安装后续…

人工智能 2023年6月12日
0082
YOLO V5源码详解

1.数据读取首先读取图片以及标签路径，并将标签存入缓存，对单标签情况、特定类别、以及是否保持长方形等情况分别进行处理。如果需要进行mosaic 数据增强，首先找到中心点，将图片…

人工智能 2023年6月23日
0068
弹性网络回归是一种回归算法，它结合了岭回归和Lasso回归的特点，既使用L2正则化项又使用L1正则化项。通过选择合适的混合比例，可以在特征选择和过拟合控制之间进行权衡

弹性网络回归弹性网络回归是一种回归算法，通过结合岭回归和Lasso回归的特点，既可以使用L2正则化项又可以使用L1正则化项。这使得弹性网络回归能够在特征选择和过拟合控制之间进行权…

人工智能 2023年12月31日
0042
什么是零填充操作？它在张量中的应用是什么

什么是零填充操作？在深度学习中，卷积神经网络（Convolutional Neural Network, CNN）通常用于图像处理任务。在CNN中，输入图像通常表示为一个多维数组…

人工智能 2024年1月1日
0047

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31