OpenCV人脸识别

2023年7月28日上午6:14 • 人工智能 • 阅读 66

OpenCV人脸识别与口罩检测

下载文件

人脸检测

人脸检测的检测方法主要有两类:基于知识(根据眼睛,眉毛,嘴巴,鼻子等器官特征及相互几何位置关系来检测)和基于统计(将人脸看作一个二维像素矩阵,通过大量人脸图像样本构造人脸模式空间,由相似度量判断人脸是否存在).

基于知识的检测

模板匹配
人脸特征
形状边缘
纹理特征
颜色特征

基于统计的检测

主成分分析与特征脸
神经网络方法
支持向量机
隐马尔可夫模型
Adaboost算法

分类

对已知物体类别总数的识别方式,训练时数据就带有标签,明确是人脸还是非人脸,称为有监督学习.

聚类

处理类别总数不确定的方法或训练的数据无标签,无需学习阶段中关于物体类别的信息,成为无监督学习.

Haar分类器

Haar分类器=Har-like特征+积分图方法+AdaBoost+级联

使用Haar-like特征做检测
积分图对Haar-like特征求值加速
使用AdaBoost算法训练区分人脸与非人脸的强分类器
使用筛选式级联把强分类器级联,提高准确率

Haar-like特征

在人脸检测时需要有一个子窗口在待检测的图片窗口中不断的移位滑动，子窗口每到一个位置，就会计算出该区域的特征，再用训练好的级联分类器对该特征进行筛选，当这个特征通过了所有强分类器的筛选，就判定这个区域为人脸。

上面的方块都是Haar-like特征,将上面的任意一个矩形放到人脸区域上，然后，将白色区域的像素和减去黑色区域的像素和，得到的值为人脸特征值，如果把这个矩形放到一个非人脸区域，那么计算出的特征值应该和人脸特征值是不一样的，而且越不一样越好，所以这些方块的目的就是把人脸特征量化，以区分人脸和非人脸。

比如对于人脸区域,比较明显的两个特征是眼睛比面部和鼻梁区域颜色都要深.

为了增加区分度,对多个矩形特征计算得到区分度更大的特征值,寻找何种矩形何种特征就是AdaBoost的任务.

; AdaBoost算法

AdaBoost是一种有一般性的分类器提升算法,可以帮助选择更好的矩阵特征组合,也就是分类器,将矩阵组合以二叉决策树的形式存储起来.

弱学习

一个学习算法对一组概念的识别率只比随即识别好一点
容易获得,需要大量假设集合(基于某些简单规则的组合和对样本集的性能评估生成的)

强学习

一个学习算法对一组概念的识别率很高
不容易获得的

Kearns和Valiant两位大牛牛提出了弱学习和强学习等价的问题,证明只要有足够数据,弱学习方法可通过集成方式生成任意高精度的强学习方法.

弱分类器和强分类器对应的就是弱学习与强学习.

弱分类器

最初的弱分类器可能只是一个最基本的Haar-like特征，计算输入图像的Haar-like特征值，和最初的弱分类器的特征值比较，以此来判断输入图像是不是人脸，但这个弱分类器太简陋了，可能并不比随机判断的效果好，对弱分类器的孵化就是训练弱分类器成为相对误差稍低的最优弱分类器.

决策树

一个预测模型
代表对象属性与对象值的一种映射关系
分类树: 预计结果可能为两种类型
回归树: 局域结果可能为实数

假设使用三个Haar-like特征f1,f2,f3判断输入数据是否为人脸,可建立决策树

每个非叶子节点表示一种判断,每个路径代表一种判断的输出,每个叶子节点代表一种类别,作为最终判断结果.一个弱分类器是一个基本与上图类似的决策树,最基本的弱分类器只含一个Haar-like特征,即决策树仅一层,称为树桩.

最重要的就是如何决定每个结点判断的输出，要比较输入图片的特征值和弱分类器中特征，一定需要一个阈值，当输入图片的特征值大于该阈值时才判定其为人脸。训练最优弱分类器的过程实际上就是在寻找合适的分类器阈值，使该分类器对所有样本的判读误差最低。

; 强分类器

强分类器的诞生需要T轮迭代

S: 训练样本集
N: 样本数量
X: 正样本
Y: 负样本
T: 最大循环数量
1/N: 初始化样本权重,训练样本的初始概率分布
第一次迭代训练N个样本,得到一个最优弱分类器
提高上一轮被误判样本权重
新的样本和上次分错样本放在一起进行新一轮训练
循环执行4-5步,T轮后得到T个最优弱分类器
组合T个最有弱分类器得到强分类器,让所有弱分类器投票，再对投票结果按照弱分类器的错误率加权求和，将投票加权求和的结果与平均投票结果比较得出最终的结果

级联

通过AdaBoost算法训练出了强分类器，但在现实的人脸检测中，只靠一个强分类器还是难以保证检测的正确率，需要训练出多个强分类器将它们强强联手，最终形成正确率很高的级联分类器,即最终的目标Haar分类器。

输入图片输出大量的子窗口图像，这些子窗口图像经过筛选式级联分类器会不断地被每一个节点筛选，抛弃或通过, 这个结构也是一个决策树。

级联强分类器的策略是，将若干个强分类器由简单到复杂排列，希望经过训练使每个强分类器都有较高检测率，而误识率可以放低，比几乎99%的人脸可以通过，但50%的非人脸也可以通过，这样如果有20个强分类器级联，那么他们的总识别率为 0.9 9 20 = 98 % 0.99^{20}=98\%0 .9 9 2 0 =9 8 % ，错误接受率也仅为0. 5 20 = 0.0001 % 0.5^{20}=0.0001\%0 .5 2 0 =0 .0 0 0 1 %。这样的效果就可以满足现实的需要了，但是如何使每个强分类器都具有较高检测率呢，为什么单个的强分类器不可以同时具有较高检测率和较高误识率呢？

AdaBoost训练出来的强分类器一般具有较小的误识率，但检测率并不很高，一般高检测率会导致高误识率，这是强分类阈值的划分导致的，要提高强分类器的检测率既要降低阈值，要降低强分类器的误识率就要提高阈值，这是个矛盾的事情。而增加分类器个数可以在提高强分类器检测率的同时降低误识率，所以级联分类器在训练时要考虑如下平衡，一是弱分类器的个数和计算时间的平衡，二是强分类器检测率和误识率之间的平衡。

; OpenCV

OpenCV是计算机视觉中经典的专用库，其支持多语言、跨平台，功能强大。OpenCV-Python为OpenCV提供了Python接口，使得使用者在Python中能够调用C/C++，在保证易读性和运行效率的前提下，实现所需的功能。
安装教程

OpenCV的Haar级联分类器

OpenCV提供了一种训练方法或预先训练的模型，可以在OpenCV安装的 \opencv\sources\data\haarcascades_cuda文件夹中找到, 可以使用 cv2.CascadeClassifier(~)方法读取。

先用OpenCV开启笔记本默认摄像头

import numpy as np
import cv2
cap = cv2.VideoCapture(0)
while 1:
    ret,frame = cap.read()
    cv2.imshow("picture",frame)
    if cv2.waitKey(1) == 27:
        break
cv2.destroyAllWindows()

文件夹里有很多分类器, 这里用的是 haarcascade_frontalface_default.xml正脸检测分类器.

人脸检测

参考文件 FaceFind.py


face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')

用 face_cascade.detectMultiScale可以对输入的灰度图检测, 返回的是一个列表, 列表的元素是人脸所在矩形区域的左上角坐标和宽高, 获取之后我们在原图像上画出来,这里先把检测和画图封装成函数.


def detect_face(img):

    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    faces = face_cascade.detectMultiScale(gray, scaleFactor=1.2,minNeighbors=5,minSize=(20, 20))

    if (len(faces) == 0):
        return None, None

    (x, y, w, h) = faces[0]

    return gray[y:y + w, x:x + h], faces[0]

def draw_rectangle(img, rect):
    (x, y, w, h) = rect
    cv2.rectangle(img, (x, y), (x + w, y + h), (255, 128, 0), 2)
    cv2.rectangle(img, (x+2, y+2), (x + w-2, y + h-2), (0, 255, 128), 2)

然后在while循环的获取图像后加上

try:
    face, rect = detect_face(frame)
    draw_rectangle(frame, rect)
except:
    print("no face")

模型训练

参考文件 FaceTrain.py

知道哪一个区域是人脸后, 下一步就是分辨人脸是谁了, OpenCV也提供了方便的工具, 先录入图片, 创建识别器, 训练得到模型并保存.


faces = []
labels = []
Names = ["Trump", "Putin", "TrumpTin"]
NameNumber = 2

输入参数是人脸图片和标签(正整数123), 一般录入人脸是输入姓名, 但姓名其实也是对应整数标签, 这里偷一下懒, 用 NameNumber指代姓名, 检测时再用标签对应到名字数组.

在框选到人脸之后添加, 每次训练都是创建一个新模型, 覆盖掉原来的模型, 所以举例的代码得到的模型只能分辨到一张人脸.

if face is not None:

    faces.append(face)
    labels.append(NameNumber)
    times += 1
    print(times)
if times > 15:

    face_recognizer = cv2.face.LBPHFaceRecognizer_create()
    face_recognizer.train(faces, np.array(labels))

    face_recognizer.save("face_model.xml")
    break

人脸预测

参考文件 FaceDectect.py

训练得到的是xml后缀的文件, 在检测程序里先加载为 face_recognizer


def Load_face_model():
    face_recognizer = cv2.face.LBPHFaceRecognizer_create()
    try:
        face_recognizer.read("face_model.xml")
        return face_recognizer
    except:
        print('No Module, please obtain first')
        noi = 1
        return noi
face_recognizer = Load_face_model()
Names = ["Trump", "Putin", "TrumpTin"]

创建预测函数, 用 face_recognizer.predict(face)对 detect_face出的面部区域进行预测, 可以得到一个结果列表 label[2], 其中 label[0]是预测的标签, 如果正确就是上一节输入的标签 NameNumber, label[1]是预测输入的图像与这个标签的正确度, 越小正确度越高, 这里我们取小于70认为是正确, 并用标签 label[0]映射回姓名列表, 在图片上写出姓名, 如果否, 就写上陌生人stranger.


def predict(test_img):

    img = test_img.copy()

    face, rect = detect_face(img)
    try:

        label = face_recognizer.predict(face)
        print(label)

        draw_rectangle(img, rect)
        if label[1]<70:

            label_text = Names[label[0]-1]

            draw_text(img, label_text,  rect[0], rect[1] - 15, "WHITE")
        else:

            draw_text(img, "Stranger",  rect[0], rect[1] - 5, "RED")
    except Exception as err:
        print(err)

    return img

while 1里的检测改为

try:
    predicted_img = predict(frame)
except:
    print("no face")

例子里的代码每次训练都是创建一个新模型, 覆盖掉原来的模型, 程序就结束了, 所以举例的代码得到的模型只能分辨到一张人脸. 如果要识别多个人脸, 可以运行gui控件, 根据不同操作持续添加人脸数据, 或者每次都把不同人的图片存下来, 训练时统一调用训练.

口罩检测

类似的原理可以训练出检测是否佩戴口罩的模型

mask_cascade = cv2.CascadeClassifier('no_mask_detect_cascade.xml')


def detect_facemask(img):

    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

    faces = face_cascade.detectMultiScale(gray, scaleFactor=1.2,
        minNeighbors=5,minSize=(50, 50))

    if (len(faces) == 0):
        return None, None, None

    (x, y, w, h) = faces[0]
    no_mask = mask_cascade.detectMultiScale(gray[y:y + w, x:x + h],
        scaleFactor  = 1.01, minNeighbors = 4)

    return gray[y:y + w, x:x + h], faces[0], no_mask

红外测温

如果用的是树莓派, 可以比较方便地用杜邦线接入mlx90614等红外测温模块.

模块用smbus协议通讯, 附件中有现成的接口 mlx90614.py, 直接调用即可.

上面这些东西组合起来, 其实是2020年电子设计大赛的赛题

参考

关注公众号 小电动车

回复 人脸识别获取代码

Original: https://blog.csdn.net/weixin_46143152/article/details/122689082
Author: 子氚
Title: OpenCV人脸识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/719925/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

自动驾驶面试题汇总（2022秋招题库）——持续更新

这份面试题整理自12家大厂的2022年秋招面试题。题目基本涵盖了自动驾驶和机器人定位方向的主要知识点，包括惯性导航、点云、状态估计、CV/VIO、C++等部分。建议大家先自己答题…

人工智能 2023年6月10日
00128
Neo4j 安装及快速入门

Neo4j 1、简介 Neo4j 是一个高性能的， NOSQL 图形数据库，它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的 Java…

人工智能 2023年6月10日
0094
【PyTorch教程】P8-9 Tensorboard使用

完整目录 P6-P7 数据加载 P8-9 Tensorboard使用 P10-11 Transform的用法 P12-13 常用的tranforms P14 torchvision…

人工智能 2023年6月20日
00129
OpenCV图像处理入门

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉pyt…

人工智能 2023年6月17日
0075
苞米面 Paddle 助手介绍

自己用的百度飞桨 Paddle，PaddleX 项目模板和小工具。My Paddle PaddleX project templates. 适用系统一些脚本使用 shell 编写…

人工智能 2023年6月4日
0076
Open images v6 + Yolov5 轻松获取数据并做2D目标检测

记录一下从数据获取到做出符合需求的2d检测模型的全过程，记录一共分为四个章节.其中第一个章节讲如何通过fiftyone工具获取到常用的计算机视觉数据集；第二个章节讲如何对图片进…

人工智能 2023年7月9日
0082
树的基本术语

节点的度与树的度 ● 树中某个节点的子树的个数称为该节点的度● 树中各节点的度的最大值称为树的度● 通常将度为 m 的树称为m 次树所以树中的所有节点中, 最大的度 , 称为树…

人工智能 2023年6月27日
0083
目标检测数据集标注工具LabelImg从安装到使用详解

1.LabelImg的安装在Windows10系统下使用Anaconda来安装LabelImg，步骤如下：首先打开conda 这里建议专门创建一个新环境来安装LabelImg，…

人工智能 2023年6月16日
0067
如何在Python中创建一个张量

如何在Python中创建一个张量介绍张量是多维数学对象，在机器学习和深度学习中被广泛应用。在Python中，我们可以使用各种库来创建和操作张量。本文将介绍如何使用Python库…

人工智能 2024年1月1日
0039
【机器学习】机器学习基本概念/术语

序言记录机器学习基本概念，不做详细解释，常识积累。长期更新… # 监督学习监督学习：数据有label，主要是分类和回归两种方法监督学习的任务是学习一个模型，对…

人工智能 2023年7月14日
0065
使用OpenCV训练分类器时出现Error: Bad argument 和 Error: Insufficient memory 解决办法

OpenCV(3.4.1) Error: Bad argument (Can not get new positive sample. The most possible reas…

人工智能 2023年6月20日
0092
【数字图像处理课程设计】期中、期末综合考试题目整理总结（共四个图像处理算法应用题）

目录一、下面两幅图像中有几处不同，编程把它们找出来、并在图中突出显示（关键步骤不能调用内置函数）。 1.算法原理 2.解题步骤 3.程序代码 4.处理结果二、下图含有干扰条纹（…

人工智能 2023年6月18日
0068
Matlab：构建模式表达式

Matlab：构建模式表达式构建简单模式边界模式分步构建复杂模式组织模式显示模式是帮助搜索和修改文本的工具。与正则表达式类似，模式定义匹配文本的规则。模式可与文本搜索函数…

人工智能 2023年6月28日
0077
BBAVectors旋转目标检测算法安装部署使用笔记

BBAVectors旋转目标检测算法安装部署使用笔记安装 * step1 step2 数据集准备训练测试验证测试AP 安装整体步骤从参考官方github：https:/…

人工智能 2023年7月12日
0092
【NLP基础理论】 09 分布语义学（Distributional Semantics)）

注： Unimelb Comp90042 NLP笔记相关tutorial代码链接分布语义学目录分布语义学 1 分布语义学 * 1.1 分布假设 1.2 根据上下文猜意思 1…

人工智能 2023年5月30日
00122
java计算机毕业设计Web企业差旅在线管理系统源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月27日
0082

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

OpenCV人脸识别

Haar-like特征

; AdaBoost算法

弱分类器

; 强分类器

级联

人脸检测

模型训练

人脸预测

大家都在看