对于face_recognition：单个人的时候face_recognition准确度很可靠，但是有一个明显的缺点就是太慢（可能是我代码的问题），检测的帧率只有3次/秒。如果检测多个人，并且两个人很相似时准确度就有点说不过去了（血和泪的经历，项目写到一半发现实在太慢，才决定狼狈地重写人脸识别代码）。

对于opencv自带的Haar特征分类器：准确度虽不如face_recognition但还可以，他的速度很快，我的摄像头时30帧的，它检测的帧率可以达到20次/秒（我已经感到满足了）

人脸识别部分使用了opencv自带的Haar特征分类器–haarcascade_frontalface_alt2.xml ，相较于其他几个，这个我感觉很好。下面是我的代码，

check_time=0
def face_Detector(img,ser):
    gary=cv.cvtColor(img,cv.COLOR_BGR2GRAY)
    face_detect=cv.CascadeClassifier('C:/opencv/opencv/sources/data/haarcascades/haarcascade_frontalface_alt2.xml')#haarcascade_frontalface_default.xml
    face=face_detect.detectMultiScale(gary,1.1,5,cv.CASCADE_SCALE_IMAGE,(100,100),(300,300))
    for x,y,w,h in face:
        cv.rectangle(img,(x,y),(x+w,y+h),color=(0,0,255),thickness=2)
        ids,confidence = recognizer.predict(gary[y:y+h,x:x+w])

        if confidence 36:
                check_time = 0
                # save人员信息
                save(name[ids-1])

                ser.write('1'.encode())

            cv.putText(img, name[ids-1]+str(confidence), (x + 10, y - 10), cv.FONT_HERSHEY_COMPLEX, 0.75, (0, 255, 0), 1)

        else:
            ser.write('0'.encode())
            cv.putText(img, 'Unknown' , (x + 10, y - 10), cv.FONT_HERSHEY_COMPLEX, 0.75, (0, 255, 0),1)

这个过程中遇到了pycharm中opencv不提示代码的问题。

整了半天，才在这个大佬的文章中找到解决方案，http://t.csdn.cn/sQdN3

（二）、自定义物体识别：

在这个模块中我使用了自己训练的分类器

这是我的正样本：

这是我的负样本：

这是我最后的成果cascade.xml文件，也就是可以用的分类器：

自己训练分类器时，我用opencv4.5.3版本，借鉴网上网上大佬发的文章自己实践，结果发现只有opencv_createsamples.exe可以勉强编译出来，但opencv_traincascade.exe确实编译不出来，为此我不得不又下载了opencv3.4.8的版本，使用其自带的那两个可执行程序进行训练。

我使用了240张正样本，720张负样本，（正：负）==（1：3）（负样本一定要比正样本多，正负样本数量比例可以在1：3到1：5之间）。虽说样本数量不是很多，但效果还能接受。

下面是我的正样本描述文件，说一下文件里面1 0 0 40 40 后缀的含义。

我的正样本图片统一处理成了40*40，所以这里的1是指正样本图片中只有一个自定义的物体， 0 0 40 40的意思是覆盖整张图片

网上相关自己训练分类器的文章很多，具体的实现过程我也不在此过多地赘述了。

分类器训练完了之后，就可以直接使用了，下面展示我的代码：

def object_Detector(image):
    gray = cv.cvtColor(image,cv.COLOR_BGR2GRAY)
    bottle_cascade = cv.CascadeClassifier('C:/opencv/Object/xml/cascade.xml')
    bottle = bottle_cascade.detectMultiScale(gray,1.1,5,cv.CASCADE_SCALE_IMAGE,(50,50),(300,300))
    num = len(bottle)
    for x,y,w,h in bottle :
        cv.circle(image,center=(x+w//2,y+h//2),radius=w//2,color=(0,255,0),thickness=1)
    cv.putText(image,str(num),(20,20),cv.FONT_HERSHEY_COMPLEX, 0.75, (0, 0, 255),1)

（三）、图片展示：

由于项目要求，我的项目中opencv处理后的图片需要再我的单片机上显示，但这方面有点力不从心，所以我使用了socket实现opencv处理后的图片从客户端上传用服务端接受并展示。

这是客户端代码，从opencv中不断获取处理后的图片，进行编码、发送

#从客户端向服务端发送处理后的re_img图片
def SendVideo():
    global re_img, ret, state
    # IP地址和端口号
    IP = '127.0.0.1'
    PORT = 8002
    try:
        # 实例化：AF_INET:ip协议，SOCK_STREAM：tcp协议
        dataSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        # 开始连接
        dataSocket.connect((IP, PORT))
    # 错误处理
    except socket.error as msg:
        print(msg)
        sys.exit(1)

    # 压缩参数，对于jpeg来说，15代表图像质量，越高代表图像质量越好为 0-100，默认95
    encod_param = [int(cv.IMWRITE_JPEG_QUALITY), 15]

    while ret:
        # 停止0.05秒，防止发送过快服务的处理不过来
        time.sleep(0.05)
        # 将图片格式编码成流数据，方便网络传输
        # result:True/False
        # imgencode:numpy.ndarray类型的图像文件内容
        result, imgencode = cv.imencode('.jpg', re_img,encod_param)
        # 建立矩阵
        data = np.array(imgencode)
        # 将numpy矩阵转换成字符形式，以便在网络中传输
        stringData = data.tobytes()
        # ljust() 方法返回一个原字符串左对齐,并使用空格填充至指定长度的新字符串
        dataSocket.send(str.encode(str(len(stringData)).ljust(16)))
        # 发送数据
        dataSocket.send(stringData)
        if state == True:
            break
    dataSock.close()

这是服务端代码，不断从客户端里获取流数据，再进行一系列的转化、解码，最后展示到笔记本上

def ReceiveVideo():
    global state
    # ip地址'0.0.0.0'绑定本机所有IP地址
    IP = '0.0.0.0'
    # 端口号
    PORT = 8002
    # 实例化
    listenSocket = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    # 进行IP和端口号的绑定
    # 元组方式写入
    # 可以啊address=('0.0.0.0',50000)
    listenSocket.bind((IP, PORT))
    # 最多接受1个客户端
    listenSocket.listen(1)

    # 消息边界
    def recallbyt(sock, cnt):
        byt = b''  # byt是一个byte类型，用于接受流数据。（传输的数据就是byte类型的）
        while cnt:
            newbyt = sock.recv(cnt)
            if not newbyt: return None
            byt += newbyt
            cnt -= len(newbyt)
        return byt

    dataSocket, addr = listenSocket.accept()
    print('连接到:' + str(addr))

    while True:
        # 获得图片文件长度，16代表获取长度
        length = recallbyt(dataSocket, 16)
        # 根据获取的文件长度，获取图片文件
        StringData = recallbyt(dataSocket, int(length))
        # 将流数据转换成numpy 1维数组数据
        data = np.frombuffer(StringData, np.uint8)
        # 将数组数据进行解码,形成图像
        deco_img = cv.imdecode(data, cv.IMREAD_COLOR)
        cv.imshow('SERVER', deco_img)

        # 按键检测
        if cv.waitKey(1) == 81:
            dataSocket.close()
            state = True
            listenSocket.close()
            cv.destroyAllWindows()
            break

（四）、python框架：

整体采用了多线程的运行方式，并且在最开始通过一个判断来选择进行人脸识别模式还是自定义模块识别模式

thread_Rec = threading.Thread(target=ReceiveVideo)
thread_Sen = threading.Thread(target=SendVideo)
thread_take = threading.Thread(target=teak_img)

'''*************************模式判断*************************'''
mode = input('请选择模式：')
if mode == '1':
    thread_face = threading.Thread(target=face_det)
    thread_face.start()
elif mode == '2':
    thread_obj = threading.Thread(target=object_det)
    thread_obj.start()
'''**************************************************'''

thread_take.start()
thread_Rec.start()
thread_Sen.start()

因为想在一个python程序上就集成两个模式，对多线程的学习还没有很深入所以不得已做成这样的判断，来识别需要运行的模式

（五）、执行器–单片机：

项目中，单片机通过串口与python程序相通，进行判断是否是数据库中的人，从而进行显示通过或失败。

void USART2_IRQHandler(void)
{
    u8 i,ret;
    if (USART_GetITStatus (USART2,USART_IT_RXNE ))
    {
        ret = USART_ReceiveData(USART2);

        if (ret == '1' && (sate == 'N' || sate == 'E'))
        {
            LCD_Clear (WHITE);
            POINT_COLOR=GREEN;
            for(i=0;i

四、效果展示：

LCD上其实还有一些字，只是亮度太高，看不见了

五、总结：

这次的项目由于开始后的前两天一直在整face_recognition的代码到后来转到opencv自带的Haar特征分类器时有点”狼狈”，时间很紧张，来不及做其他的执行器模块。

这个项目对我来说最难的是画面展示的部分，因为电脑和单片机之间的通信我不太熟悉，问了一下我的师兄其他方法，随后了解到flask可以将视频传输到网页上，但是整了两天也没整会如何将网页上的视频流信息捕捉回来，到了结束的前一天才了解到socket可以进行服务端和客户端的信息传输，就赶紧听课、学习、写代码。

Original: https://blog.csdn.net/lal23156712/article/details/125945238
Author: 木子光star
Title: opencv人脸识别以及自定义物体识别系统

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/638021/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像质量评估(5) — 畸变(Distortion)

当图像中原本应该是直线的地方看起来发生了不自然的变形或扭曲时，我们称为图像畸变。有三种类型的镜头畸变：桶形畸变（后文使用英文barrel），枕形畸变（后文使用pincushion）…

人工智能 2023年6月18日
0069
线性代数 — 投影Projection 二（投影即分量）

投影即分量在上一篇文章中，我总结了两种计算投影向量的方法。一是用三角函数中夹角的余弦来证明和一是用两个相互垂直向量的内积为零证明的。老实说，在学习投影的过程中，我有很长一段时间都…

人工智能 2023年6月27日
00173
【考研数据结构题型分类讲解练习】5-3. 查找–应用题、实做题

更新时间：2022年11月3日做之前先看这个哈希查找方法_Anthony_4926-CSDN博客_哈希查询线性探测本文以例题形式讲解散列查找中，散列表的构建，以及查找成功的AS…

人工智能 2023年7月2日
0088
基于arm架构的ubuntu18 .04安装Anaconda3 + pytorch+python3.9

记录一下项目踩坑经历（查了很多资料，感觉都是对有基础的人来说的，对于刚接触深度学习环境的小白并不友好，很多细节并没有，各种坑无数，我也是花了好长时间才弄清楚。）。记录一下傻瓜式操作…

人工智能 2023年6月2日
0090
基于OpenCV的人脸识别

基于OpenCV的人脸识别 1.模块:（1）Core：包含OpenCV库的基础结构（2）Improe：图像处理，包含滤波和卷积操作（3）Highgui：OpenCV3.0中可分割为…

人工智能 2023年6月18日
0078
【机器学习】之第十三章——半监督学习

13.1、未标记样本在现实生活中，通常学习任务是已标记样本较少，而未标记的样本很多，那么按照传统监督学习的思想，便只能用已标记的少部分样本去训练学习器，这将会导致学习器的泛…

人工智能 2023年7月16日
0063
【有趣的Python小程序】Python多个简单上手的库制作WalkLattice 走格子游戏（思路篇）上

篇写上一个思路篇，那么今天我们就来完成这一项工作源代码和配套文件链接: https://caiyun.139.com/m/i?135ClY1yWrSKX 提取码:e4pq 复制…

人工智能 2023年6月28日
0065
小米菲的Tableau学习日记01：Tableau学习资料、安装及学生版申请

01 Tableau安装及学生版申请 * – 前言 – 参考资料 – 关于安装 – Tableau学生版申请 – + 学…

人工智能 2023年7月15日
0064
【力扣题解】石子游戏

🔗 题目链接题目描述 Alice 和 Bob 用几堆石子在做游戏。一共有偶数堆石子，排成一行；每堆都有正整数颗石子，数目为 piles[i] 。游戏以谁手中的石子最多来决…

人工智能 2023年6月28日
00171
6、SpringBoot 整合定时任务task

注解使用：使用注解@EnableScheduling 开启定时任务,会自动扫描定义 @Component 作为组件被容器扫描推荐一个生成表达式网址工具：https://cron…

人工智能 2023年6月28日
0073
tensor中数据类型的相互转换

Pytorch中的Tensor常用的类型转换函数 tensor数据类型转换例如： a = tensor(282, device=’cuda:0′) b =…

人工智能 2023年7月5日
0099
基于numpy的非线性回归_一文看懂线性回归（3个优缺点+8种方法评测）

线性回归是很基础的机器学习算法，本文将通俗易懂的介绍线性回归的基本概念，优缺点，8 种方法的速度评测，还有和逻辑回归的比较。什么是线性回归？线性回归的位置如上图所示，它属于机器…

人工智能 2023年6月18日
00137
【R语言】实验四数据分析

hospital-data 数据集数据是关于一些医院的基础信息，数据包含13个字段，包含的字段分别为：供应商编号、医院名、地址 1、地址2、地址3、所处城市、所处州、邮编、所处乡…

人工智能 2023年6月11日
0086
数字图像处理什么是霍夫变换？

一、霍夫变换概述霍夫变换是一种可用于隔离图像中特定形状的特征的技术。因为它要求以某种参数形式指定所需的特征，所以经典_霍夫变换最常用于检测规则曲线，如直线、圆、椭圆 _等。 _…

人工智能 2023年5月28日
0082
ImportError: cannot import name ‘Field‘ from ‘torchtext.data‘, No module named “legacy“

这些都是在下载最新的 torchtext后出现的问题，问题如标题，在 torchtext.data里面并没有 Field方法，以及通过别的博主在 data前加了 legacy却发现…

人工智能 2023年7月20日
0056
pytorch模型的保存与加载

torch.save 与 torch.load 模型保存有两种形式，一种是保存模型的 state_dict()，只是保存模型的参数。那么加载时需要先创建一个模型的实例 model，…

人工智能 2023年7月21日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

opencv人脸识别以及自定义物体识别系统

一、简介：

二、软硬件应用：

三、模块介绍：

（一）人脸识别：