FPGA图像处理学习——基于肤色的人脸识别

2023年6月17日下午7:58 • 人工智能 • 阅读 92

本文针对咸鱼FPGA的FPGA实现人脸检测以及直方图拉伸进行原理学习。工程在文末。

一、人脸识别大致流程

获取人脸图像——肤色提取（Ycbcr+阈值）——滤波处理（中值、腐蚀膨胀）——人脸框选——显示

肤色提取：顾名思义，将肤色从外界环境中提取出。在肤色识别算法中，常用YCbCr颜色空间（亮度、蓝色、红色分量），因为肤色在 YCbCr 空间受亮度信息的影响较小，从而肤色类聚性好，由此，在Ycbcr空间基础上，我们用 人工阈值法将肤色与非肤色区域分开，最终形成 二值图像，实现肤色的提取。

滤波处理：人脸内部可能存在黑点、人脸外的某些地方也可能会被误检测为人脸，这些情况都会造成识别失败，因此加入中值滤波以及腐蚀、膨胀，这些之前都整理过，不展开说了。

; 1、人脸肤色识别

原理：先进行Ycbcr空间转换得到亮度、蓝色、红色分量，给cb和cr设置阈值，即可将肤色提取出来。（共采用四级流水线）

1.1 Ycbcr三级流水线

首先三级流水线后，可得到三分量如下：

always @(posedge clk or negedge rst_n) begin
    if(!rst_n)begin
        Y2   8'd0;
        Cb2 d0;
        Cr2  8'd0;
    end
    else begin
        Y2   Y1[15:8];
        Cb2  Cb1[15:8];
        Cr2  Cr1[15:8];
    end
end

1.2 第四级流水线进行肤色识别

Cb和Cr设置阈值： Cb：77 ~ 127 ；Cr：133~173；（前人大量研究得到的经验值），最终输出的结果是 二值化结果，目的是减少运算量！

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        face_data  'h0;
    end
    else if( (Cb2 > 77) && (Cb2 < 127) && (Cr2 > 133) && (Cr2 < 173) ) begin
        face_data hffff;
    end
    else begin
        face_data  'h0;
    end
end

RTL图如下：
可看到，输入是RGB565原图数据，内部进行Ycbcr转换，分别得到8位的Y，Cb，Cr分量，后根据蓝红分量的阈值得到16位的二值化肤色数据face_data，阈值内为白色，阈值外为黑色；

2、滤波处理

检测出肤色后，为提高图像质量，进行中值滤波、腐蚀膨胀处理。

3、人脸框选（人脸框和原图一起输出）

通过肤色检测出人脸后，我们用行列坐标画框，将人脸框选出来，最终人脸框和图像数据同时输出，原图图像数据是16位，因此前面肤色数据face_data也用的16位。

RGB信号：原图数据、使能以及行场有效信号。
face信号：人脸肤色提取后的图像数据、使能以及行场有效信号。

; 3.1 人脸框的四个顶点坐标

如何得到人脸框的四个顶点坐标？

因为两帧图像差别较小，因此我们将人脸肤色图像分两帧来处理，通过这两帧图像得到人脸框的坐标，这样可防止图像结果偏移的情况出现。其中第一帧得到框的四个顶点坐标，当前帧的输出即可实时的使用人脸框的四个顶点坐标。

1、既然要用连续的两帧肤色图像，我们就要对图像延迟一拍。

always @(posedge clk) begin
    face_vsync_r  face_vsync;
end

2、通过连续两帧图像的场有效信号得到最终的边沿信号，上升沿为人脸肤色图像开始标志，下降沿为结束标志。

assign pos_vsync =  face_vsync && ~face_vsync_r;
assign neg_vsync = ~face_vsync &&  face_vsync_r;

3.2 人脸图像横纵坐标

3、利用显示驱动生成的行场计数器，得到人脸图像的横纵坐标

parameter COL               = 11'd640              ;
parameter ROW               = 11'd480              ;
always @(posedge clk or negedge rst_n) begin
    if(!rst_n)
        face_x  10'd0;
    else if(add_face_x) begin
        if(end_face_x)
            face_x  10'd0;
        else
            face_x  face_x + 10'd1;
    end
end

assign add_face_x = face_de;
assign end_face_x = add_face_x && face_x== COL-10'd1;

always @(posedge clk or negedge rst_n) begin
    if(!rst_n)
        face_y  10'd0;
    else if(add_face_y) begin
        if(end_face_y)
            face_y  10'd0;
        else
            face_y  face_y + 10'd1;
    end
end

assign add_face_y = end_face_x;
assign end_face_y = add_face_y && face_y== ROW-10'd1;

3.3 人脸框选

3中得到了图像的横纵坐标，从而可确定出框的四个顶点坐标，然后利用延迟后的一帧图像来将人脸框和图像数据同时实时输出。

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        x_min  COL;
    end
    else if(pos_vsync) begin
        x_min  COL;
    end
    else if(face_data==16'hffff && x_min > face_x && face_de) begin
        x_min  face_x;
    end
end

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        x_max  0;
    end
    else if(pos_vsync) begin
        x_max  0;
    end
    else if(face_data==16'hffff && x_max < face_x && face_de) begin
        x_max  face_x;
    end
end

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        y_min  ROW;
    end
    else if(pos_vsync) begin
        y_min  ROW;
    end
    else if(face_data==16'hffff && y_min > face_y && face_de) begin
        y_min  face_y;
    end
end

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        y_max  0;
    end
    else if(pos_vsync) begin
        y_max  0;
    end
    else if(face_data==16'hffff && y_max < face_y && face_de) begin
        y_max  face_y;
    end
end

5、实时顶点坐标值的保存

前一帧到当前帧的间隙来保存坐标值，从而供当前帧来实时使用。

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        x_min_r  0;
        x_max_r  0;
        y_min_r  0;
        y_max_r  0;
    end
    else if(neg_vsync) begin
        x_min_r  x_min;
        x_max_r  x_max;
        y_min_r  y_min;
        y_max_r  y_max;
    end
end

至此，得到了人脸框，接下来找该人脸框下对应的原图数据。

6、原图行列计数器

always @(posedge clk or negedge rst_n) begin
    if(!rst_n)
        RGB_x  10'd0;
    else if(add_RGB_x) begin
        if(end_RGB_x)
            RGB_x  10'd0;
        else
            RGB_x  RGB_x + 10'd1;
    end
end

assign add_RGB_x = RGB_de;
assign end_RGB_x = add_RGB_x && RGB_x== COL-10'd1;

always @(posedge clk or negedge rst_n) begin
    if(!rst_n)
        RGB_y  10'd0;
    else if(add_RGB_y) begin
        if(end_RGB_y)
            RGB_y  10'd0;
        else
            RGB_y  RGB_y + 10'd1;
    end
end

assign add_RGB_y = end_RGB_x;
assign end_RGB_y = add_RGB_y && RGB_y== ROW-10'd1;

7、人脸框和原图输出
用按键来控制识别效果，一种是原图的人脸检测，一种是二值化腐蚀膨胀后的人脸检测效果。

always @(posedge clk or negedge rst_n) begin
    if(!rst_n)
        key_num  1'b0;
    else if(key_vld)
        key_num  ~key_num;
end

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        TFT_de     1'b0;
        TFT_hsync  1'b0;
        TFT_vsync  1'b0;
        TFT_data   16'b0;
    end
    else if(key_num==1'b0) begin
        if((RGB_y >= y_min_r-1 && RGB_y  y_min_r+1) && RGB_x >= x_min_r && RGB_x  x_max_r) begin
            TFT_data  16'b11111_000000_00000;
        end
        else if((RGB_y >= y_max_r-1 && RGB_y  y_max_r+1) && RGB_x >= x_min_r && RGB_x  x_max_r) begin
            TFT_data  16'b11111_000000_00000;
        end
        else if((RGB_x >= x_min_r-1 && RGB_x  x_min_r+1) && RGB_y >= y_min_r && RGB_y  y_max_r) begin
            TFT_data  16'b11111_000000_00000;
        end
        else if((RGB_x >= x_max_r-1 && RGB_x  x_max_r+1) && RGB_y >= y_min_r && RGB_y  y_max_r) begin
            TFT_data  16'b11111_000000_00000;
        end
        else begin
            TFT_de     RGB_de;
            TFT_hsync  RGB_hsync;
            TFT_vsync  RGB_vsync;
            TFT_data   RGB_data;
        end
    end
    else if(key_num==1'b1) begin
        if((face_y >= y_min_r-1 && face_y  y_min_r+1) && face_x >= x_min_r && face_x  x_max_r) begin
            TFT_data  16'b11111_000000_00000;
        end
        else if((face_y >= y_max_r-1 && face_y  y_max_r+1) && face_x >= x_min_r && face_x  x_max_r) begin
            TFT_data  16'b11111_000000_00000;
        end
        else if((face_x >= x_min_r-1 && face_x  x_min_r+1) && face_y >= y_min_r && face_y  y_max_r) begin
            TFT_data  16'b11111_000000_00000;
        end
        else if((face_x >= x_max_r-1 && face_x  x_max_r+1) && face_y >= y_min_r && face_y  y_max_r) begin
            TFT_data  16'b11111_000000_00000;
        end
        else begin
            TFT_de     face_de;
            TFT_hsync  face_hsync;
            TFT_vsync  face_vsync;
            TFT_data   face_data;
        end
    [添加链接描述](https:
end

本文主要学习：人脸肤色如何提取（为蓝红分量设置阈值），以及人脸框如何得到（延迟一拍得到连续两帧图像，从而实时地使用这四个顶点坐标，根据四个顶点的横纵坐标值赋予颜色，得到方框）。木有想到一个假期竟然只看了这………………

二、直方图拉伸

基于人脸识别获取顶点坐标的方法，对直方图拉伸的图像算法进行分析并编写verilg代码。

1、直方图拉伸的简单介绍

参考：在视频图像处理中，为了能够实时调节图像对比度，通常进行直方图拉伸，直方图拉伸是指将图像灰度直方图较窄的灰度级区间向两端拉伸，从而增强整幅图像像素的灰度级对比度，达到增强图像的效果。

2、直方图拉伸公式

A：Imin，表示最小灰度级
B：Imax，表示最大灰度级

和人脸框求顶点坐标相同，直方图拉伸也采用两帧图像进行处理。只有一帧图像流过之后，我们才能得到该图像的最大和最小灰度级，才能进行后续直方图拉伸公式的计算，由于连续两帧图像差别小，我们分成两帧图像。

方法：
1、帧延迟一拍，获得前一帧和当前帧
2、前一帧计算最小最大灰度级AB
3、在前一帧和当前帧的间隙，保存AB的值
4、在当前帧计算公式——公式用三级流水线来实现（分子分母，商，大括号）

; 2.1 帧延迟并获得AB

always @(posedge clk) begin
    face_vsync_r  face_vsync;
end

获得一帧图像的开始结束标志

assign pos_vsync =  face_vsync && ~face_vsync_r;
assign neg_vsync = ~face_vsync &&  face_vsync_r;

前一帧获得AB
图像流经未开始或者结束的时候，最小像素值255，最大像素值0；当图像流过且像素有效时候，开始进行像素比较，得到一帧图像中的最小最大像素值。

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        max  8'd0;
        min d255;
    end
    else if(Y_vsync && Y_de) begin     //像素有效时
        max  (max > Y_data) ? max : Y_data;
        min  (min < Y_data) ? min : Y_data;
    end
    else if(neg_Y_vsync) begin         //一帧图像结束时
        max  8'd0;
        min d255;
    end
end

2.2 保存AB值

如何确定间隙？
nge_vsnyc高电平处为间隙，此时保存AB值即可。

; 2.3 拉伸公式计算

三级流水线：

第一级流水线：计算分子分母

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        mole  'd0; //分子
        deno d0; //分母
    end
    else begin
        mole  (Y_data - Y_min) * 255;
        deno   Y_max  - Y_min;
    end
end

第二级流水线：分子分母除法计算

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        quot  'd0;
    end
    else begin
        quot  mole / deno;
    end
end

第三级流水线：大括号的计算

always @(posedge clk or negedge rst_n) begin
    if(!rst_n) begin
        hist_data  8'd0;
    end
    else if(Y_data < Y_min) begin
        hist_data d0;
    end
    else if(Y_data > Y_max) begin
        hist_data  8'd255;
    end
    else begin
        hist_data  quot[7:0];
    end
end

需要工程的朋友们部分已发送，可以互相分享，也可以下面链接自行下载：
https://download.csdn.net/download/H19981118/87759032

Original: https://blog.csdn.net/H19981118/article/details/125762837
Author: Fighting_XH
Title: FPGA图像处理学习——基于肤色的人脸识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/631750/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

vs2019配置opencv4.6.0+opencv_contrib4.6.0

在我上一篇博客已经说明怎么安装opencv4.6.0，因为遇到要做图片融合用到surf，orb等特征提取的工具，所以在基础上又加装了opencv_contrib4.6.0。 vs2…

人工智能 2023年6月18日
0090
ubuntu C++ linux安装opencv

文章目录 1安装运行环境 2下载opencv 3cmake * 3.1error -D Should be: VAR:type=value 4make * 4.1 error bo…

人工智能 2023年7月20日
0053
GEE：线性回归

本文记录了GEE中的线性回归函数，并分别以影像集合、多个波段之间的相关性、多个列表数据的相关性为例。文章目录 * – + 一，针对影像集合（ImageCollecti…

人工智能 2023年6月16日
0091
pandas选取excel特定两列，上下行数值相减，降采样，缺失值处理，按数值范围去除行的处理，在pycharm画图实例

import pandas as pd import numpy as np import matplotlib.pyplot as plt def rename_head(df)…

人工智能 2023年7月18日
0082
pandas 学习笔记

pandas中最主要的两个数据结构： Series、 DataFrame Series 一种类似于一维数组的对象，它由一组数据（各种NumPy数据类型）以及一组与之相关的数据标签（…

人工智能 2023年7月7日
0074
深度学习分类任务常用评估指标——总结（重点）

一、分类模型指标 1 准确率和错误率（该指标评价的前提样本分布平衡）准确率和错误率既可用于二分类也可用于多分类：下述公式是准确率、错误率针对二分类情况时候的计算公式 1.1 …

人工智能 2023年7月2日
0086
普通话转粤语_免费音频转文字，好用的录音转文字软件

作为一个单词狗，我很清楚整理录音的痛苦。我把大部分时间都花在整理采访或会议记录的录音上。 [En] As a word dog, I am well aware of the pa…

人工智能 2023年5月27日
0088
000_数码管

普中51单片机的静态数码管模块电路如下图所示：上图电路实际上是动态数码管电路，使用的是 2 个四位一体的共阴数码管组成，即 8 位数码管的段选数据 a-dp 全部并联一起引出，每…

人工智能 2023年6月28日
0081
超值得入手的无线蓝牙耳机，四款性价比最高的蓝牙耳机品牌推荐

面对着如今不少手机厂商开始陆续取消了之前的3.5mm耳机孔后，琳琅满目的无线蓝牙耳机在市场中层出不穷，随着开始取代有线耳机从而走向主流。市场上有着众多不同价格的让人们都无从下手，接…

人工智能 2023年5月25日
0093
tensorflow卷积报错Failed to get convolution algorithm. This is probably because cuDNN failed t

tensorflow卷积报错Failed to get convolution algorithm. This is probably because cuDNN failed t…

人工智能 2023年5月25日
0064
KMeans聚类实例分析（汽车产品聚类分析

天池比赛——汽车产品聚类分析（KMeans+PCA 前言这是天池中一个关于产品聚类分析的比赛，题目给了一个车购买表，整体数据量不大，分析起来比较简单，还是比较有代表性的。目录 …

人工智能 2023年6月19日
00113
图计算-图简介

图大多数的数据结构可以看做是一种图数据结构，包括链表，树等。深入的研究的话可以看下图论图(Graph)就是节点(Vertices/Nodes)以及边(Edge) G = ( V…

人工智能 2023年6月10日
0065
基于深度学习的人脸表情识别实现

1. 前言关于人脸识别，其实我一直以来做过蛮多的项目，有些是整理出帖子了，有些是没有整理出，因为学业比较繁重，所以也是断断续续的来整理。最近刚好是五一假期，也出不去，就想着来整理…

人工智能 2023年6月17日
00119
Python OpenCV 人脸识别

简单运用Python OpenCV对图片进行人脸识别，我们先看效果及代码： import cv2 img1 = cv2.imread(‘6.jpeg’) gray = cv2.c…

人工智能 2023年6月19日
00110
Python学了可以干嘛？到底赚钱吗？这篇文章来告诉你答案

最近几年python越来越火，但很多小伙伴们还不知道python是什么？学习python有什么用？学会之后能做什么？简单地说，python是最简单，最好学，零基础也可以学习的语言。…

人工智能 2023年6月26日
0081
SwinUnet官方代码训练自己数据集

SwinUnet官方代码训练自己数据集训练流程参考（单通道灰度图像的分割）：https://blog.csdn.net/qq_37652891/article/details/12…

人工智能 2023年6月15日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31