基于OpenCV的简易实时手势识别（含代码）

2023年6月18日上午12:42 • 人工智能 • 阅读 99

基于OpenCV的简易实时手势识别

1.基本信息介绍
*
1.1实验步骤
1.2效果展示
2.肤色检测+二值化+开运算+高斯模糊
*
2.1 flip()函数原型
2.2cvtColor()函数原型
2.3split()函数原型
2.4GaussianBlur()函数原型
2.5Code
3.连通空心部分+腐蚀
*
3.1 floodFill()函数原型
3.2 morphologyEx()函数原型
3.3Code
4.多边形拟合曲线
*
4.1approxPolyDP()函数原型
4.2Code
5.凸包检测+重心+ 鼠标操作
*
5.1convexHull()函数原型
5.2moments()函数原型
5.3Mouse_event()函数原型
5.5 Code
6.主函数摄像头调用
*
6.1摄像头调用
6.2 Code
7.代码中的其他API函数
*
7.1 getStructuringElement()函数原型
7.2 findContours()函数原型
7.3 circle()函数原型
7.4 line()函数原型
7.5 namedWindow()函数
7.6 imshow()函数
8.参考文献

1.基本信息介绍

这是我大一寒假时写着玩的，非常简陋。基于凸包检测，所以实际上是计算指尖数量判断1~5的手势。又为1 ~3手势赋了控制鼠标操作的功能（但不能移动鼠标，而且因为手势识别不太准确所以这个功能实现得很废/doge）。（才疏学浅，希望有生之年能写个更好的
版本信息：Visual Studio2015 OpenCV4.1.1
语言：C/C++
（至于为什么不用python，现在当事人也很后悔

1.1实验步骤

（1）图像捕获
直接调用笔记本内置摄像头，使图像绕y轴对称翻转，得到内置（前置）摄像头所拍摄的视频画面的镜像画面，从而得到以操作者为第一视角的正向画面。

（2）肤色检测
先将图像由RGB空间转换至YCrCb空间。
然后将图像成Y（像素的亮度）、Cb（红色分量与亮度的信号差值）、Cr（蓝色分量与亮度的信号差值）三个单通道图像。
再提取Cb、Cr两通道的图像，进行数值判断，满足Cr>133 && Cr

（3）图像预处理
本实验先使用开运算（即先腐蚀后膨胀）对二值化后的手掌图像进行处理，去除图中的小孤立点，消除较小连通域，保留较大连通域，在不明显改变较大连通域面积的同时平滑连通域的边界，是手掌轮廓更明显，为之后的漫水填充做准备。
然后进行高斯滤波，从而消除图像上的高斯噪声。
再通过漫水填充算法，将手掌中因光线角度等因素在肤色检测中缺失的部分填充。
最后图像腐蚀处理漫水填充后的图像，将细小的噪声去除的同时，将图像主要区域的面积缩小。为之后的多边形拟合曲线求得图像近似轮廓做准备。

（4）指尖检测
本实验先用多边形逼近手部轮廓，求得近似轮廓。
再使用凸包检测函数对手部轮廓进一步进行多边形逼近，进而获得一个凸多边形。找到重心位置，通过比较凸包的顶点与重心的y轴坐标，去除纵坐标小于重心纵坐标的顶点，保留纵坐标大于重心的凸包的顶点，再规定凸点间距离范围以消除由同一个指尖产生的多个凸包顶点，得到指尖数量。

（5）模拟鼠标
最后通过得到的指尖数量，控制鼠标操作。
当指尖数量=1时，在图像重心处显示”Left”，同时执行鼠标左键单击功能。
当指尖数量=2时，在图像重心处显示”Double click”，同时执行鼠标左键双击功能。
当指尖数量=3时，在图像重心处显示”Right”，同时执行鼠标右键单击功能。

1.2效果展示

#include
#include
#include
#include
#include
#include

using namespace std;
using namespace cv;

void Introduce()
{
    cout << "\n----------------------------------------------------------------------------";
    cout << "\n功能：以手势代替鼠标进行左右键点击";
    cout << "\n版本信息：Visual Studio2015   OpenCV4.1.1";
    cout << "\n-------------------------------------指令集---------------------------------";
    cout << "\n手势1：单击鼠标左键Left";
    cout << "\n手势2：双击鼠标左键Double click";
    cout << "\n手势3：单击鼠标右键Right";
    cout << "\n----------------------------------------------------------------------------\n";
}

2.肤色检测+二值化+开运算+高斯模糊

2.1 flip()函数原型

本实验通过使图像绕y轴对称翻转，得到内置（前置）摄像头所拍摄的视频画面的镜像画面，从而得到以操作者为第一视角的正向画面。

flip()函数原型
flip(   InputArray      src,
OutputArray dst,
Int             flipCode
)

①src：输入图像。
②dst：输出图像，与src具有相同的大小、数据类型及通道数。
③flipCode：翻转方式标志。数值大于0表示绕y轴翻转；数值等于0表示绕x轴翻转；数值小于0，表示绕两个轴翻转。

2.2cvtColor()函数原型

本实验中肤色检测步骤如下：
①通过颜色模型转换函数cvtColor()函数将图像由RGB空间转换至YCrCb空间。
②通过多通道分离函数split()将图像成Y（像素的亮度）、Cb（红色分量与亮度的信号差值）、Cr（蓝色分量与亮度的信号差值）三个单通道图像。
③提取Cb、Cr两通道的图像，进行数值判断，满足Cr>133 && Cr

cvtColor()函数原型
cvtColor(   InputArray      src,
OutputArray dst,
int     code,
int     dstCn   =0
)

①src：待转换颜色模型的原始图像。
②dst：转换颜色模型后的目标图像。
③code：颜色空间转换的标志。本实验使用的标志参数为。
④dstCn：目标图像中的通道数。若参数为0，则从src和代码中自动导出通道数。本实验中使用默认参数。

2.3split()函数原型

split()函数原型
split(  const       Mat& src,
Mat *       mvbegin
)
split(  InputArray              m,
OutputArrayOfArrays mv
)

①src：待分离的多通道图像。
②mvbegin：分离后的单通道图像，为数组形式，数组大小需要与图像的通道数一致。
③m：待分离的多通道图像。
④mv：分离后的单通道图像，为向量（vector）形式。

2.4GaussianBlur()函数原型

在图像采集的众多过程中都容易引用高斯噪声。高斯滤波器考虑了像素滤波器中心距离的影响，以滤波器中心位置为高斯分布的均值，根据高斯分布公式和每个像素离中心位置的距离计算出滤波器内每个位置的数值，从而形成一个高斯滤波器。在将高斯滤波器与图像之间进行滤波操作，进而实现对图像的高斯滤波。
本实验使用GaussianBlur()函数进行高斯滤波。

GaussianBlur()函数原型
GaussianBlur(   InputArray      src,
OutputArray dst,
Size            ksize,
double          sigmaX,
double          sigmaY=0,
int             borderType=BORDER_DEFAULT（默认参数）
)

①src：待高斯滤波的图像，图像的数据类型必须为CV_8U、CV_16U、CV_16S、CV_32F或CV_64F,通道数目任意。
②dst：输出图像，与src尺寸、通道数、数据类型都相同。
③ksize：高斯滤波器的尺寸。滤波器必须是政奇数。如果尺寸为0，则由标准偏差计算尺寸。
④sigmaX：X轴方向的高斯滤波器标准偏差。
⑤sigmaY：Y轴方向的高斯滤波器标准偏差。如果输入量为0，则将其设置为等于sigmaX；如果两个轴的标准差都为0，则根据输入的高斯滤波器尺寸计算标准偏差。
⑥borderType：像素外推法选择标志。（边界外推方法标志见下表）

方法标志参数简记作用BORDER_CONSTANT0用特定值填充BORDER_REPLICATE1两端复制填充BORDER_REFLECT2倒序填充BORDER_WRAP3正序填充BORDER_REFLECT_1014不包含边界值的倒序填充BORDER_TRANSPARENT5随机填充BORDER_REFLECT1014同BORDER_REFLECT_101BORDER_DEFAULT4同BORDER_DEFAULLTBORDER_ISOLATED16不关心感兴趣区域之外的部

2.5Code


Mat skin(Mat&ImageIn)
{
        Mat Image_y;
        flip(ImageIn, Image_y, 1);
        namedWindow("前置摄像头", WINDOW_NORMAL | WINDOW_KEEPRATIO);imshow("前置摄像头", Image_y);

        Mat Image = Image_y.clone();
        Mat YCrCb_Image;
        cvtColor(Image, YCrCb_Image, COLOR_BGR2YCrCb);
        vector<Mat>Y_Cr_Cb;
        split(YCrCb_Image, Y_Cr_Cb);
        Mat CR = Y_Cr_Cb[1];
        Mat CB = Y_Cr_Cb[2];
        Mat ImageOut = Mat::zeros(Image.size(), CV_8UC1);

        for (int i = 0; i < Image.rows; i++)
        {
            for (int j = 0; j < Image.cols; j++)
            {
                if (CR.at<uchar>(i, j) >= 133 && CR.at<uchar>(i, j)  173 && CB.at<uchar>(i, j) >= 77 && CB.at<uchar>(i, j)  127)
                {
                    ImageOut.at<uchar>(i, j) = 255;
                }
            }
        }

        Mat kernel = getStructuringElement(MORPH_RECT, Size(3, 3));
        morphologyEx(ImageOut, ImageOut, MORPH_OPEN, kernel);
        GaussianBlur(ImageOut, ImageOut, Size(3, 3), 5);

        return ImageOut;
}

3.连通空心部分+腐蚀

3.1 floodFill()函数原型

漫水填充法是根据像素灰度值之间的差值寻找相同区域以实现分割。本实验通过floodFill()函数，将手掌中因光线角度等因素在肤色检测中缺失的部分填充。
漫水填充法主要步骤如下：
①选择种子点。
②以种子为中心，判断4-领域或者8-领域的像素值与中子点像素值的差值，将差值小于阈值的像素点添加进区域内。
③将新加入的像素点作为新的种子点，反复执行第二步，直到没有新的像素点被添加进该区域为止。

floodFill()函数原型
floodFill(  InputOutputArray        image,
InputOutputArray        mask,
Point                   seedPoint,
Scalar                  newVal,
Rect                    *rect=0,
Scalar                  loDiff = Scalar(),
Scalar                  upDiff = Scalar(),
int                     flags = 4
)

①image：输入及输出图像，可以为CV_8U或CV_32F数据类型的单通道或三通道图像。
②mask：掩码矩阵，尺寸比输入图像宽和高各大2的单通道图像，用于标记漫水填充的区域
③seedPoint：种子点，可以为图像范围内任意一点。
④newVal：归入种子点区域内像素点的新像素值，该值会直接作用在原图中。
⑤rect：种子点漫水填充区域的最小矩形边界，默认值为0，表示不输出边界。
⑥loDiff：添加进种子点区域条件的下界差值，当邻域某像素点的像素值域与种子点像素值的差值大于该值时，该像素点被添加进种子所在的区域。
⑦upDiff：添加进种子点区域条件的上界差值，当种子点像素值与邻域某像素点的像素值的差值小于该值时，该像素点被添加进种子点所在的区域。
⑧flags：漫水填充法的操作标志，由3部分构成，分别表示邻域种类、掩码矩阵中被填充像素点的像素值和填充算法的规则，填充算法可选的标志如下表

操作标志参数简记含义FLOODFILL_FIXED_RANGE1<

Original: https://blog.csdn.net/weixin_52205096/article/details/122769732
Author: 全自动学习机器
Title: 基于OpenCV的简易实时手势识别（含代码）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/632884/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Vue】使用单文件组件编写 TodoList

实践内容：1）编写to do list 案例。‍‍ 我们在单文件组件里面写。首先大家对to do list的实现是比较清楚的，结合新的语法‍‍去对语法进行一个巩固，这样的话可能大…

人工智能 2023年6月29日
0090
dataframe, series, list, dictionary, array之间互相转换

Example ; Dataframe Dataframe → Series series_col1 = pd.series print(series_col1) print(ty…

人工智能 2023年7月6日
0080
【OpenCV】基于cv2的图像阈值化处理【超详细的注释和解释】掌握基本操作

说在前面的话 博主今天给大&#x5BB6…

人工智能 2023年7月18日
0072
图像分类算法篇——LeNet-5

LeNet-5为卷积神经网络架构的鼻祖，它是由Yann Lecun于1998年创建，已经被广泛应用于手写体数字识别一、网络架构 LeNet-5架构层类型特征图大小内核大小步幅激…

人工智能 2023年6月20日
00108
吴恩达机器学习课后作业

目录 01-linear regression * 线性回归预备知识单变量线性回归（一个特征值）单变量线性回归（多个特征值）单变量线性回归（正规方程） 01-linea…

人工智能 2023年6月15日
0061
在matlab中使用遗传算法执行最优化

遗传算法是一种通用的最优化方法，具体原理可以看：遗传算法详解与实验。下面记录在Matlab中如何使用遗传算法来做优化。用法调用方式如下： 1 x = ga(fun,nvars)…

人工智能 2023年6月3日
0089
25.人脸关键点检测

目录 1 项目介绍 2 代码实现 2.1 导入库 2.2 定义参数 2.3 定义点位 2.4 定义 shape_to_np() 2.5 定义 visualize_facial_la…

人工智能 2023年7月19日
0063
Github代码复现——SimCLR跑自己的数据集（TensorFlow2）

Github代码复现——自监督学习SimCLR跑自己的数据集（TensorFlow2）代码链接：添加链接描述框架用的是tensorflow2，这里就不详细说明SimCLR的原理…

人工智能 2023年6月16日
0084
如何在conda下创建虚拟环境，以及如何在虚拟环境中安装pytorch

文章目录前言创建conda虚拟环境 * 新建虚拟环境激活虚拟环境删除虚拟环境安装pytorch * 官网查询下载信息在pycharm中添加该虚拟环境总结前言由于一…

人工智能 2023年7月21日
0080
多元统计分析及R语言建模（王斌会）第三第四章答案

3) 要了解学校毕业生起始工资的变化是否能用学生的平均成绩点数(GPA)和毕业时的年龄来解释。表4-7为某学校办公室提供的样本数据。表4-7某学校学生起始工资、GPA及年龄数据 …

人工智能 2023年6月16日
00240
FigDraw 6. SCI 文章绘图之箱线图 (Boxplot)

点击关注，桓峰基因桓峰基因生物信息分析，SCI文章撰写及生物信息基础知识学习：R语言学习，perl基础编程，linux系统命令，Python遇见更好的你 109篇原创内容公众…

人工智能 2023年7月16日
00112
angular项目启动报错

1、angular项目yarn install报错 angular项目安装依赖的时候虽然没有看到红灿灿的报错，但是末尾有这个ERR:其实这是个无关紧要的报错，只不过强迫症的我看了就…

人工智能 2023年6月28日
0066
【Python】Python寻找多维数组（numpy.array）中最大值的位置（行和列）

最近需要从热力图中找出关键点的坐标，也就是极大值的行和列。搜寻了网上的一些方法，在这里总结一下。使用numpy进行多维数组中最大值的行和列搜寻非常的灵活，有以下几种方法可供参考。 …

人工智能 2023年7月4日
0077
毕业设计 : 基于Spark的海量新闻文本聚类 – Spark 新闻分类文本分类新闻聚类

文章目录 0 前言 1 项目介绍 2 实现流程 3 开发环境 4 java目录功能介绍 5 scala目录功能介绍 * 5.1 求TF-IDF 5.2 调用K-means模型 5….

人工智能 2023年5月31日
0080
Pandas pd.merge 函数使用交集、并集、左连接、右连接

取交集：print(pd.merge(df1,df2,on=[‘name’, ‘age’, ‘sex’])) 取并集：print(pd.merge(df1,df2,on=[‘nam…

人工智能 2023年7月15日
0082
ARIMA差分自回归移动平均模型–时间序列预测

ARIMA差分自回归移动平均模型 1、ARIMA模型理论基础 2、ARIMA建模步骤 3、ARIMA建模实战 * 3.1 导入模块 3.2 加载数据 3.3 平稳性检验 3.4 单…

人工智能 2023年6月15日
0052

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31