【MediaPipe】(1) AI视觉，手部关键点实时跟踪，附python完整代码

2023年7月12日下午2:46 • 人工智能 • 阅读 82

各位同学好，今天和大家分享一下如何使用 MediaPipe完成手部关键点实时检测跟踪。先放张图看效果， 15代表FPS值。

【MediaPipe】(1) AI视觉，手部关键点实时跟踪，附python完整代码

1. 导入工具包

安装opencv
pip install opencv-contrib-python
安装mediapipe
pip install mediapipe
pip install mediapipe --user  #有user报错的话试试这个

安装之后导入各个包
import cv2  #opencv
import mediapipe as mp
import time

MediaPipe 是一款由 Google Research 开发并开源的多媒体机器学习模型应用框架。它能够完成 人脸识别，虹膜检测，体态跟踪等。今天我们介绍一下手部关键点检测，剩下的后续章节讲述，感兴趣的点个关注呦。

2. 显示手部关键点及连线

2.1 相关函数解释

（1） cv2.VideoCapture(0)获取电脑自带的摄像头，修改参数1代表外接摄像头

（2） mediapipe.solutions.hands.Hands()手部关键点检测方法

参数：

static_image_mode：默认为 False，将输入图像视为视频流。它将尝试在第一个输入图像中检测手，并在成功检测后进一步定位手的坐标。在随后的图像中，一旦检测到所有 max_num_hands 手并定位了相应的手的坐标，它就会跟踪这些坐标，而不会调用另一个检测，直到它失去对任何一只手的跟踪。这减少了延迟，非常适合处理视频帧。如果设置为 True，则在每个输入图像上运行手部检测，用于处理一批静态的、可能不相关的图像。

max_num_hands：最多检测几只手， 默认为2

min_detection_confidence：手部检测模型的最小置信值（0-1之间），超过阈值则检测成功。 默认为 0.5

min_tracking_confidence：坐标跟踪模型的最小置信值 (0-1之间)，用于将手部坐标视为成功跟踪，不成功则在下一个输入图像上自动调用手部检测。将其设置为更高的值可以提高解决方案的稳健性，但代价是更高的延迟。如果 static_image_mode 为真，则忽略这个参数，手部检测将在每个图像上运行。 默认为 0.5

返回值：

MULTI_HAND_LANDMARKS：被检测/跟踪的手的集合，其中每只手被表示为21个手部地标的列表，每个地标由x, y, z组成。 x和y分别由图像的宽度和高度归一化为[0,1]。Z表示地标深度。

MULTI_HANDEDNESS：被检测/追踪的手是左手还是右手的集合。每只手由 label(标签)和 score(分数)组成。 label 是 ‘Left’ 或 ‘Right’ 值的字符串。 score 是预测左右手的估计概率。

（3） mediapipe.solutions.drawing_utils.draw_landmarks()绘制手部关键点的连线

参数：

image：需要画图的原始图片

landmark_list：检测到的手部关键点坐标

connections：连接线，需要把那些坐标连接起来

landmark_drawing_spec：坐标的颜色，粗细

connection_drawing_spec：连接线的粗细，颜色等

（4）手部标记点如图所示

2.2 只绘制手部关键点和连线

由于读入视频图像通道一般为RGB，而opencv中图像通道的格式为BGR，因此需要 cv2.cvtColor()函数 将opencv读入的视频图像转为RGB格式。 results中存放每个关键点的 xyz坐标，通过 .multi_hand_landmarks读取出来。

#（1）视频捕获
cap = cv2.VideoCapture(0)  # 0代表电脑自带的摄像头

#（2）创建检测手部关键点的方法
mpHands = mp.solutions.hands  #接收方法
hands = mpHands.Hands(static_image_mode=False, #静态追踪，低于0.5置信度会再一次跟踪
                      max_num_hands=2, # 最多有2只手
                      min_detection_confidence=0.5, # 最小检测置信度
                      min_tracking_confidence=0.5)  # 最小跟踪置信度

创建检测手部关键点和关键点之间连线的方法
mpDraw = mp.solutions.drawing_utils

查看时间
pTime = 0 #处理一张图像前的时间
cTime = 0 #一张图处理完的时间

#（3）处理视频图像
while True:  # 对每一帧视频图像处理

    # 返回是否读取成功和读取的图像
    success, img = cap.read()

    # 在循环中发送rgb图像到hands中，opencv中图像默认是BGR格式
    imgRGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    # 把图像传入检测模型，提取信息
    results = hands.process(imgRGB)

    # 检查是否检测到什么东西了，没有检测到手就返回None
    # print(results.multi_hand_landmarks)

    # 检查每帧图像是否有多只手，一一提取它们
    if results.multi_hand_landmarks: #如果没有手就是None
        for handlms in results.multi_hand_landmarks:

            # 绘制每只手的关键点
            mpDraw.draw_landmarks(img, handlms, mpHands.HAND_CONNECTIONS) #传入想要绘图画板img，单只手的信息handlms
            # mpHands.HAND_CONNECTIONS绘制手部关键点之间的连线

    # 记录执行时间
    cTime = time.time()
    # 计算fps
    fps = 1/(cTime-pTime)
    # 重置起始时间
    pTime = cTime

    # 把fps显示在窗口上；img画板；取整的fps值；显示位置的坐标；设置字体；字体比例；颜色；厚度
    cv2.putText(img, str(int(fps)), (10,70), cv2.FONT_HERSHEY_PLAIN, 3, (255,0,0), 3)

    # 显示图像
    cv2.imshow('Image', img)  #窗口名，图像变量
    if cv2.waitKey(1) & 0xFF==27:  #每帧滞留1毫秒后消失；ESC键退出
        break

释放视频资源
cap.release()
cv2.destroyAllWindows()

这里设置了最大可识别2只手，如果有需要可通过 result .multi_handedness，分别处理左右手的坐标。

3. 编辑关键点坐标，更改显示图像

上面我们通过 results.multi_hand_landmarks得到的 xyz坐标是归一化后的 比例坐标，即某一像素点在图像的某一比例位置[0.5, 0.5]。我们需要将其转为 像素坐标，如[200,200]，像素坐标一定是整数。通过 图像宽度乘以比例即可得到像素长度。为了能更明显的显示关键点，把关键点画的大一些，只需 以关键点的像素坐标为圆心画圆 cv2.circle()即可。

因此我们在上面的代码中补充

#（1）视频捕获
cap = cv2.VideoCapture(0)  # 0代表电脑自带的摄像头

#（2）创建检测手部关键点的方法
mpHands = mp.solutions.hands  #接收方法
hands = mpHands.Hands(static_image_mode=False, #静态追踪，低于0.5置信度会再一次跟踪
                      max_num_hands=2, # 最多有2只手
                      min_detection_confidence=0.5, # 最小检测置信度
                      min_tracking_confidence=0.5)  # 最小跟踪置信度

创建检测手部关键点和关键点之间连线的方法
mpDraw = mp.solutions.drawing_utils

查看时间
pTime = 0 #处理一张图像前的时间
cTime = 0 #一张图处理完的时间

存放坐标信息
lmList = []

#（3）处理视频图像
文件设为True，对每一帧视频图像处理
while True:

    # 返回是否读取成功和读取的图像
    success, img = cap.read()

    # 在循环中发送rgb图像到hands中，opencv中图像默认是BGR格式
    imgRGB = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    # 把图像传入检测模型，提取信息
    results = hands.process(imgRGB)

    # 检查每帧图像是否有多只手，一一提取它们
    if results.multi_hand_landmarks: #如果没有手就是None
        for handlms in results.multi_hand_landmarks:

            # 获取每个关键点的索引和坐标
            for index, lm in enumerate(handlms.landmark):

                # 索引为0代表手底部中间部位，为4代表手指关键或指尖
                # print(index, lm)  # 输出21个手部关键点的xyz坐标(0-1之间)，是相对于图像的长宽比例
                # 只需使用x和y查找位置信息

                # 将xy的比例坐标转换成像素坐标
                h, w, c = img.shape # 分别存放图像长\宽\通道数

                # 中心坐标(小数)，必须转换成整数(像素坐标)
                cx ,cy =  int(lm.x * w), int(lm.y * h) #比例坐标x乘以宽度得像素坐标

                # 打印显示21个关键点的像素坐标
                print(index, cx, cy)

                # 存储坐标信息
                lmList.append([index, cx, cy])

                # 在21个关键点上换个圈，img画板，坐标(cx,cy)，半径5，蓝色填充
                cv2.circle(img, (cx,cy), 12, (0,0,255), cv2.FILLED)

            # 绘制每只手的关键点
            mpDraw.draw_landmarks(img, handlms, mpHands.HAND_CONNECTIONS) #传入想要绘图画板img，单只手的信息handlms
            # mpHands.HAND_CONNECTIONS绘制手部关键点之间的连线

    # 记录执行时间
    cTime = time.time()
    # 计算fps
    fps = 1/(cTime-pTime)
    # 重置起始时间
    pTime = cTime

    # 把fps显示在窗口上；img画板；取整的fps值；显示位置的坐标；设置字体；字体比例；颜色；厚度
    cv2.putText(img, str(int(fps)), (10,70), cv2.FONT_HERSHEY_PLAIN, 3, (255,0,0), 3)

    # 显示图像
    cv2.imshow('Image', img)  #窗口名，图像变量
    if cv2.waitKey(1) & 0xFF==27:  #每帧滞留1毫秒后消失
        break

释放视频资源
cap.release()
cv2.destroyAllWindows()

得到的结果如下，fps=19，右下输出框中打印每帧图像的21个手部关键点xy坐标，并保存在列表中。

Original: https://blog.csdn.net/dgvv4/article/details/122023047
Author: 立Sir
Title: 【MediaPipe】(1) AI视觉，手部关键点实时跟踪，附python完整代码

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/687836/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Anaconda3+Python3.8搭建Tensorflow（包括踩到的坑

安装tensorflow CPU版本 1.在 Windows 下打开 Anaconda Prompt2.输入清华仓库镜像，这样更新会快一些： conda config –add …

人工智能 2023年5月23日
0096
pytorch实现GAN网络及训练自己的数据集

文章目录前言一、GAN网络介绍二、网络训练三、代码解析附录总结前言前不久在一个项目里面用GAN网络做了一下数据增强，目的就是通过给定的真实图片，得到一些模拟的假图片…

人工智能 2023年6月16日
0089
如何优雅的抢占别人的显卡？

人工智能 2023年5月26日
00108
使用Python将DOTA数据集的格式转换成VOC2007数据集的格式

一、VOC2007数据集二、DOTA数据集三、将DOTA数据集的格式转换成VOC2007数据集的格式一、VOC2007数据集 VOC2007数据集的文件结构如下图所示。其中…

人工智能 2023年7月4日
00101
YOLO系列学习

目录很不错的链接 0 一些小知识 * 0.1 先验框 anchor box 0.2 网络结构图 1 YOLOv1学习 * 2 YOLOv2学习很不错的链接还有一些在【yolo…

人工智能 2023年7月10日
00124
良/恶性乳腺肿瘤预测(逻辑回归分类器)

乳腺肿瘤预测案例：良/恶性乳腺肿瘤预测 * 1.1 简介 1.2 代码 – 1.2.1 导入数据集 1.2.2 浏览数据的基本信息 1.2.3 查看数据的基本统计信息…

人工智能 2023年7月2日
0084
【二维装箱】基于matlab遗传算法求解矩形地块二维装箱放置优化问题【含Matlab源码 1556期】

⛄一、获取代码方式获取代码方式1：完整代码已上传我的资源：【二维装箱】基于matlab遗传算法求解矩形地块二维装箱放置优化问题【含Matlab源码 1556期】点击上面蓝色字体…

人工智能 2023年6月21日
0071
循环神经网络详解(RNN原理和实现代码)

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月13日
0060
小程序中如何访问mysql数据库

目录 1 开通云上的mysql 2 创建自定义连接器 3 创建云函数 4 安装依赖 5 出参映射 6 在小程序中使用连接器总结日常我们在开发小程序的时候，总是希望把数据提交回数…

人工智能 2023年5月30日
00107
基于PCL的RANSAC地面提取和超体素分割

基于PCL的RANSAC地面提取和超体素分割摘要（一）利用RANSAC算法将桌子的背景提取（即地面分割）（二）对地面分割后的桌子进行超体素分割源码链接 https://gi…

人工智能 2023年6月10日
0073
OpenCV综合练习2——扑克牌(文本)校正

图像处理综合练习2——多角度扑克牌校正这是我刚开始学习图像处理时在B站上所接触的一个文本校正小练习，但是视频中的场景角度单一，只能校正固定视角下的文本，相对简单，但对于初学者来说…

人工智能 2023年6月22日
00150
mmdetection中数据增强的可视化

一、PhotoMetricDistortion 函数介绍： class PhotoMetricDistortion: """Apply photome…

人工智能 2023年6月25日
0077
PyTorch深度学习实践——多分类问题

多分类问题多分类问题 Softmax 在Minist数据集上实现多分类问题作业课程来源：PyTorch深度学习实践——河北工业大学《PyTorch深度学习实践》完结合集_哔…

人工智能 2023年6月4日
0096
图像视频去噪论文Learning Deformable Kernels for Image and Video Denoising阅读笔记

论文链接：1904.06903.pdf (arxiv.org) 论文来源：TIP2020 作者：商汤 Abstract 大多数经典的去噪方法都是通过选择和平均噪声输入中的像素来恢复…

人工智能 2023年5月30日
0081
Windows图像标注软件安装与使用（Vott、labelImg、labelme）

目录前言一、计算机视觉四大任务？二、常用标注软件 1.vott 1.2.入门基本使用 2.labelImg 2.1.下载与安装 2.2.入门基本使用 3.labe…

人工智能 2023年7月10日
00139
随机森林算法（Random Forest）Python实现

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月16日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31