人体关键点检测（Keypoints Detection）

2023年5月26日上午6:57 • 人工智能 • 阅读 200

1.综述

Pytorch的 torchvision库中有关键点检测的模型keypointrcnn_resnet50_fpn()网络模型，其可以对17个人体关键点进行检测。
17个关键点包括：
鼻子，左眼，右眼，左耳，右耳，左肩，右肩，左胳膊肘，右胳膊肘，左手腕，右手腕，左臀，右臀，左膝，右膝，左脚踝，右脚踝
nose，left_eye, right_eye, left_ear, right_ear,
left_shoulder, right_shoulder, left_elbow, right_elbow,
left_wrist, right_wrist,left_hip, right_hip
left_knee, right_knee, left_ankle, right_ankle.

我们用COCO数据集测试如下：
原始图片：

人体关键点检测后的图片：
人体关键点检测（Keypoints Detection）

目标检测结果用蓝框框表示，表明目标检测为人的概率为1.0。然后17个关键点都可见且用红点表示出来。旁边是红点的编号，从1~17。

; 2. 单张图片检测代码如下：


import numpy as np
import torchvision
import torch
import torchvision.transforms as transforms
from PIL import Image, ImageDraw, ImageFont
import matplotlib.pyplot as plt

"""
    fire hydrant 消防栓，stop sign 停车标志， parking meter 停车收费器， bench 长椅。
    zebra 斑马， giraffe 长颈鹿， handbag 手提包， suitcase 手提箱， frisbee （游戏用）飞盘（flying disc）。
    skis 滑雪板（ski的复数），snowboard 滑雪板（ski是单板滑雪，snowboarding 是双板滑雪。）
    kite 风筝， baseball bat 棒球棍， baseball glove 棒球手套， skateboard 滑板， surfboard 冲浪板， tennis racket 网球拍。
    broccoli 西蓝花，donut甜甜圈，炸面圈(doughnut，空心的油炸面包), cake 蛋糕、饼, couch 长沙发（靠chi)。
    potted plant 盆栽植物。 dining table 餐桌。 laptop 笔记本电脑，remote 遥控器(=remote control),
    cell phone 移动电话(=mobile phone)(cellular 细胞的、蜂窝状的)， oven 烤炉、烤箱。 toaster 烤面包器（toast 烤面包片）
    sink 洗碗池, refrigerator 冰箱。（=fridge）， scissor剪刀(see, zer), teddy bear 泰迪熊。 hair drier 吹风机。
    toothbrush 牙刷。
"""
COCO_INSTANCE_CATEGORY_NAMES = [
    '__BACKGROUND__', 'person', 'bicycle', 'car', 'motorcycle',
    'airplane', 'bus', 'train', 'trunk', 'boat', 'traffic light',
    'fire hydrant', 'N/A', 'stop sign', 'parking meter', 'bench',
    'bird', 'cat', 'dog', 'horse', 'sheep', 'cow', 'elephant',
    'bear', 'zebra', 'giraffe', 'N/A', 'backpack', 'umbrella', 'N/A',
    'N/A', 'handbag', 'tie', 'suitcase', 'frisbee', 'skis', 'snowboard',
    'sports ball', 'kite', 'baseball bat', 'baseball glove', 'skateboard',
    'surfboard', 'tennis racket', 'bottle', 'N/A', 'wine glass',
    'cup', 'fork', 'knife', 'spoon', 'bowl', 'banana', 'apple',
    'sandwich', 'orange', 'broccoli', 'carrot', 'hot dog', 'pizza',
    'donut', 'cake', 'chair', 'couch', 'potted plant', 'bed', 'N/A',
    'dining table', 'N/A', 'N/A', 'toilet', 'N/A', 'tv', 'laptop',
    'mouse', 'remote', 'keyboard', 'cell phone', 'microwave', 'oven',
    'toaster', 'toaster', 'sink', 'refrigerator', 'N/A', 'book', 'clock',
    'vase', 'scissors', 'teddy bear', 'hair drier', 'toothbrush'
]

"""
    elbow 胳膊肘，wrist 手腕，hip 臀部
"""
COCO_PERSON_KEYPOINT_NAMES = ['nose', 'left_eye', 'right_eye', 'left_ear',
                              'right_ear', 'left_shoulder', 'right_shoulder', 'left_elbow',
                              'right_elbow', 'left_wrist', 'right_wrist', 'left_hip', 'right_hip',
                              'left_knee', 'right_knee', 'left_ankle', 'right_ankle']

model = torchvision.models.detection.keypointrcnn_resnet50_fpn(pretrained=True)
model.eval()

def Object_Detect(model, image_path, COCO_INSTANCE_CATEGORY_NAMES, threshold=0.5):

    image = Image.open(image_path)
    transform_d = transforms.Compose([transforms.ToTensor()])
    image_t = transform_d(image)
    print(image_t.shape)
    pred = model([image_t])
    print(pred)

    pred_class = [COCO_INSTANCE_CATEGORY_NAMES[ii] for ii in list(pred[0]['labels'].numpy())]
    pred_score = list(pred[0]['scores'].detach().numpy())

    pred_boxes = [[ii[0], ii[1], ii[2], ii[3]] for ii in list(pred[0]['boxes'].detach().numpy())]

    pred_index = [pred_score.index(x) for x in pred_score if x > 0.5]

    fontsize = np.int16(image.size[1] / 20)
    font1 = ImageFont.truetype("/usr/share/fonts/gnu-free/FreeMono.ttf", fontsize)

    draw = ImageDraw.Draw(image)
    for index in pred_index:
        box = pred_boxes[index]
        draw.rectangle(box, outline="blue")
        texts = pred_class[index]+":"+str(np.round(pred_score[index], 2))
        draw.text((box[0], box[1]), texts, fill="blue", font=font1)

    pred_keypoint = pred[0]["keypoints"]

    pred_keypoint = pred_keypoint[pred_index].detach().numpy()

    fontsize = np.int16(image.size[1] / 50)
    r = np.int16(image.size[1] / 150)
    font1 = ImageFont.truetype("/usr/share/fonts/gnu-free/FreeMono.ttf", fontsize)

    image3 = image.copy()
    draw = ImageDraw.Draw(image3)

    for index in range(pred_keypoint.shape[0]):

        keypoints = pred_keypoint[index]
        for ii in range(keypoints.shape[0]):
            x = keypoints[ii, 0]
            y = keypoints[ii, 1]
            visi =keypoints[ii, 2]
            if visi > 0:
                draw.ellipse(xy=(x-r, y-r, x+r, y+r), fill=(255, 0, 0))
                texts = str(ii+1)
                draw.text((x+r, y-r), texts, fill="red", font=font1)

    return image3

if __name__ == '__main__':
    image_path = "/mnt/COCO2017/val2017/000000000785.jpg"
    image = Object_Detect(model, image_path, COCO_INSTANCE_CATEGORY_NAMES)
    plt.imshow(image)
    plt.axis("off")

    plt.savefig('./skiing woman.png', bbox_inches='tight', pad_inches=0.0)
    plt.show()

识别多张图片代码如下：

4.放图（出自COCO2017数据集）

; 5.参考资料

《PyTorch深度学习入门与实战》孙玉林等著。

Original: https://blog.csdn.net/csdnliwenqi/article/details/121694973
Author: 爱学习的大白菜
Title: 人体关键点检测（Keypoints Detection）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/518509/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

分类问题——逻辑回归与XGBoost

逻辑回归初学逻辑回归的时候就只是简单地认为sigmoid函数可以把线性函数映射到(0，1)的区间上，因此选用了sigmoid模型作为逻辑回归的模型函数。其实是学的太简单了，直到…

人工智能 2023年7月3日
0068
以最易懂的人话讲分类和聚类算法（建议分享和收藏）

以最易懂的人话讲分类和聚类算法（建议分享）今天在使用聚类方法进行客户价值分析时遇到了个问题，将我卡住了半个小时，实际上现在想来是一个很简单的问题，但是大家都知道，一个人脑子短路时…

人工智能 2023年7月2日
0099
【附源码和详细的公式推导】Minimum Snap轨迹生成，闭式求解Minimum Snap问题，机器人轨迹优化，多项式轨迹路径生成与优化

该篇博客内容较多，工作量也很大，难免在理解上表达上有错误，如有发现烦请指教。如有问题在博客中留言，或者github的仓库中提Issues都行，看到后我会尽快回复。 Minimum …

人工智能 2023年6月1日
0073
边缘检测算法

边缘检测边缘是图像最基本的特征，所谓边缘就是指周围灰度强度有反差变化的那些像素的集合，是图像分割所依赖的重要基础，也是纹理分析和图像识别的重要基础。理想的边缘检测应当正确解决边缘…

人工智能 2023年7月27日
0076
python实现DBSCAN聚类

该博客配套代码、数据及PPT见百度网盘链接：https://pan.baidu.com/s/1j1iWnhXmQiAnQ7VnfsCIrQ提取码：6666 算法实战数据为31个…

人工智能 2023年5月31日
0082
python speech模块的使用方法

在 python中我们可以使用 speech模块让计算机进行语音输出，我们需要使用如下代码安装该模块。对于如何在终端中安装python相应模块， Pycharm编译器可以使用 Wi…

人工智能 2023年5月27日
0087
Ubuntu 20.04安装CUDA 11.0、cuDNN 8.0.5、PyTorch 1.7.0

转载请注明出处 BooTurbo https://www.cnblogs.com/booturbo/p/13960935.html 因为电脑漏洞的缘故，前几天将Ubuntu18.0…

人工智能 2023年6月4日
00128
机器学习笔记 – Albumentations库实现的图像增强功能一览

一、Albumentations库简介 Albumentations库致力于用更少的数据做更多的事情。 Albumentations 是一种计算机视觉工具，可以提高深度卷积神经网络…

人工智能 2023年6月16日
0087
一个超强 Android 进阶路线知识图谱

早上好，我是 AndroidGuider，公众号「 Android 指南」专注于推荐 GitHub 上 Android 有用有趣的项目，挖掘开源的价值，欢迎关注。今天推荐一个非常…

人工智能 2023年6月1日
0072
004-定时器的使用

实现定时器的使用定时器的使用功能：实现定时器的使用方案一： #include<reg52.h> sbit LED = P2^0; void main() { un…

人工智能 2023年6月6日
0063
anaconda使用虚拟环境安装pytorch1.13+cuda11.7版（2022.11月测试有效）

要点：修改conda的源，用清华源，具体修改方法详见主要是要创建一个.condarc文件，内容改为下面这样的国内源。 ssl_verify: true channels: – …

人工智能 2023年6月30日
0077
web网页设计期末课程大作业——HTML+CSS+JavaScript美食餐饮文化主题网站设计与实现

👨‍🎓静态网站的编写主要是用HTML DIV+CSS JS等来完成页面的排版设计👩‍🎓,常用的网页设计软件有Dreamweaver、EditPlus、HBuilderX、VScod…

人工智能 2023年6月27日
0079
2022数学建模国赛C题——古代玻璃制品的成分分析与鉴别——最新全部——分析思路与代码

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月27日
0079
pytorch训练卷积神经网络进行图片分类(官方教程详细解读)

pytorch训练卷积神经网络进行图片分类(官方教程详细解读) 文章主要内容 [官方文档]对pytorch针对CIFAR10数据集进行图片分类代码的解读，旨在对每一行代码的作用进行…

人工智能 2023年7月3日
0074
《机器学习实战》——第9章树回归

第8章介绍的线性回归包含了一些强大的方法，但这些方法创建的模型需要拟合所有的样本点（局部加权线性回归除外）。当数据拥有众多特征并且特征之间关系十分复杂时，构建全局模型的想法就显得太…

人工智能 2023年6月18日
0090
猿创征文｜深度学习基于ResNet18网络完成图像分类

一．前言本次任务是利用ResNet18网络实践更通用的图像分类任务。 ResNet系列网络，图像分类领域的知名算法，经久不衰，历久弥新，直到今天依旧具有广泛的研究意义和应用场景。…

人工智能 2023年7月28日
0069

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

人体关键点检测（Keypoints Detection）

大家都在看