人体骨骼关键点检测的算法

2023年7月21日上午6:49 • 人工智能 • 阅读 64

文章目录

老铁们✌，重要通知🙌！福利来了！！！😉
1.相关算法
*
1.1 AlphaPose
1.2 pytorch-openpose
1.3 PoseC3D
1.4 ST-GCN
1.5 MobilePose
2.动作比对
3.姿态估计 vs 行为识别
*
3.1 姿态估计
3.2 行为识别
4.数据集
*
4.1 MSR 3d action
4.2 UCF-101
5.标注工具
6.实战项目
*
6.1 站立、走路、跌倒行为识别
6.2 基于PyTorch实现C3D模型的视频行为识别
7.部署

老铁们✌，重要通知🙌！福利来了！！！😉

【计算机视觉复习流程剖析及面试题详解】
【深度学习算法最全面面试题（30 页）】
【机器学习算法最全面面试题（61页）】

1.相关算法

1.1 AlphaPose

属于 自上而下的算法，也就是 先检测倒人体， 再得到关键点和骨架。
优点：它被遮挡部分的关键点不会任意获取(即可以只显示看得到的部分)
它的 准确率、 AP值要比openpose高。
缺点: 随着图片上的人数增加，他的计算量增大，速度变慢。
可实时全身多人姿势估计与跟踪系统
https://github.com/MVIG-SJTU/AlphaPose.git

git clone -b pytorch https:
python demo.py --indir examples/demo --outdir examples/res --sp
python video_demo.py --video D:/cpl.mp4 --outdir examples/result --save_video --sp
python webcam_demo.py --webcam 0 --outdir examples/result --vis

1.2 pytorch-openpose

手和身体姿势估计, 基于Openpose的pytorch实现：
https://github.com/Hzzone/pytorch-openpose

; 1.3 PoseC3D

基于 3D-CNN 的 骨骼行为识别框架，同时具备良好的识别精度与效率，在包含 FineGYM, NTURGB+D, Kinetics-skeleton 等多个骨骼行为数据集上达到了 SOTA。不同于传统的基于人体 3 维骨架的 GCN 方法，PoseC3D 仅使用 2 维人体骨架热图堆叠作为输入，就能达到更好的识别效果。
https://github.com/open-mmlab/mmaction2(刚刚开源)
https://zhuanlan.zhihu.com/p/395588459

; 1.4 ST-GCN

基于动态骨骼的动作识别方法ST-GCN（时空图卷积网络模型）
https://github.com/yysijie/st-gcn

1.5 MobilePose

作为 轻量级网络来识别 人体关键点，适用于： 单人姿态估计。
源码里面包括ResNet18、MobileNetV2、ShuffleNetV2、SqueezeNet1.1几个轻量级的网络。
官方是直接对摄像头进行裁剪，只有中间一部分，（放得下一个人的位置）。而且即使没有框住人，也会生成骨架信息。

https://github.com/YuliangXiu/MobilePose-pytorch

; 2.动作比对

人体的不同特征部位可抽象为 18个特征点，由这些特征点组成的人体骨架即可反映此刻人体的姿态。
而特定关节间的 角度值可以为判断一个人动作的准确性提供参考。
技术思路：
对标准动作图片进行处理，得出该图片人体骨架的关节角度值，作为比对范本。之后输入需要进行评判的训练者动作图片，同样得出关节角度值。
将 两者角度值进行分析即可得出训练者动作是否标准，达到动作比对的效果。
方法：两点之间的长度可以通过计算 欧氏距离得出，再使用 余弦定理计算得出反映人体动作的特定关节间夹角的角度值。

其他文章：
基于计算机视觉深度学习算法的姿态评估打分方法和系统与流程

3.姿态估计 vs 行为识别

3.1 姿态估计

理解：在图像和视频中对人体 关节的定位问题。
姿态估计的任务：重建人的关节和肢干，其难点：降低模型分析算法的复杂程度，并能够适应各种多变的情况、环境。
姿态估计的输出：是一个 高维的姿态向量，而不是某个类别的类标；需要学习的是一个从高维观测向量到高维姿态向量的映射。

; 3.2 行为识别

可借助姿态估计的相关研究成果来实现，比如 HDM05这类姿态库就提供了每一帧视频中人的骨架信息，可以基于 骨架信息判断运动类型。

4.数据集

4.1 MSR 3d action

记录了人体动作序列，共包含20个动作类型，10个被试者，每个被试者执行每个动作2或3次。
采用 Kinect 提取动作数据
https://zhuanlan.zhihu.com/p/63133269

人体姿态识别这9个数据集：
HiEve、MPII Human Pose、CrowdPose、Human3.6M、
PedX、SURREAL、Mo2Cap2、DensePose、PoseTrack
https://zhuanlan.zhihu.com/p/392326330

4.2 UCF-101

该数据集上评测指标已经达到了98.5%，但是视频的分类目前远没有图像分类成熟，面临着巨大的 类内方差，相机运动和背景干扰，数据不足等难题。
解决方向：
1. 多模态信息融合。即不只是采用图像信息，还可以融合语音等信息。
2. 多标签视频分类。与多标签图像分类类似，现实生活中的视频可能有多个标签。
3. 行为定位。一段视频中的行为有开始和结束，如何定位到真正有效的片段是之后的视频分类的重要前提。

**打分对比：
https://github.com/ParitoshParmar/MTL-AQA

参考：
40个姿态估计优秀开源项目汇总
 姿态估计与行为识别（行为检测、行为分类）的区别

5.标注工具

最常用深度学习图像/视频数据标注工具：
LabelImg、 Labelme
https://blog.csdn.net/weixin_39737947/article/details/111619277

VOTT
标记图像或视频帧的工具。
Download地址：
https://github.com/Microsoft/VoTT/releases
每帧图片添加bbox的转化code: main.py

6.实战项目

6.1 站立、走路、跌倒行为识别

技术分析： yoloV3进行人的侦测，再用SPPE（ Alphapose）进行骨架提取，再用连续30帧的 ST-GCN进行行为识别。
https://github.com/GajuuzZ/Human-Falling-Detect-Tracks

6.2 基于PyTorch实现C3D模型的视频行为识别

代码：
E:\Project\C3D_recogn
https://github.com/Niki173/C3D
数据集： UCF-101 下载地址
使用教程： https://zhuanlan.zhihu.com/p/348402763
博客： https://blog.csdn.net/sinat_28371057/article/details/113405431
备注：有 预训练模型
2D卷积网络输入图像会产生图像，输入视频输出的也是图像；
3D卷积网络输入视频会输出另外一个视频， 保留输入的时间信息。

; 7.部署

基于 TensorFlow lite 在移动端部署模型：
https://zhuanlan.zhihu.com/p/111616352

基于TensorFlow lite部署的 API:
https://tensorflow.google.cn/lite/examples?hl=zh-cn
课件：https://edu.51cto.com/course/23363.html

Original: https://blog.csdn.net/cc13186851239/article/details/120678967
Author: cc13186851239
Title: 人体骨骼关键点检测的算法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/706549/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图神经网络框架-PyTorch Geometric(PyG)的使用及踩坑

PyG(PyTorch Geometric)是一个基于PyTorch的图神经网络框架，建议先了解PyTorch的使用再学习PyG,要不然看不懂。本文内容角度，喜欢本文点赞支持、欢迎…

人工智能 2023年5月27日
0076
白学立体视觉（1）: 双目视觉

文章目录前言什么是双目视觉？双目视觉的应用总结前言小伙伴们，大家好，以前学习了新的知识，一段时间之后便忘得差不多了，经常被他人嘲讽：你真是白学xxx了！。是啊，我确实…

人工智能 2023年5月26日
0049
Collaborativ

详细解决Collaborative Filtering问题 Collaborative Filtering是一种常见的推荐系统算法，用于根据用户的历史行为和其他用户的行为模式来预测…

人工智能 2024年1月2日
0057
什么是竞争风险模型（Competing Risk Model）、为什么选用竞争风险模型?为什么会高估风险？cmprsk包进行竞争风险分析、regplot包的regplot函数可视化回归模型的列线图

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
0084
TPH-YOLOv5: Improved YOLOv5 Based on Transformer Prediction Head for Object Detection on Drone-captu

### 回答1： tph– yolov5_是一种基于 _Transform er_预测头的改进版 _yolov5，用于在无人机捕捉场景中进行目标检测。它采用了 Tran…

人工智能 2023年7月10日
0086
目标检测概述

目录目标检测概述 * 目标检测常用的开源数据集 – PASCAL VOC数据集 MS COCO数据集常用的评价指标 – IOU mAP（Mean Av…

人工智能 2023年7月2日
0091
【Transformer学习笔记】DETR：将transformer引入目标检测领域

之前我们有讲过如何将transformer引入CV领域，想去看看的同学可以点击这里：【Transformer学习笔记】VIT解析 VIT论文中最后的实验解决的是一个多分类任务。那…

人工智能 2023年7月10日
0063
a律13折线pcm编码例题_PCM的A律13折线编码

PCM 折线编码( G.711 ITU-T .711 是第一个发布的语音编码标准( [En] Is the first published speech coding standa…

人工智能 2023年5月27日
0095
OpenCV——Sobel边缘检测

目录一、Sobel算法 * 1、算法概述 2、主要函数二、C++代码三、python代码四、结果展示 * 1、灰度图 2、X方向一阶边缘 2、Y方向一阶边缘 3、整幅图像的…

人工智能 2023年7月5日
0073
手把手教你语音识别（三）

朋友们，手拉手语音识别的第三部分就要来了，这部分开始讲解网络建设的部分，也是手把手教大家哦，千万不要错过。 [En] Friends, the third part of hand…

人工智能 2023年5月25日
0083
python 实验七字典与集合（上）

1.莫尔斯电码是一种早期的数字化通信形式，它通过”·”和”-“的不同排列顺序来表示不同的英文字母、数字以及标点符号。试编写程序，使用…

人工智能 2023年7月5日
00276
nnUNet推理与预测（手把手一步一步实现。接上文用自己的数据训练）

如上图所示，当我们训练了大概几轮之后会在nnUNet_trained_models文件下生成nnUNet以及2d的模型文件，我们可以看到fold_4里面会有model_best.m…

人工智能 2023年7月27日
0081
Deepin20.6 RTX3080 安装显卡驱动510.60.02、CUDA11.6、PyTorch1.11

Deepin20.6 RTX3080 安装显卡驱动510.60.02、CUDA11.6、PyTorch1.11 0 前言 1 准备工作 2 清理环境 3 安装显卡驱动 4 安装Py…

人工智能 2023年7月23日
00209
ELK日志系统搭建

文章目录 ES * 安装ES 启动ES 错误处理验证 Kibana * 安装Kibana 启动 Kibana Logstash * 安装Logstash 启动Logstash 项…

人工智能 2023年7月30日
0071
《生死疲劳》读书有感

先上人物关系图读后感故事的开头是主人公西门闹因为地主身份被当做典型枪毙了，西门闹经过7次转世（驴，牛，猪，狗，猴，大头儿）亲眼见证了后世之事。转世为驴，见证了自己的妻妾们改嫁…

人工智能 2023年6月4日
0089
SECOND点云检测代码详解

1、前言 SECOND也是一片基于Voxel按anchor-based的点云检测方法，网络的整体结构和实现大部分与原先VoxelNet相近，同时在VoxelNet的基础上改进了中间…

人工智能 2023年5月26日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31