NTU_RGB+D数据集介绍及骨架数据可视化

2023年5月26日下午1:30 • 人工智能 • 阅读 121

1–NTU_RGB+D数据集

1-1–NTU_RGB+D数据集下载

NTU_RGB+D数据集论文 — CVPR2016

NTU_RGB+D数据集官方下载地址

Skeleton_Data_Only ->（BaiDuYun）-> Code：75gs

1-2–NTU_RGB+D数据集介绍

NTU_RGB+D动作识别数据集由56880个动作样本组成，涵盖每个样本的RGB视频、深度图序列、3D骨架数据和红外视频等。数据集由3个Microsoft Kinect v.2相机同时捕获，RGB视频的分辨率为1920×1080，深度图和红外视频均为512×424，3D骨架数据包含每帧25个身体关节的三维位置，数据集大小如下图所示：

这里将着重介绍3D骨架数据，3D骨架数据包含每帧25个身体关节的三维坐标，25个身体关节的编号如下图所示：

分析3D skeleton数据集：

–文件命名格式：（示例：S010C001P019R001A010.skeleton）

S：设置号，共有17组设置；

C：相机ID，共有3架相机；

P：人物ID，共有40个人；

R：同一个动作的表演次数；

A：动作类别，共有60个。

–以’S010C001P019R001A010.skeleton’文件为例，具体分析其数据组成：

分析上图：

第一行：帧数，数字71表示该skeleton文件共有71帧；

第二行：body数，数字1表示该视频帧中出现了一个body；

第三行：共有10个数字，依次表示：’bodyID’, ‘clipedEdges’, ‘handLeftConfidence’,

‘handLeftState’, ‘handRightConfidence’, ‘handRightState’, ‘isResticted’, ‘leanX’, ‘leanY’, ‘trackingState’；

第四行：关节数，数字25表示共有25个关节；

5-29行：25个关节的数据，共有12个数字，依次表示：’x’, ‘y’, ‘z’, ‘depthX’, ‘depthY’, ‘colorX’, ‘colorY’, ‘orientationW’, ‘orientationX’, ‘orientationY’, ‘orientationZ’, ‘trackingState’；

之后便是第2帧的数据，遵循上述规则。

2–骨架数据可视化代码

代码用到的样本数据下载：

‘S010C001P019R001A010.skeleton’下载地址 -> Code:97mm

## 导入第三方库
import os
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
import sys

## 读取关节数据
def read_skeleton(file):
    with open(file, 'r') as f: # 打开file(.skeleton)文件
        skeleton_sequence = {} # 初始化skeleton_sequence
        skeleton_sequence['numFrame'] = int(f.readline()) # 读取.skeleton文件第一行，即帧数
        skeleton_sequence['frameInfo'] = []

        for t in range(skeleton_sequence['numFrame']): # 遍历每一帧
            frame_info = {} # 初始化frame_info
            frame_info['numBody'] = int(f.readline()) # 再次调用.readline函数，读取.skeleton文件的下一行，即body数
            frame_info['bodyInfo'] = []

            for m in range(frame_info['numBody']): # 遍历每一个body
                body_info = {} # 初始化body_info
                body_info_key = [ # key: 数字表示的意义，即对应的key
                    'bodyID', 'clipedEdges', 'handLeftConfidence',
                    'handLeftState', 'handRightConfidence', 'handRightState',
                    'isResticted', 'leanX', 'leanY', 'trackingState'
                ]
                body_info = {
                    k: float(v) # 字典类型; key: value(float类型)
                    for k, v in zip(body_info_key, f.readline().split()) # 读取下一行数据，根据key打包数据，遍历返回key, value
                }

                body_info['numJoint'] = int(f.readline()) # 读取下一行数据，即关节数
                body_info['jointInfo'] = []

                for v in range(body_info['numJoint']): # 遍历25个关节的数据
                    joint_info_key = [ # Key: 数字表示的意义，即对应的key
                        'x', 'y', 'z', 'depthX', 'depthY', 'colorX', 'colorY',
                        'orientationW', 'orientationX', 'orientationY',
                        'orientationZ', 'trackingState'
                    ]
                    joint_info = {
                        k: float(v) # 字典类型; key: value(float类型)
                        for k, v in zip(joint_info_key, f.readline().split()) # 读取下一行数据，根据key打包数据，遍历返回key, value
                    }
                    body_info['jointInfo'].append(joint_info) # 保存关节数据

                frame_info['bodyInfo'].append(body_info) # 保存body数据
            skeleton_sequence['frameInfo'].append(frame_info) # 保存当前帧的数据
    return skeleton_sequence

## 读取关节的x，y，z三个坐标
def read_xyz(file, max_body=2, num_joint=25):
    seq_info = read_skeleton(file) # 调用read_skeleton()函数读取.skeleton文件的数据

    data = np.zeros((3, seq_info['numFrame'], num_joint, max_body)) # 初始化数据； 3 × 帧数 × 25 × max_body
    for n, f in enumerate(seq_info['frameInfo']): # 遍历每一帧的数据
        for m, b in enumerate(f['bodyInfo']): # 遍历每一个body的数据
            for j, v in enumerate(b['jointInfo']): # 遍历每一个关节的数据
                if m < max_body and j < num_joint:
                    data[:, n, j, m] = [v['x'], v['y'], v['z']] # 保存 x,y,z三个坐标的数据
                else:
                    pass
    return data

## 2D展示
def Print2D(num_frame, point, arms, rightHand, leftHand, legs, body):

    # 求坐标最大值
    xmax = np.max(point[0, :, :, :])
    xmin = np.min(point[0, :, :, :])
    ymax = np.max(point[1, :, :, :])
    ymin = np.min(point[1, :, :, :])
    zmax = np.max(point[2, :, :, :])
    zmin = np.min(point[2, :, :, :])

    n = 0     # 从第n帧开始展示
    m = num_frame   # 到第m帧结束，n 11  10 ...

    rightHand = [11, 24] # 11  24
    leftHand = [7, 22] # 7  22
    legs = [19, 18, 17, 16, 0, 12, 13, 14, 15] # 19  18  17 ...

    body = [3, 2, 20, 1, 0]  # 3  2  20 ...

    Print2D(num_frame, point, arms, rightHand, leftHand, legs, body)  # 2D可视化
    #Print3D(num_frame, point, arms, rightHand, leftHand, legs, body) # 3D可视化

main()

分析：上述代码有2D展示和3D展示两个版本，3D展示效果不是很理想，样本文件是拍手(clapping)的动作。

另附一个握手（handshaking）的动作展示：（文件名：S001C001P001R001A058.skeleton）

3–参考

参考链接1

参考链接2

4 — 补充说明

骨架可视化的时候，多出来了一个点，那个不是原点来的，是另外一个body的骨架点。由于有些动作只有一个body参与，所以另外一个body全为0，画散点图的时候将其画了出来。修改也很简单，代码如下：

原代码：
plt.scatter(point[0, i, :, :], point[1, i, :, :], c='red', s=40.0)

修改为：
plt.scatter(point[0, i, :, 0], point[1, i, :, 0], c='red', s=40.0)

相当于对于一个body的图像，只画第一个body的散点图

Original: https://blog.csdn.net/weixin_43863869/article/details/121713885
Author: whut_L
Title: NTU_RGB+D数据集介绍及骨架数据可视化

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/519785/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Tessent scan &ATPG (3) Fault 的分类

Fualt 的分类在使用 report_statistrics报告scan chain 的总结性的报告时，会出现每种fault的数量以及对覆盖率的影响， ; TE(testab…

人工智能 2023年7月2日
00109
基于libtorch的Resnet34残差网络实现——Cifar-10分类（测试集准确率94.15%）

“ 前文我们使用libtorch实现的Resnet34网络对Cifar-10进行分类，测试集的分类准确率仅有74.95%，本文我们在前文的基础上做了一些改进，使得测试集…

人工智能 2023年7月2日
00178
猿创征文｜Hadoop大数据技术综合实验

综合实验：网站访问日志采集、处理及分析概述监控日志文件日志数据预处理日志数据分析与统计日志数据可视化概述当前互联网应用中，万维网（World Wide Web）应用占…

人工智能 2023年5月30日
0090
1.21212E+25

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月30日
0074
【IA-SSD】阅读笔记与代码理解

结果： IA-SSD为目前最快的3d点云目标检测网络，在单个RTX 2080Ti上速度高达 85 FPS！论文地址：https://arxiv.org/abs/2203.1113…

人工智能 2023年6月25日
0079
Session | 基于Session改造oa项目的登录功能

目录一：总结域对象二：基于Session改造oa项目的登录功能三：oa项目的安全退出系统一：总结域对象（1）request（对应的类名：HttpServletReques…

人工智能 2023年7月29日
0083
【 python 中 if 的用法(if else, if not, elif)】

python 中 if 的用法(if else, if not, elif) if语句实际上是：if True: …执行后面的语句python 中的 if 有下面几种常…

人工智能 2023年7月4日
0071
端到端语音识别笔记

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月25日
0099
机器学习_深度学习毕设题目汇总——关系抽取

下面是该类的一些题目：题目基于文本挖掘的生物医学实体关系抽取研究基于框架语义表示的关系抽取技术研究基于深度学习的联合实体关系抽取基于深度学习的自动文本摘要与关系抽取研究基于深度学…

人工智能 2023年5月30日
00177
【深度学习】Tensorflow学习（1）张量与常用函数

关于张量张量可以表示0阶到N阶的数组在TensorFlow中，张量(Tensor)表示某种相同数据类型的多维数据因此，张量有两个重要特征： [En] Therefore, th…

人工智能 2023年5月24日
00108
Tensorflow实现kaggle猫狗识别（循序渐进进行网络设计）

这篇是tensorflow版本，pytorch版本会在下一篇博客给出友情提示：尽量上GPU,博主CPU上跑一个VGG16花了1.5h。。。 Tensorflow实现kaggle猫狗…

人工智能 2023年5月25日
00143
tf.data.experimental.make_csv_dataset参数解释

tf.data.experimental.make_csv_dataset( file_pattern, batch_size, column_names=None, column…

人工智能 2023年5月23日
0099
知识图谱构建全流程

一、知识图谱简介知识图谱，是结构化的语义知识库，用于迅速描述物理世界中的概念及其相互关系，通过知识图谱能够将Web上的信息、数据以及链接关系聚集为知识，使信息资源更易于计算、理解…

人工智能 2023年7月28日
0096
【离线语音专题③】安信可VC系列离线语音SDK开发环境搭建——基于Linux系统

文章目录前言一、SDK生成二、编译工具链下载 * 1. 依赖工具安装三、SDK下载编译测试 * 1.下载解压 2.编译例程五、友情连接前言本专题的第一篇文章已经介绍了…

人工智能 2023年5月25日
00114
高斯扩散模型_基于扩散概率模型 (Diffusion Probabilistic Model ) 的音频生成模型

近两年音频生成是一个非常火热的研究课题，其目的主要在于如何将低维度、低帧率的输入特征转换成高采样率的语音信号。针对该任务，现有的技术，比如自回归网络和GAN，都处于瓶颈阶段，无法同…

人工智能 2023年5月27日
00123
WSL2（Ubuntu20）安装cuda11+PyTorch

在尝试了很多方法，包括官方方案后，唯有此种方法可行，成功使得 torch.cuda.is_available() 输出为 True 新建一个文件： /etc/apt/source….

人工智能 2023年7月22日
0090

2024 年 6 月
一	二	三	四	五	六	日
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

NTU_RGB+D数据集介绍及骨架数据可视化

1-1–NTU_RGB+D数据集下载

1-2–NTU_RGB+D数据集介绍

大家都在看