HOG3D原理解读

2023年6月20日下午1:10 • 人工智能 • 阅读 106

最近需要使用HOG3D对视频中提取的兴趣点进行描述，就研究了下相关的原理，原论文名为：A Spatio-Temporal Descriptor Based on 3D-Gradients。

作为图像序列的局部特征描述方法，HOG3D即三维梯度方向直方图，通过计算时空兴趣点周围局部区域内所有像素点对应的二维图像及时间域的平均梯度直方图对时空兴趣点进行三维梯度特征描述。它的描述过程如下图所示：

这个图刚看起来比较让人迷惑，这个立方体代表什么，每一步又是怎么操作的，下面我就详细的介绍一下它的来龙去脉。

HOG3D 是HOG描述在时间域的扩展，一般在兴趣点检测之后进行，它的步骤主要为：

1、求兴趣点周围空间邻域。

2、求每个block中各像素的平均梯度并将所有像素点的平均梯度累加。

第一步求时空块（block）的平均梯度

这一步也就是上图（d）中做的事儿，所谓的时空块指的是时空兴趣点周围的区域，平均梯度的计算需要引入一个叫积分视频的东西。对于一个视频序列V(x,y,t)，设其在x，y，t方向的偏导数为

（csdn的公式真难打）。则

的积分视频的计算公式如下：

上面这个公式的意思是在图像序列中，点（x,y,t）对x偏导数的积分视频为三个坐标轴方向上所有小于该点坐标的像素点的x方向的梯度和。有了总梯度就可以计算平均梯度了，例如x方向上的平均梯度可以用一下公式计算。

类似的，y方向和t方向的平均梯度也按照这个公式计算，最后把三个方向的平均梯度放到一起，就得到了该时空块的平均梯度。这样步骤（d）算是完成了。

第二步平均梯度的方向量化

我们这里常用的是正12面体以及正20面体（面越多说明直方图的分辨率越高，同时向量的维数就越多）。假设正20面体的中心为（0，0，0）首先将三维梯度投影到正多面体每４个面的中心位置。设正20面体中心点坐标向量为

其中，

。则正20面体的中心坐标为

其中

为

。投影的计算方法如下：

计算的结果在去除一些较小的值后可得到投影的向量，同时也要进行归一化处理。具体的计算方法可以看原论文。

第三步梯度投影求和

经过第一步和第二步后，每一个像素点都能得到一个P维（P=所选多面体的面数）的描述符，为了方便描述，引入一个block，每个block含有8个像素点，也就是图（b）表示的时空块，将这8个像素点的平均梯度求出来再累加即可得到该block的描述符，该block也是20维的。

第四步描述符串联

这一步首先要提取兴趣点周围的空间邻域作为我们的描述对象，每个空间邻域由MMN个block组成，对每个blcok都进行以上处理，即可得到MMN个描述符，其中每个描述符为P维，总的特征向量的大小为MMN*P。

经过以上步骤即可得到兴趣点周围空间邻域的特征描述，将其送入分类器或者进行下一步处理。需要详细代码的（matlab）可以在评论区留言。

Original: https://blog.csdn.net/weixin_44598249/article/details/123248414
Author: 和光同尘seg
Title: HOG3D原理解读

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/641334/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Win10下 anaconda3 + cuda11.3 + TensorFlow_GPU2.6.0 + Pytorch_GPU1.10.1

Win10 + CUDA11.3 + tf_GPU2.6.0 + pytorch_GPU1.10.1 软件版本 * TensorFlow_GPU Pytorch_GPU 第一步：安…

人工智能 2023年5月23日
00118
pandas基本使用（一）

相当于Excel中的一个Sheet表。创建方法典类型读取到DataFrame（dict to DataFrame）方法一：直接使用 pd.DataFrame(data=te…

人工智能 2023年7月7日
0068
数字图像处理——图像滤波概念及方法

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月22日
0081
软件测试简历项目经验怎么写，没有项目经验？

怎么办？只能接受低薪工作吗？No No No。本文就教大家如何解决这个问题。为了帮助大家彻底解决”没有项目”这个拦路虎，接下来文章将从以下几个方面进行展开…

人工智能 2023年7月29日
0050
【机器学习】K-means算法Python实现教程

阅读须知：阅读本文需要有一定的Python及Numpy基础本文将介绍： K-means算法实现步骤使用Python实现K-means算法借助Numpy的向量计算提升计算速度…

人工智能 2023年6月19日
0066
pytorch入门——构建神经网络

从 pytorch到nlp 第一章 pytorch 之构建神经网络文章目录从 pytorch到nlp * – 前言一、构建神经网络的具体流程二、代码及其解读 *…

人工智能 2023年7月12日
0064
spyder问题之py2neo和neo4j踩过的坑

本来是在做知识图谱，然后需要用到py2neo库，于是直接在anaconda prompt里pip了一下，然后我的spyder就打不开了，由此引发了一系列问题，因为期间找过很多资料发…

人工智能 2023年6月1日
0076
目标检测的Tricks | 【Trick10】工具类文件调用（coco评价指标包、日志工具、Tensorboard工具…）

如有错误，恳请指出。对于一些评价指标与常见的日志记录与输出，除了自己写或者是使用普通的python提供的工具包，比如说是logging等，其实还可以使用一些大佬写好的工具函数来调…

人工智能 2023年7月9日
0073
公司对外投资和担保

一、公司对外投资和担保规范公司对外投资和外他人提供担保，需承担相应的责任公司可以对外投资和提供担保二、公司提供担保的方式保证抵押质押三、公司提供担保的规定公司对外承…

人工智能 2023年7月31日
0059
OpenCV学习——图像处理之形态学操作

概念：图像的邻域、连通性膨胀与腐蚀膨胀和腐蚀为相反的一对操作。dilate （膨胀） erode（腐蚀）都是形态学的滤波。腐蚀：腐蚀是对图像中的高亮（白色）区域进行…

人工智能 2023年6月22日
0064
支持向量机（SVM）原理小结（3）支持向量回归SVR

支持向量机（SVM）原理小结（3）支持向量回归SVR 1. 支持向量回归（SVR） * 1.1 学习算法—对偶形式 – （1）求min ⁡ w , b , ξ , ξ …

人工智能 2023年6月17日
0072
如何进行模型评估和性能指标选择

模型评估和性能指标选择模型评估是机器学习任务中非常重要的一个环节，它用于对训练好的模型进行性能评估，以便了解模型的优劣并做出相应的改进。在进行模型评估时，需要选择适当的性能指标来…

人工智能 2024年1月3日
0041
问题解决之 TypeError: can‘t convert CUDA tensor to numpy. Use Tensor.cpu() to copy the tensor to

运行程序，出现报错信息 TypeError: can’t convert CUDA tensor to numpy. Use Tensor.cpu() to copy the te…

人工智能 2023年6月16日
0088
uniapp配置百度语音识别转文字（含demo）

前言在dcloud社区已经给出了语音识别插件配置的步骤，点击前往：语音识别插件配置，但是它仍然不够详细，可能会出现问题，所以我将用一个示例配置来实现它。 [En] But it…

人工智能 2023年5月23日
0077
【opencv图像处理】–4. 低、高通滤波，卷积和各种算子

系列所有代码，复制粘贴即可运行。希望有能力的朋友还是拿C++运行一下。本节讨论图像的低通滤波（卷积，方盒，中值双边，高斯），高通滤波（Sobel,Scharr,Laplace,c…

人工智能 2023年6月19日
0096
【人工智能实验】A*算法求解8数码问题

目录实验一 A*算法求解8数码问题一、实验目的二、实验原理三、实验结果四、实验总结附录代码推荐文章实验一 A*算法求解8数码问题一、实验目的熟悉和掌握启发式搜索…

人工智能 2023年6月23日
00105

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

HOG3D原理解读

第一步 求时空块（block）的平均梯度

第二步 平均梯度的方向量化

第三步 梯度投影求和

第四步 描述符串联

大家都在看

第一步求时空块（block）的平均梯度

第二步平均梯度的方向量化

第三步梯度投影求和

第四步描述符串联