使用 OpenCV 提取图像的 HOG、SURF 及 LBP 特征 (含代码)

2023年6月19日上午8:22 • 人工智能 • 阅读 93

HOG

HOG 全称为 Histogram of Oriented Gradient，即方向梯度直方图，由于使用该特征进行行人检测的效果良好而被广泛应用。HOG 是一种在计算机视觉和图像处理中用来进行目标检测的特征描述算子，通过计算和统计图像局部区域的方向梯度直方图来构成特征。HOG 特征提取流程图如下图所示：

（1）采用 Gamma 校正法对输入图像进行颜色空间的标准化，目的是调节图像的对比度，降低图像局部的阴影和光照变化所造成的影响，同时可以抑制噪音的干扰。Gamma 校正法公式如下所示，式中Gamma 一般为0.5 ：

（2）计算图像每个像素的梯度 (包括大小和方向)；主要是为了捕获轮廓信息，同时进一步弱化光照的干扰。图像中像素点(x,y)的梯度为：

（3）将图像划分成小 Cell（例如 3*3 像素/Cell），并统计每个 Cell 的梯度直方图（不同梯度的个数），即可形成每个 Cell 的特征

（4）将若干个 Cell 组成一个 Block，一个 Block 内所有 Cell 的特征串联起来便得到该 Block 的HOG 特征，

代码实现

import cv2
import numpy as np

def normalization(image):
    image = image
    image -= image.min()
    image = image / (image.max() - image.min())
    image *= 255
    image = image.astype(np.uint8)
    return image

reff_image = cv2.imread(os.path.join('C:/Users/DELL/Desktop/imgs', image_dir[j]), -1)
reff_image = normalization(reff_image)
cell_size = (6, 6)
num_cells_per_block = (2, 2)
block_size = (num_cells_per_block[0] * cell_size[0], num_cells_per_block[1] * cell_size[1])
x_cells = reff_image.shape[1] // cell_size[0]
y_cells = reff_image.shape[0] // cell_size[1]
h_stride = 1
v_stride = 1
block_stride = (cell_size[0] * h_stride, cell_size[1] * v_stride)
num_bins = 9
win_size = (x_cells * cell_size[0] , y_cells * cell_size[1])
hog = cv2.HOGDescriptor(win_size, block_size, block_stride, cell_size, num_bins)
hog_descriptor_reff = hog.compute(reff_image)

SURF

SURF 特征是 SIFT 特征的变体，SIFT 的最大缺点是计算耗时。SURF 把 DOH 中高斯二阶微分的目标进行简化，使得卷积平滑操作仅需要转换成加减运算，SURF 的鲁棒性好且时间复杂度低。SURF 特征不仅保持 SIFT 的尺度不变性与选择不变性，而且对光照变化和仿射变化同样具有很强的鲁棒性。特征提取步骤如下：

（1）构建特征点邻域的正方形区域；

（2）将上一步骤建立的正方形区域划分为几个子区域，在每个子区域里，计算网络空间里的特征向量，该特征包含 Harr 小波对水平与垂直方向的响应及响应和的绝对值；

（3）计算每个子区域的特征并进行累加，将子区域进行累计得到最终的特征向量描述子。
代码实现

import cv2
import numpy as np

reff_image = cv2.imread(os.path.join('C:/Users/DELL/Desktop/imgs', image_dir[j]), -1)
gray = cv2.cvtColor(reff_image , cv2.COLOR_RGB2GRAY)
set Hessian threshold
detector = cv2.xfeatures2d.SURF_create(2000)
find keypoints and descriptors directly
kps, des = detector.detectAndCompute(reff_image, None)
reff_image = cv2.drawKeypoints(image=reff_image, outImage=reff_image, keypoints=kps, flags=cv2.DRAW_MATCHES_FLAGS_DRAW_RICH_KEYPOINTS, color=(255, 0, 0))

需要注意的是：使用新版 opencv-python 库时会提示：

AttributeError: module ‘cv2’ has no attribute ‘xfeatures2d’

原因是新版 OpenCV 没有该算法的版权，解决方法是卸载掉当前版本的 opencv-python 库，重新安装之前版本的库 (如：opencv-python==3.4.2.16) ：

pip uninstall opencv-python

pip install opencv-python==3.4.2.16
or
pip install opencv-contrib-python

LBP

LBP 全称为 Local Binary Pattern，即局部二值模式特征，是一种用来描述图像局部纹理特征的算子。LBP 特征计算简单、效果较好，数据量小，因此 LBP 特征在计算机视觉的许多领域都得到了广泛的应用。LBP 特征具有灰度不变性和旋转不变性等显著优点，例如对光照不敏感。

LBP 定义在像素点周围 33 区域内，以中心像素为阈值，将相邻 8 个像素点的灰度值与中心像素值进行比较，如果周围像素值大于中心像素值，则该像素点的位置被标为 1。33 区域内的 8 个点可以产生 8 位二进制数，这个二进制数字就是中心像素点的 LBP 值。

代码实现

import cv2
import numpy as np
from skimage.feature import local_binary_pattern

reff_image = cv2.imread(os.path.join('C:/Users/DELL/Desktop/imgs', image_dir[j]), -1)
LBP&#x7B97;&#x6CD5;&#x4E2D;&#x8303;&#x56F4;&#x534A;&#x5F84;&#x7684;&#x53D6;&#x503C;
radius = 1
&#x9886;&#x57DF;&#x50CF;&#x7D20;&#x70B9;&#x6570;
n_points = 8 * radius
reff_lbp = local_binary_pattern(reff_image, n_points, radius)

Original: https://blog.csdn.net/qq_38964360/article/details/126068980
Author: Cassiel_cx
Title: 使用 OpenCV 提取图像的 HOG、SURF 及 LBP 特征 (含代码)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/638243/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python深度学习之基于LSTM时间序列的股票价格预测

1.本文是一篇LSTM处理时间序列的案例我们先来看看数据集，这里包含了一只股票的开盘价，最高价，最低价，收盘价，交易量的信息。本文基于LSTM对收盘价（close）进行预测 ; …

人工智能 2023年6月13日
00122
2023最新SSM计算机毕业设计选题大全（附源码+LW）之java我为群众办实事资料管理系统58g55

毕业设计说实话没有想象当中的那么难，导师也不会说刻意就让你毕设不通过，不让你毕业啥的，你只要不是太过于离谱的，都能通过的。首先你得要对你在大学期间所学到的哪方面比较熟悉，语言比如J…

人工智能 2023年6月27日
0098
深度学习模型预测时间很慢

在做深度学习任务时，我是做图像目标检测，用tensorflow或者keras或者pytorch训练完模型，然后就是做预测，发现无论是用GPU还是CPU都非常慢，然后百度了好久都没有…

人工智能 2023年5月26日
0079
lstm多变量输入回归预测模型_教你搭建多变量时间序列预测模型LSTM（附代码、数据集）…

来源：机器之心本文长度为2527字，建议阅读5分钟本文为你介绍如何在Keras深度学习库中搭建用于多变量时间序列预测的LSTM模型。长短期记忆循环神经网络等几乎可以完美地模拟…

人工智能 2023年6月17日
0083
神经网络（二）回归与线性模型

一、线性回归需要通过训练集和求解x,y之间的映射关系 1.线性回归 ①模型增广权重向量& 增广特征向量：在x和上添加一个b，可将模型中原有的b消除。模型转换为： ②…

人工智能 2023年6月17日
00129
数据清洗以及常用的方法

最近用到数据清洗，写篇博客，供自己回忆，供有需要的人参考~ 一、数据清洗是什么？数据清洗，顾名思义就是将要用到的数据中重复、多余部分的数据进行筛选并清除；把缺失部分补充完整，并将…

人工智能 2023年7月5日
0079
神经网络算法可以用来干什么

神经网络算法可以解决的问题有哪些人工神经网络（Artificial Neural Networks，ANN）系统是 20 世纪 40 年代后出现的。它是由众多的神经元可调的连接权…

人工智能 2023年7月13日
0085
python 杂记2

import os import shutil if not os.path.exists(‘C:\\Users’): shutil.copyfile(path1, path2) …

人工智能 2023年7月6日
0098
语音识别基础-梅尔谱图

Transfomer应用及改进系列文章目录第一章语音识别基础-梅尔谱图第二章李宏毅hw4语音识别数据集及需求详解第三章从rnn到gru、lstm及双向神经网络第四章编码器…

人工智能 2023年5月23日
0090
PNG文件结构分析

文章目录概述 PNG文件结构 * 1.PNG标识符（文件署名域） 2. PNG数据块 – （1）数据块格式（2）数据块类型 + * i.文件头数据块IHDR ii….

人工智能 2023年6月20日
00109
机器学习西瓜书笔记：软间隔和支持向量回归SVR

1、首先由SVM问题（最大间隔超平面模型）：所有样本都可以正确分类的最优化问题，引入软间隔SVM（允许分类错误）的最优化问题，即需要添加损失函数（样本不满足约束的程度，或者说分…

人工智能 2023年6月17日
00109
学习笔记15–车道线检测

本系列博客包括6个专栏，分别为：《自动驾驶技术概览》、《自动驾驶汽车平台技术基础》、《自动驾驶汽车定位技术》、《自动驾驶汽车环境感知》、《自动驾驶汽车决策与控制》、《自动驾驶系统设…

人工智能 2023年5月26日
0054
Haar级联分类器概述

—— 才疏学浅, 难免有错误和遗漏, 欢迎补充和勘误. Haar级联分类器是基于Haar-like特征，运用积分图加速计算，并用Adaboost训练的强分类器级联的方法来进行人脸检…

人工智能 2023年7月19日
0071
深度学习入门系列16项目实战:图像中目标识别

大家好，我技术人Howzit，这是深度学习入门系列第十六篇，欢迎大家一起交流！深度学习入门系列1：多层感知器概述深度学习入门系列2：用TensorFlow构建你的第一个神经网络深…

人工智能 2023年5月25日
00106
股市预测，销量预测，病毒传播…一个时间序列建模套路搞定全部！⛵

💡 作者：韩信子@ShowMeAI📘 深度学习实战系列：https://www.showmeai.tech/tutorials/42📘 NLP 实战系列：https://www.s…

人工智能 2023年5月28日
00115
【超分辨】SRGAN详解及其pytorch代码解释

SRGAN详解介绍网络结构损失函数数据处理网络训练介绍「2023年更新」本代码是学习参考代码，一般不能直接运行，想找现成能运行的建议看看其他的。SRGAN是一个超分辨…

人工智能 2023年6月16日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

使用 OpenCV 提取图像的 HOG、SURF 及 LBP 特征 (含代码)

大家都在看