opencv_python直方图反向投影原理解析

2023年7月19日上午5:09 • 人工智能 • 阅读 71

反向投影通俗的讲就是拿一张小图片在一张大图片中找出和小图片相似的区域。

直方图反向投影有两种，一种是基于块的，一种是基于像素的。

一、基于块的直方图反向投影。

先看下直方图反向投影矩阵的计算方法：

假设原图灰度图像矩阵如下：

img = [1 2 3 4

5 6 7 7

9 8 0 1

5 6 7 6]

将灰度值划分为四个如下区间：[0,2] [3,5] [6,7] [8,10]也就是划分为四个BIN，那么很容易算出来四个区间包含个数是多少，在区间[0,2]的有4个数，[3,5]区间的有4个数，[6,7]区间的有6个数，[8,10]区间的有2个数，即hist = 4 4 6 2

接下来计算反向投影矩阵：原图中坐标为（0，0）的灰度值为1，1位于区间[0,2]中，区间[0,2]对应直方图值为4，所以反向投影矩阵中坐标为（0，0）的值就替换为4，重复上述方法，将原图像灰度值全替换为四个区间的个数值，得到以下反向投影矩阵：

back_projection = [4 4 4 4

4 6 6 6

2 2 4 4

4 6 6 6]

从上述数据可以看出，在反向投影中，如在大图中遇到与小图相似区域，相似区域像素值就会被加亮显示，从而找出全部相似区域，

基于块的反向投影，是指从大图左上角开始将大图切割成一个个和小图一样大小的块，并计算出每个块的直方图，然后基于小图直方图的BIN值去与被切割成的块直方图对比，有落在BIN值区域的则加亮，无落在BIN值区域的则置0或者降低像素值。比如，上述小图的矩阵为img，大图切割后其中一个块矩阵像素为：[12 15 11 45 65 34 53 16 2 47 89 15 51 43 15 68]，那么这个块反向投影后数据就变为[0 0 0 0 0 0 0 0 4 0 0 0 0 0 0 0]，很显然这个块大部为黑色。

块的直方图反向投影基于函数cv2.calcBackProject()函数实现，代码如下（其中img为最上面的大图，img_roi对应上述的小图）：

import cv2
import numpy as np

img = cv2.imread(r'D:\python\opencv\pic\calchist_for_clothes.PNG')

hsv_target = cv2.cvtColor(img,cv2.COLOR_BGR2HSV)

img_roi = cv2.imread(r'D:\python\opencv\pic\clothes_for_test.PNG')

hsv_roi = cv2.cvtColor(img_roi,cv2.COLOR_BGR2HSV)

roihist = cv2.calcHist([hsv_roi],[0,1],None,[180,256],[0,180,0,256])

'''
&#x5F52;&#x4E00;&#x5316;&#xFF1A;&#x539F;&#x59CB;&#x56FE;&#x50CF;&#xFF0C;&#x7ED3;&#x679C;&#x56FE;&#x50CF;&#xFF0C;&#x6620;&#x5C04;&#x5230;&#x7ED3;&#x679C;&#x56FE;&#x50CF;&#x4E2D;&#x7684;&#x6700;&#x5C0F;&#x503C;&#xFF0C;&#x6700;&#x5927;&#x503C;&#xFF0C;&#x5F52;&#x4E00;&#x5316;&#x7C7B;&#x578B;

cv2.NORM_MINMAX&#x5BF9;&#x6570;&#x7EC4;&#x7684;&#x6240;&#x6709;&#x8FDB;&#x884C;&#x8F6C;&#x5316;&#xFF0C;&#x4F7F;&#x5B83;&#x4EEC;&#x7EBF;&#x6027;&#x6620;&#x5C04;&#x5230;&#x6700;&#x5C0F;&#x503C;&#x548C;&#x6700;&#x5927;&#x503C;&#x4E4B;&#x95F4;
&#x5F52;&#x4E00;&#x5316;&#x4E4B;&#x540E;&#x7684;&#x76F4;&#x65B9;&#x56FE;&#x4FBF;&#x4E8E;&#x663E;&#x793A;&#xFF0C;&#x5F52;&#x4E00;&#x5316;&#x4E4B;&#x540E;&#x5C31;&#x6210;&#x4E86;0&#x5230;255&#x4E4B;&#x95F4;&#x7684;&#x6570;&#x4E86;&#x3002;
'''

cv2.normalize(roihist,roihist,0,256,cv2.NORM_MINMAX)

dst = cv2.calcBackProject([hsv_target],[0,1],roihist,[0,180,0,256],1)

disc = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(5,5))

dst = cv2.filter2D(dst,-1,disc)

ret,thresh = cv2.threshold(dst,50,255,0)

thresh = cv2.merge((thresh,thresh,thresh))

res = cv2.bitwise_and(img,thresh)

res = np.hstack((img,thresh,res))

cv2.imshow('img',res)

cv2.waitKey()

cv2.destroyAllWindows()

二、基于像素的直方图反向投影。

基于像素的直方图反向投影涉及到两个图像的除尘运算，在opencv_python中两个图像矩阵的除法计算方法如下：

基于像素的直方图反向投影原理如下：

1、计算出小图与大图颜色直方图（cv2.calcHist()）分别记任M和I，用print打印输出你会发现小图（模板图）直方图矩阵绝大部分为数据为0，只有一小部分的数值，说明模板图的H值和S值集中在一小区域，大图（目标图）则有大批数值。

import cv2
import numpy as np

np.set_printoptions(threshold=np.inf)#&#x8BBE;&#x7F6E;&#x8F93;&#x51FA;&#x4E3A;&#x5168;&#x663E;&#x793A;&#x3002;

roi = cv2.imread('D:\python\opencv\pic\clothes_for_test.PNG')

hsv = cv2.cvtColor(roi,cv2.COLOR_BGR2HSV)

target = cv2.imread('D:\python\opencv\pic\calchist_for_clothes.PNG')

hsvt = cv2.cvtColor(target,cv2.COLOR_BGR2HSV)

M = cv2.calcHist([hsv],[0, 1], None, [180, 256], [0, 180, 0, 256] )

I = cv2.calcHist([hsvt],[0, 1], None, [180, 256], [0, 180, 0, 256] )

R = M/(I+1)

2、对两直方图矩阵做除法R = M/I。从上面数据可知，小图（模板图）数据集中在一小片区域，那么要在大图（目标图）中找出与之相似的区域，那么大图中该区域数值也应该要落在与小图对应的H值及s值区域，作除法则将其他非相似区域的值置0（也就是黑色）（这里R=M/I因为I矩阵中也可能包含0，所以在运行时会报错RuntimeWarning: invalid value encountered in true_divide，即除数为0警告，这里的除法只是为了找出相似区域，所以可以将R=M/I改成R=M/(I+1)）

3、作除法后，非相似区域为0，相似区域则为一个比值，如下图所示：

4、目标区域找到之后，我们就要知道大图（目标图像）哪些点是落在这些区域的，那么我们就用split()方法分离出大图（目标图像）的H矩阵和S矩阵，再用R[h.ravel(),s.ravel()]（ravel()方法是将原矩阵一维化）找出这些点，最后用reshape()重建图像，就实现了反向投影，当然为了让图像能正常显示，还需要对图像进行归一化处理cv2.normalize()。完整代码如下：

import cv2
import numpy as np

np.set_printoptions(threshold=np.inf)#&#x8BBE;&#x7F6E;&#x8F93;&#x51FA;&#x4E3A;&#x5168;&#x663E;&#x793A;&#x3002;

roi = cv2.imread('D:\python\opencv\pic\clothes_for_test.PNG')

hsv = cv2.cvtColor(roi,cv2.COLOR_BGR2HSV)

target = cv2.imread('D:\python\opencv\pic\calchist_for_clothes.PNG')

hsvt = cv2.cvtColor(target,cv2.COLOR_BGR2HSV)

M = cv2.calcHist([hsv],[0, 1], None, [180, 256], [0, 180, 0, 256] )

I = cv2.calcHist([hsvt],[0, 1], None, [180, 256], [0, 180, 0, 256] )

R = M/(I+1)

cv2.imshow('R',R)

h,s,v = cv2.split(hsvt) #&#x83B7;&#x53D6;H&#x8F74;S&#x8F74;&#x77E9;&#x9635;&#x3002;

B = R[h.ravel(),s.ravel()] #&#x627E;&#x51FA;&#x56FE;&#x50CF;H&#x8F74;&#x3001;S&#x8F74;&#x5BF9;&#x5E94;&#x7684;&#x503C;

B = np.minimum(B,1)

B = B.reshape(hsvt.shape[:2])#&#x4EE5;&#x76EE;&#x6807;&#x56FE;&#x50CF;&#x5927;&#x5C0F;&#x4E3A;&#x6A21;&#x677F;&#x91CD;&#x5EFA;&#x56FE;&#x50CF;&#x3002;

disc = cv2.getStructuringElement(cv2.MORPH_ELLIPSE,(5,5))

cv2.filter2D(B,-1,disc,B) #&#x5BF9;&#x56FE;&#x50CF;&#x8FDB;&#x884C;&#x5377;&#x79EF;&#x8FD0;&#x7B97;&#x3002;

B = np.uint8(B) #&#x5C06;&#x56FE;&#x50CF;&#x6570;&#x636E;&#x7C7B;&#x578B;&#x8F6C;&#x6362;&#x4E3A;uint8

cv2.normalize(B,B,0,255,cv2.NORM_MINMAX) #&#x5F52;&#x4E00;&#x5316;&#x5904;&#x7406;&#x3002;

ret,thresh = cv2.threshold(B,50,255,0)

res = cv2.bitwise_and(target,target,mask = thresh)

cv2.imshow('nice',res)

cv2.imshow('img',target)

res = np.vstack((target,cv2.merge((B,B,B)),res))

cv2.imshow("result",res)

cv2.waitKey(0)

cv2.destroyAllWindows()

通过上述效果图对比可知，基于块的直方图反向投影在效果上要比基于像素的直方图反向投影效果好，其原因在于基于块的直方图反向投影用的对比后用数据取代原值，可非直接置0.

上述如有错误请指出，谢谢。

参考：

【opencv学习笔记】027之直方图反向投影 – calcBackProject函数详解_水亦心的博客-CSDN博客

opencv python 直方图反向投影_python opencv 直方图反向投影的方法_宗智敏的博客-CSDN博客

Original: https://blog.csdn.net/weixin_66412464/article/details/126863607
Author: weixin_66412464
Title: opencv_python直方图反向投影原理解析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/702213/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据分析之渠道质量分析

无论是线上还是线下投放，在做数据分析的时候，经常会遇到需要对投放的渠道去做分析。做渠道分析的目标是为了让有限的资金预算能通过更合理投放方案，获得更多的收益，提高投放的效率。我们以…

人工智能 2023年7月16日
0075
基于昇腾AI异构计算架构CANN的通用目标检测与识别一站式方案初体验

前言强大的社会粘性不断催温数字化发展，目标检测与识别作为计算机视觉领域的一项关键技术，应用场景广泛，前景十分广阔，从城市治理、楼宇园区、互联网等领域，延伸至智能家居、金融、医疗影…

人工智能 2023年7月9日
00627
【目标检测】YOLO v5 吸烟行为识别检测

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档 YOLO v5 吸烟行为目标检测模型：计算机配置、制作数据集、训练、结果分析和使用前言相关连接（look评论）…

人工智能 2023年6月16日
0089
yolov5目标框预测

yolov5目标检测模型中，对模型结构的描述较多，也容易理解。但对如何获得目标预测方面描述较少，或总感觉云山雾罩搞不清楚。最近查阅一些资料，并加上运行yolov5程序的感受，总结一…

人工智能 2023年7月9日
0052
深度学习框架是否支持模型的压缩和量化，以减少模型的存储空间和计算资源消耗

深度学习框架支持模型的压缩和量化的问题在深度学习领域，由于深层神经网络模型的复杂性和大规模的参数数量，对计算资源的需求非常高，同时模型的存储空间也会非常庞大。因此，如何减少深度学…

人工智能 2024年1月1日
0026
【爬虫实战项目】Python爬取Top100电影榜单数据并保存csv文件（附源码）

前言今天给大家介绍的是Python爬取Top100电影榜单数据保存csv文件，在这里给需要的小伙伴们代码，并且给出一点小心得。首先是爬取之前应该尽可能伪装成浏览器而不被识别出来…

人工智能 2023年7月30日
0087
macOS：实现声音内录不用其它App

macOS：实现声音内录不用其它App 目前市场上有一些实现此类功能的 app，比如：Github 上的blackhole，以及 loopback，audio hijack，和…

人工智能 2023年5月27日
0097
使用Python和百度对外共享的TTS接口实现文本转语音

起因我扫了一下，进入了这个链接： https://tts.baidu.com/text2audio?tex=%E4%BD%A0%E5%A5%BD%E4%B8%96%E7%95%8…

人工智能 2023年5月23日
00119
如何在Kaggle上利用免费Gpu训练Yolox的模型

本文不包含Kaggle的入门步骤，如何上传数据集，如何选择GPU自行学习文章目录开头的话一、Kaggle的使用 * 1、为什么选择Kaggle 2、Kaggle的操作难度二…

人工智能 2023年7月21日
0049
Xception实现动物识别（TensorFlow）

目录 1.项目数据及源码 2.任务介绍 3.数据处理 * 3.1.数据预处理 3.2.可视化数据 3.3.配置数据集 4.网络设计 * 4.1.Xception简单介绍 4.2.设…

人工智能 2023年5月23日
0078
Grad-CAM源码保姆级讲解（pytorch）

博客中代码已上传至：https://github.com/974938429/Grad-CAM Grad-CAM是2019年发表在IJCV上的一篇文章，其目的是不更改网络结构的情况…

人工智能 2023年6月16日
00116
计算机视觉（二）图像分类

一、图像分类难点：对问题的拆解目前流行的图像分类方法分类器设计与学习图像表示分类器损失函数优化算法训练过程评价指标一、图像分类图像分类：核心任务，根据图像信息…

人工智能 2023年7月1日
0092
深度学习中神经网络模型压缩的解决办法（ flask API、onnx、ncnn在嵌入式、流媒体端口应用）

神经网络模型压缩方法（ flask API、onnx、ncnn在嵌入式、流媒体端口应用） 1 开发环境的创建 1.1 Conda简介 1.2 miniconda 1.3 conda…

人工智能 2023年6月17日
0071
【Python】一个简陋的基于混淆矩阵计算遥感分类精度（总体精度、Kappa系数、用户精度、生产者精度等）的代码

目录 1 简介 2 案例和代码说明 3 完整代码 1 简介有一篇文章返修了，由于文章的重点不在分类所以我之前就只写了个Kappa系数上去，没想到审稿人居然要求我提供其他参数ಥ_ಥ…

人工智能 2023年7月1日
0097
文本意图识别方案整理

意图识别本质上是文本分类问题，从目前的对话数据来看，用户说的话一般是短文本，长度大多在几十个字内，其中关键词和短语对分类显著的作用。目前主流的本文分类模型可以分为CNN、RNN和…

人工智能 2023年6月25日
00109
Python Tkinter教程（一）——tkinter编程基本步骤、窗口基本属性及Toplevel控件的使用

>>> 【上节回顾：Python Tkinter 模块简要介绍】<<< Python Tkinter教程（一）这篇博客将详细地介绍如何使用tk…

人工智能 2023年7月6日
0066

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

opencv_python直方图反向投影原理解析

大家都在看