OpenCV：08图像金字塔

2023年6月22日下午2:09 • 人工智能 • 阅读 63

图像金字塔介绍

图像金字塔是图像中多尺度表达的一种，最主要用于图像的分割，是一种以多分辨率来解释图像的有效且概念简单的结构。 简单来说，图像金字塔是同一图像不同分辨率的子图集合（有800×800、480×640…）

图像金字塔最初用于 机器视觉和 图像压缩，一幅图像的金字塔是一系列以金字塔形状排列的 分辨率逐渐降低、且 来源于同一张原始图的 图像集合。其通过梯次向下采样获得，直到达到某个终止条件才停止采样。

金字塔的底部是待处理图像的高分辨率表示，而顶部是低分辨率的近似。我们将一层一层的图像比喻成金字塔，层级越高，则图像越小，分辨率越低

高斯金字塔固定了缩放比，即如果你是800×800的图，无法缩放成500×500

我们将要学习用什么方法，如何去生成这些图像金字塔

常见两类图像金字塔：

高斯金字塔（Gaussian pyramid）：用来向下/降采样（分辨率减小，图片变小，向上走），是主要的图像金字塔；
拉普拉斯金字塔（Laplacian pyramid）：用来从金字塔低层图像重建上层未采样图像，在数字图像处理中也就是预测残差，可以对图像进行最大程度的还原，配合高斯金字塔一起使用

; 高斯金字塔（Gaussian pyramid）

高斯金字塔是通过高斯平滑和亚采样（一个图形中取出一小块）获得的一系列 下采样图像

向下采样

原理非常简单：如下图所示

原始图像分辨率 M*N ——> 处理图像后分辨率 M/2 * N/2；即每次处理后， 结果是原来的1/4（不要求是偶数，会自动四舍五入）
OpenCV：08图像金字塔

注意：向下采样（分辨率减小，在上图中表现为 方向向上 ）会丢失信息

关键API： cv2.pyrDown(src[, dst[, dstsize[, borderType]]])
其中：

src：需要操作的图片
dst：返回值，不用写，我们用一个参数接受即可
dstsize：返回图片的大小
*图片会变成原来的1/4


import cv2
import numpy as np

img = cv2.imread('./lena.png')

dst = cv2.pyrDown(img)

dst2 = cv2.pyrDown(dst)

cv2.imshow('img',img)
cv2.imshow('dst',dst)
cv2.imshow('dst2',dst2)

cv2.waitKey(0)
cv2.destroyAllWindows()

结果：

其实清晰度几乎没变，这就是图像金字塔的厉害之处：虽然丢掉了偶数行和偶数列，但是 经过了高斯核函数卷积后，相当于把一个像素点匀到周围了，因此变化不大

向上采样

向上采样是向下采样的相反过程，指图片从小变大的过程

将图像在每个方向扩大为原来的两倍，新增的行和列以0填充
使用先前同样的内核（乘以4）于放大后的图像卷积，获取近似值 ——> 假设四个一组，相当于把有数值的地方向周围三个0的位置填充（以左上角为例，相当于把10分成四份，一份2.5；但是由于整体值变小了，图像会偏暗，为了解决这个问题，我们乘4，相当于”复制”四份）

操作和向下采样一样！

关键API： cv2.pyrUp(src[, dst[, dstsize[, borderType]]])
其中：

src：需要操作的图片
dst：返回值，不用写，我们用一个参数接受即可
dstsize：返回图片的大小
*图片会变成原来的4倍


import cv2
import numpy as np

img = cv2.imread('./Hello.jpeg')

dst = cv2.pyrUp(img)

cv2.imshow('img',img)
cv2.imshow('dst',dst)

cv2.waitKey(0)
cv2.destroyAllWindows()

结果：

拉普拉斯金字塔

拉普拉斯金字塔图像 = 原始图像 - 上采操作函数（下采操作函数(原始图像)）

将降采样之后的图像在进行上采样操作，然后与之前还没降采样的原图进行做差得到残差图！为还原图像做信息的准备！

也就是说， 拉普拉斯金字塔是通用 原图像减去 先缩小后再放大的图像（高斯金字塔） 的一系列图像构成的， 减去后得到的结果就是拉普拉斯金字塔的图像。保留的是残差！

拉普拉斯金字塔是由高斯金字塔构成的，没有专门的函数


import cv2
import numpy as np

img = cv2.imread('./lena.png')

temp = cv2.pyrDown(img)

dst = cv2.pyrUp(temp)

lap0 = img - dst

cv2.imshow('dst',dst)
cv2.imshow('lap0',lap0)

cv2.waitKey(0)
cv2.destroyAllWindows()

结果：

图像直方图

图像直方图的基本概念

在统计学中，直方图是一种对数据分布情况的图形表示，是一种二维统计图表

图像直方图是用于表示数字图像中亮度分布的直方图，标绘了 图像中每个亮度值的像素数。

可以借助观察该直方图了解需要如何调整亮度分布的直方图。这种直方图中， 横坐标的左侧为纯黑、较暗的区域，而 右侧为较亮、纯白的区域。

因此，一张较暗图片的图像直方图的数据多集中于左侧和中间部分，而整体明亮，只有少量阴影的图像则相反

横坐标：图像中各个像素点的 灰度级（灰度值0-255每一个数字都是一个灰度级）
纵坐标：具有该灰度级的 *像素个数

我们从图像直方图可以看出：该幅图像存在较多很暗或者很亮的点（ 具有这些灰度级的像素个数较多），反而亮暗平衡的点较少（具有这些灰度级的像素个数较少）

看懂了之后我们就可以自主分析下面三张图啦（懒得写了…）

举个🌰：
有个3×3的图片，其中

像素的灰度级表示 ——> 图片中有什么数字
具有该灰度级的像素个数表示 ——> *这个数字在图片中出现了几次

画出上图的直方图，直方图可以有很多种。比如：
折线图：

柱状图：

归一化图：

横坐标：图像中各个像素点的 灰度级（图像中出现的像素值）
纵坐标：出现这个灰度级的概率（图像中每一个出现的像素值次数/像素值个数）

; 直方图术语

dims：直方图中需要统计的特征的数目，也就是需要统计的项目。如dims = 1，表示我们只用统计灰度值
bins：直方图中每个小区间（每个特征空间子区段）的数目，较常操作

range：我们统计灰度值的范围，一般为0-255

总的来说：直方图就是图像中各种灰度级出现的次数而画出的图

使用 `OpenCV` 统计直方图

关键API： cv2.calcHist(images, channels, mask, histSize, ranges[, hist[, accumulate]])

images：原始图像（可以不是黑白图），加 s表示可以同时对多张图片进行直方图统计 ——> 此处要加中括号，表示是一个图像集合
channels：指定通道，需要用中括号” [ ]“括起来
如果输入的图像是灰度图，那么就只有一个通道，则[ ]内写0： [0]
彩色图像可以是 [ 0 ], [ 1 ], [ 2 ]，分别对应 B,G,R
mask：掩码图像
统计整幅图像的直方图：设为 None
统计图像某个区域的直方图：需要掩码图像
histSize： BINS（柱状图中的柱子）的数量
需要用中括号括起来，如 [256]（因为是从0开始，因此有256个数字）
ranges：像素值范围，例如 [0,255]
accumulate：累积标识
默认值为 False（一般我们只操作一个图）
如果被设置为 True，则 直方图在开始分配时不会被清零
该参数允许从多个对象中计算单个直方图，或者用于实时更新直方图
多个直方图的累积结果，用于对一组图像计算直方图
*该函数会返回直方图的数据，可以直接用 plt.plot(返回值) 进行绘图！


import cv2
import numpy as np

img = cv2.imread('./lena.png')

hist = cv2.calcHist([img],[0],None,[256],[0,255])
print(hist)

结果：

从上到下分别是 灰度级0、1、2......

使用 `OpenCV` 绘制直方图


import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('./lena.png')

hist_B = cv2.calcHist([img],[0],None,[256],[0,255])
hist_G = cv2.calcHist([img],[1],None,[256],[0,255])
hist_R = cv2.calcHist([img],[2],None,[256],[0,255])

plt.plot(hist_B,color = 'b',label = 'Blue')
plt.plot(hist_G,color = 'g',label = 'Green')
plt.plot(hist_R,color = 'r',label = 'Red')
plt.legend()

plt.show()

结果：
对应横轴是灰度值转化来的（我们没有给定横轴的值，matplotlib自动索引的，相当于 cv2.cvtColor(img,cv2.COLOR_GRAY2BRR)）

我们可以发现：整个图都是偏红色（红色低频较少，在高频区较多），蓝色在偏低的位置（只有帽子上有一点），绿色在高频区较少（整幅图几乎没有绿色）

使用掩膜的直方图

如果你只对图片中的某一部分感兴趣（例如图像中的人脸、手…），就可以用掩膜进行操作，选出图中的 roi区域，对该区域使用 cv2.calcHist(mask)进行直方图计算

掩膜

掩膜的特点：想要显示的区域是纯白的，其他不想让它显示的区域是纯黑的
如何生成掩膜
先生成一个和原始图片大小一样（ img.shape）的全黑图片： mask = np.zeros(image.shape,np.uint8)
将想要的区域通过索引的方式设置为255： mask[100:200,200:300] = 355


import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('./lena.png')

gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)

mask = np.zeros(gray.shape,np.uint8)

mask[200:400,200:400] = 255

hist_gray = cv2.calcHist([gray],[0],None,[256],[0,255])
hist_mask = cv2.calcHist([gray],[0],mask,[256],[0,255])

plt.plot(hist_gray,label = 'gray',color = 'g')
plt.plot(hist_mask,label = 'mask',color = 'r')
plt.legend()
plt.show()

cv2.imshow('gray',gray)
cv2.imshow('mask',mask)

cv2.imshow('gray&mask',cv2.bitwise_and(gray,gray,mask = mask))

cv2.waitKey(0)
cv2.destroyAllWindows()

结果：

Original: https://blog.csdn.net/m0_59466249/article/details/125909895
Author: Lionetxx
Title: OpenCV：08图像金字塔

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/645591/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

论文精读：Generative Adversarial Imitation Learning（生成对抗模仿学习）

生成对抗模仿学习论文分享（Generative Adversarial Imitation Learning） 1.背景介绍 1.1.论文背景这篇论文是2016年由斯坦福大学研究…

人工智能 2023年6月24日
0061
基于Python实现的手写数字识别系统

资源下载地址：https://download.csdn.net/download/sheziqiong/85722434资源下载地址：https://download.csdn….

人工智能 2023年6月16日
0055
花卉识别(tensorflow)

参考教材：人工智能导论(第4版) 王万良高等教育出版社实验环境：Python3.6 + Tensor flow 1.12 人工智能导论实验导航实验一：斑马问题 https://…

人工智能 2023年5月23日
0074
Camera和Image sensor技术基础笔记(5) — HDR相关技术

动态范围（Dynamic Range）动态范围最早是信号系统的概念，一种信号系统的动态范围定义为：最大的信号不失真的电平和噪声电平的差，在实际场景中，多用分贝（dB）为单位来衡量…

人工智能 2023年5月26日
0071
linux 环境异常登录的甄别方法

1、关于linux的登录记录查看最近登录IP和历史命令执行日期 last 显示的最末尾的使用last -10 看最新的登录IP地址时间 still仍在登录选项：（1）-x…

人工智能 2023年7月29日
0048
deeplabv3+——训练自己的数据集 torch1.12.0 cuda11.3

参考博客一、制作自己的数据集二、训练三、可视化 torch==1.12.0+cu113 cuda==11.3 显卡为 RTX3070ti tips：30系显卡最好还是用配套的…

人工智能 2023年6月25日
0066
K210神经网络的训练以及出现内存不足的情况memory not enough解决方案

目录介绍开始训练训练完成 memory not enough报错解决方案一：解决方案二：介绍最近在搞K210神经网络搭建识别数字，在烧入代码的时候就有很多坑，记录一下…

人工智能 2023年6月17日
00101
【OpenCV图像处理12】特征检测与匹配

文章目录十二、特征检测与匹配 * 1、特征检测 – 1.1 Harris角点检测 + 1.1.1 算法原理 1.1.2 实际应用 1.2 Shi-Tomasi角点检测…

人工智能 2023年6月18日
0055
假设检验方法-T检验、Z检验、F检验、卡方检验

假设检验问题是统计推断中的一类重要问题，小编在之前给大家整理，分享过假设检验的基本步骤，今天给大家带来的是常见的假设检验方法，希望对大家有所帮助。一、假设检验基本概念假设检验是…

人工智能 2023年7月15日
0076
离散数学—判断矩阵：自反性，反自反性，对称性得到矩阵的自反闭包，对称闭包。

目录 1-自反性，反自反性，对称性 2–矩阵的自反闭包，对称闭包 1-自反性，反自反性，对称性题目:从键盘输入集合A的元素值，键盘输入A到A 关系矩阵M。判断该关系…

人工智能 2023年6月27日
0090
如何进行word embedding（tensorflow实现）

以某种方式将单词映射到指定维度(通常是更高维度)的空间 [En] map words to the space of a specified dimension (usually …

人工智能 2023年5月24日
0055
利用OpenCV进行Tonemapping

背景最近学习深度学习涉及到了一些HDR图片的读取，HDR全称是High-Dynamic Range，在显示HDR图片的时候，如果不进行色调映射，也就是Tone map的话，那显示…

人工智能 2023年6月4日
0080
基于深度学习的新冠疫情数据分析

摘要：在全球抗击新型冠状病毒肺炎（COVID-19）疫情的过程中，合理的疫情传播预测对于疫情防控有重要参考意义。为了对病毒传播进行合理预测，针对传统疫情传播预测模型存在的不足，在B…

人工智能 2023年7月15日
0079
有关python的iter，next，yield，和pytorch的dataloader

首先，对于一个python数组，我们可以用for，或者next来遍历。其次，而对于pytorch的 torch.utils.data.DataLoader, 也可以使用类似 ne…

人工智能 2023年7月23日
0049
【朴素贝叶斯】深入浅出讲解朴素贝叶斯算法（公式、原理）

朴素贝叶斯（Naive Bayes）是一种简单经典的分类算法，它的经典应用案例为人所熟知：文本分类（如垃圾邮件过滤）。 1、贝叶斯定理先验概率：即基于统计的概率，是基于以往历史经…

人工智能 2023年7月3日
0063
【读书笔记】Verilog的亚稳态现象和跨时钟域处理方法

书※目：FPGA深度解析_第七章_樊继明著高级FPGA设计结构、实现和优化_第六章_孟宪元译文章目录一、亚稳态（1）跨时钟域的亚稳态现象（2）亚稳态的多径传输二、跨时钟域…

人工智能 2023年5月30日
0087

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

OpenCV：08图像金字塔

目录

图像金字塔介绍

; 高斯金字塔（Gaussian pyramid）

向下采样

向上采样

拉普拉斯金字塔

图像直方图的基本概念

; 直方图术语

使用 OpenCV 统计直方图

使用 OpenCV 绘制直方图

使用掩膜的直方图

大家都在看

使用 `OpenCV` 统计直方图

使用 `OpenCV` 绘制直方图