图像的梯度

2023年7月19日上午5:05 • 人工智能 • 阅读 69

梯度计算

Sobel算子
Scharr算子
laplacian算子
三种算子结果比较
Canny边缘检测
*
高斯滤波器
梯度和方向
非极大值抑制
双阈值检测
代码

Sobel算子

sobel算子需要应用两个矩阵进行计算，分别为：

我们需要用这样的矩阵与图像中每一个3×3区域做按位相乘再相加的操作。很显然，sobel算子是考虑某个3×3矩阵的第一列与第三列（或第一行与第三行）的一种算术关系，如：
图像的梯度

最后的运算结果如果小于0，则会被截断为0，如果大于255，则会保留为255。
使用sobel算子处理图像需要使用的函数是Sobel(src, ddepth, dx, dy, ksize)，其中：

ddepth:表示图像的深度（像素矩阵中元素的数据类型）
dx和dy分别表示水平和竖直方向
ksize是Sobel算子的大小（维度）

import cv2
import numpy as np
img = cv2.imread('pie.png')
sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)
cv2.imshow('sobelx', sobelx)
cv2.waitKey(0)
cv2.destroyAllWindows()

从结果来看，我们并没有获得很好的水平梯度，因为右半面没有边缘信息。这就是因为使用sobel算子，小于0的点会被截断为0。因此，我们需要一个绝对值函数，用以复原又半圆的边缘信息：

import cv2
import numpy as np
img = cv2.imread('pie.png')

sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)

sobelx = cv2.convertScaleAbs(sobelx)

cv2.imshow('sobelx',sobelx)
cv2.waitKey(0)
cv2.destroyAllWindows()

这样就可以了。如果我们需要在一张图片上显示水平和竖直梯度的图像，可以借助之前讲到过的addWeighted()函数：

import cv2
import numpy as np
img = cv2.imread('pie.png')

sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)

sobelx = cv2.convertScaleAbs(sobelx)

sobely = cv2.Sobel(img,cv2.CV_64F,0,1,ksize=3)

sobely = cv2.convertScaleAbs(sobely)
sobelxy = cv2.addWeighted(sobelx,0.5,sobely,0.5,0)
cv2.imshow('sobelxy',sobelxy)
cv2.waitKey(0)
cv2.destroyAllWindows()

可能有小伙伴会问，可不可以将dx和dy都设置成1，得到这个结果呢？但事实上，这样的方法不能很好地获得梯度图像：

import cv2
import numpy as np
img = cv2.imread('pie.png')
sobelxy = cv2.Sobel(img,cv2.CV_64F,1,1,ksize=3)
sobelxy = cv2.convertScaleAbs(sobelxy)
cv2.imshow('sobelxy',sobelxy)
cv2.waitKey(0)
cv2.destroyAllWindows()

所以，我们最好还是采用分别求出后再相加的方式获取边缘信息。

Scharr算子

scharr算子和sobel算子很像，它应用的两个矩阵为：

对应的参数为：Scharr(src, ddepth, dx, dy, ksize)，其中的参数含义与Sobel函数一致。该函数的特点在于会把差异方的更大，可以得到更丰富的边缘信息。这里先不给大家展示，后面再做对比。

; laplacian算子

拉普拉斯算子和前面两种有所不同，他只应用一个矩阵：

从形式上看，拉普拉斯算子更注重中心位置的值，因此这种方法对噪点的处理结果应该较差。下面我们来将这三种算子应用到图像处理之中看看结果：

三种算子结果比较

import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('lena.jpg',cv2.IMREAD_GRAYSCALE)

sobelx = cv2.Sobel(img,cv2.CV_64F,1,0,ksize=3)
sobely = cv2.Sobel(img,cv2.CV_64F,0,1,ksize=3)
sobelx = cv2.convertScaleAbs(sobelx)
sobely = cv2.convertScaleAbs(sobely)
sobelxy =  cv2.addWeighted(sobelx,0.5,sobely,0.5,0)

scharrx = cv2.Scharr(img,cv2.CV_64F,1,0)
scharry = cv2.Scharr(img,cv2.CV_64F,0,1)
scharrx = cv2.convertScaleAbs(scharrx)
scharry = cv2.convertScaleAbs(scharry)
scharrxy =  cv2.addWeighted(scharrx,0.5,scharry,0.5,0)

laplacian = cv2.Laplacian(img,cv2.CV_64F)
laplacian = cv2.convertScaleAbs(laplacian)

titles=['sobel','scharr','laplacian']
img_show=[sobelxy,scharrxy,laplacian]
fig, ax = plt.subplots(1,3)
for i in range(3):
    ax[i].set_title(titles[i])
    ax[i].imshow(cv2.cvtColor(img_show[i], cv2.IMREAD_GRAYSCALE))
    ax[i].axis('off')
plt.show()

从结果中也可以看出，Scharr和sobel算子都能够获取边缘信息，但Scharr算子可以捕捉到更丰富的梯度信息。拉普拉斯算子效果不是很理想，因此不建议单独使用。

Canny边缘检测

.canny边缘检测是一整套完整的理论，只想看代码的小伙伴可以直接画到最后~
canny边缘检测主要有以下的几个步骤：

*
1. 使用高斯滤波器，以平滑图像，滤除噪声。
*
1. 计算图像中每个像素点的梯度强度和方向。
*
1. 应用非极大值（Non-Maximum Suppression）抑制，以消除边缘检测带来的杂散响应。
*
1. 应用双阈值（Double-Threshold）检测来确定真实的和潜在的边缘。
*
1. 通过抑制孤立的弱边缘最终完成边缘检测。

高斯滤波器

高斯滤波消除噪声的原理我们已经讲过，但是这里还需要对H矩阵进行一下归一化处理（H矩阵所有值之和为1）：

; 梯度和方向

在这个环节，我们需要得到梯度的大小和方向，也就需要知道x方向的梯度和y方向的梯度，获得方法如下：

非极大值抑制

如果我们手里有一个存储了每个像素点梯度值的矩阵，那么我们就需要判断没一个像素点是不是该梯度方向上的极大值。由极大值的定义可以知道，只要满足该梯度值比对应方向上的最近两个（位于该点上下或左右）的值大即可。我们假设像素点是真正意义上的点，而不是一个小正方形，如：

实际上这幅图中我们假设g1,g2,g3,g4以及c是相邻的像素点，即他们有以下的位置关系：
图像的梯度

其中θ是c点的梯度方向，则有一条斜率为(180°-θ)的过c的直线会交g1，g2连线上的一点（设为m），交g3，g4连线上的一点（设为n），我们只需要保证c比m和n的值都要大，就可以说c是一个极大值。但是m和n并不是具体值，该怎么办呢？我们需要用线性差值法给m和n赋予一个值。
所谓线性插值，即：
图像的梯度

其中，|g1m|为g1点到m位置的距离，且|g1m|+|g2m|=1，n的计算方法也是同理。如果c同时大于m和n，那么将予以保留，否则，要对c进行抑制。
为了简化计算，由于一个像素周围有八个像素，我们可以简化成八个方向：

如果θ不等于这八个方向之一，我们会就近分配一个方向作为θ，这样就不需要插值了。

以a4为例，假如a4的梯度方向是0（水平方向），那么就需要考虑a4和a5以及a3的大小，如果a4是这三个数中的最大值，既可以认为a4是个会被保留的极大值，由于边缘的方向垂直于梯度方向，所以在a4附近的边缘是垂直方向的：

; 双阈值检测

上文我们已经介绍了非极大值抑制，但是保留下来的值也不能全部认定为边缘信息，双阈值检测就是确定图像边缘的又一个重要指标：

我们需要设置最大值和最小值，如果保留下来的梯度大于maxVal，我们认为这是一个边界点，如果小于minVal，这个梯度值便不是边缘，将会被抑制。假如梯度介于这两者之间，那就需要考虑这个值是否临接边界。如上图所示，假如A,C,B是三个梯度，而这三个梯度值的位置关系为：
图像的梯度

因为C与A临接，所以C也是图像边缘，而B不与边缘值临接，所以B不是边缘。

代码

canny算法虽然理论复杂，但写起来非常简单，依赖的函数是：

cv2.Canny(img,minVal,maxVal)

img是一个灰度图矩阵，minVal和maxValue是双阈值检测中的设置的最小值和最大值：

import cv2
import numpy as np

img=cv2.imread("lena.jpg",cv2.IMREAD_GRAYSCALE)
v1=cv2.Canny(img,80,150)
v2=cv2.Canny(img,50,100)

res = np.hstack((v1,v2))
cv2.imshow('res',res)
cv2.waitKey(0)
cv2.destroyAllWindows()

可以发现，把minVal或maxVal设置的越大，保留下来的边缘信息就越少，相对也会精确一些，反之保留的边缘信息会更多更完整，但是也会有一些噪点会被保留下来。小伙伴们自己换一些图片试试提取图片边缘吧~

Original: https://blog.csdn.net/weixin_54929649/article/details/126356270
Author: 有理想的打工人
Title: 图像的梯度

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/702205/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

医疗知识图谱问答系统探究

1、项目背景中科院软件所刘焕勇老师在github上的开源项目，基于知识图谱的医药领域问答项目QABasedOnMedicaKnowledgeGraph。项目地址：https://…

人工智能 2023年6月1日
00104
图文详解 .ipynb文件是什么，如何打开？

“.ipynb” 文件是使用 Jupyter Notebook 来编写Python程序时的文件。 Jupyter Notebook（此前被称为 IPytho…

人工智能 2023年7月4日
0090
Gmapping的个人理解

Gmapping 第0章源码阅读的一些预准备 0.1、算法简介对于建图,SLAM,也称为 CML (Concurrent Mapping and Localization), …

人工智能 2023年7月19日
0078
人工神经网络简介

人工神经网络的概念人工神经网络（Artificial Neural Network，ANN）简称神经网络（Neural Network）或类神经网络，是一种模仿生物神经网络的结构…

人工智能 2023年6月17日
0078
【Pytorch深度学习实战】（4）前馈神经网络（FNN）

🔎大家好，我是Sonhhxg_柒，希望你看完之后，能对你有所帮助，不足请指正！共同学习交流🔎📝个人主页－Sonhhxg_柒的博客_CSDN博客📃🎁欢迎各位→点赞👍 + 收藏⭐️ +…

人工智能 2023年7月13日
0054
PyTorch 学习笔记 5 —— 实现手写数字识别 LeNet-5

MNIST MNIST 数据集是一个包含了 50000 个训练数据，10000个测试数据的手写数字数据集，每张手写数字图像大小为为 28 × 28 28 \times 28 28 …

人工智能 2023年7月22日
0071
MacOS移动硬盘文件呈灰色的解决办法

在终端输入 df，查看挂载点； /dev/disk2s1 466Gi 181Gi 285Gi 39% 406 298851162 0% /Users/hang/.mounty/Mo…

人工智能 2023年6月4日
00276
GAN-生成对抗神经网络(Pytorch)-合集（1）GAN-DCGAN-CGAN

原生GAN （Generative Adversarial Nets）训练过程也是老三步了，再啰嗦一遍：使用真实图片训练辨别器，标签为真使用生成器生成的图片训练判别器，标签为假…

人工智能 2023年7月14日
0065
人机交互课设(1)-百度api调用_ASR

啊哦~你想找的内容离你而去了哦内容不存在，可能是由于以下原因造成的： [En] The content does not exist and may be caused by t…

人工智能 2023年5月25日
0081
一文带你了解python opencv中霍夫变换(Hough transform)的常用操作

文章目录前言 * 霍夫直线变换 – cv2.HoughLines cv2.HoughLinesP skimage.transform.hough_line 霍夫直线检…

人工智能 2023年6月18日
00106
Springboot内置的工具类之CollectionUtils

前言实际业务开发中，集合的判断和操作也是经常用到的，Spring也针对集合的判断和操作封装了一些方法，但是最令我惊讶的是，我在梳理这些内容的过程中发现了一些有趣的现象，我的第一反…

人工智能 2023年7月30日
0083
yolox改进–添加Coordinate Attention模块（CVPR2021）

yolox改进–添加Coordinate Attention模块 Coordinate Attention 代码 * 建立包含CAM代码的attention.py 在y…

人工智能 2023年6月23日
0066
中的邻域大小如何影响算法性能

问题：邻域大小对算法性能的影响邻域大小是指在算法中用于计算相似度或距离的数据点的数量。它在许多机器学习算法中扮演着重要的角色，包括聚类、分类和回归等领域。本文将深入探讨邻域大小对…

人工智能 2024年1月2日
0033
比特平面分层

位深度在记录数字图像的颜色时，计算机实际上是用每个像素需要的位( bit )深度来表示的。图像的色彩越丰富，”位”就越多。示例1：1位颜色的图，位深度就…

人工智能 2023年6月20日
00103
学堂在线_大数据与机器学习_第5章聚类

一个簇可以只包含一个样本，也可以包含多个样本 • 聚类的结果可用包含m个元素的簇标记向量表示如何度量外部指标a 两个都在同一类b 外同一类，内不同一类c 内同一类，外部同一类d…

人工智能 2023年5月31日
0098
【赵渝强老师】利用Python完成数据分布特征的分析

在对数据的质量进行分析后，接下来就可以对数据的特征进行分析和计算，也可以通过绘制图表对数据的特征进行展示。数据的特征分析通过有以下几种方式：分布分析、对比分析、统计量分析、周期性分…

人工智能 2023年6月11日
0075

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31