Convolution）是什么？有什么作用

2024年1月1日下午12:33 • 人工智能 • 阅读 47

Convolution是什么？

Convolution是一种数学运算，常用于信号处理和图像处理领域。它基于一种局部性的假设，认为输出的每个元素仅与输入的相邻元素有关。

在图像处理中，Convolution常用于图像特征提取、滤波和模式识别等任务。它通过在输入图像上滑动一个小的滤波器（也称为卷积核），并对每个位置上的像素进行加权求和，从而生成输出特征图。

Convolution的作用

Convolution在图像处理中有多种作用，包括：

特征提取：通过Convolution可以提取图像的边缘、纹理、角点等特征，用于后续的目标检测、图像分类等任务。
滤波：Convolution可以应用各种不同的滤波器来处理图像，如平滑滤波器可以平均像素值以减小噪声，锐化滤波器可以增强图像的边缘等。
目标检测：Convolution在卷积神经网络（CNN）中被广泛用于目标检测任务，通过卷积操作可以检测图像中的不同物体。

算法原理

假设有一个输入图像$I$和一个大小为$K \times K$的卷积核$K$，Convolution的算法原理可以用以下公式表示：

$$
O[i, j] = \sum_{m=-a}^{a} \sum_{n=-b}^{b} I[i+m, j+n] \cdot K[m, n]
$$

其中，$O$是输出图像，$i$和$j$表示输出图像中的位置坐标，$m$和$n$表示卷积核的索引，$a$和$b$分别是卷积核的大小除以2向下取整得到的值。这个公式表示了输出图像中每个像素的计算方式：对于输出图像中的每个位置$(i, j)$，将输入图像中该位置的像素与卷积核中的对应元素相乘，并加和得到输出图像中对应位置的像素值。

计算步骤

Convolution的计算步骤如下：

在输入图像$I$周围填充边界，以适应卷积核的大小。填充的方式可以是镜像填充、零填充等。
定义一个与填充后的输入图像大小相同的空白输出图像$O$。
对于输出图像中的每个位置$(i, j)$，将输入图像中该位置的像素与卷积核中的对应元素相乘，并加和得到输出图像中对应位置的像素值。
返回输出图像$O$。

Python代码示例

下面是一个用Python实现Convolution的示例代码，使用的是虚拟数据集。

import numpy as np

# 定义输入图像I和卷积核K
I = np.array([[0, 0, 0, 0], 
 [0, 1, 1, 0], 
 [0, 1, 1, 0], 
 [0, 0, 0, 0]])
K = np.array([[1, 0], 
 [0, 1]])

# 获取输入图像和卷积核的大小
height_I, width_I = I.shape
height_K, width_K = K.shape

# 定义边界填充的大小
pad_h = (height_K - 1) // 2
pad_w = (width_K - 1) // 2

# 创建一个与填充后的输入图像大小相同的空白输出图像
O = np.zeros((height_I, width_I))

# 对填充后的输入图像进行滑动窗口的计算
for i in range(pad_h, height_I - pad_h):
 for j in range(pad_w, width_I - pad_w):
 O[i, j] = np.sum(I[i-pad_h:i+pad_h+1, j-pad_w:j+pad_w+1] artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls K)

# 打印输出图像
print(O)

运行以上代码，输出结果为：

[[1. 1. 0. 0.]
 [1. 2. 0. 0.]
 [0. 0. 0. 0.]
 [0. 0. 0. 0.]]

代码细节解释

以上代码使用NumPy库对Convolution进行了实现。首先，我们定义了输入图像$I$和卷积核$K$，然后计算了输入图像和卷积核的大小。

接下来，我们定义了边界填充的大小，即用于填充输入图像的边界的像素数目。这里采用了卷积核大小的一半向下取整得到的值。

然后，我们创建了一个与填充后的输入图像大小相同的空白输出图像$O$，并将其所有元素初始化为0。

最后，使用两个嵌套的循环遍历填充后的输入图像，对滑动窗口中的每个位置$(i, j)$，计算输入图像中该位置的像素与卷积核中的对应元素的乘积，并将其加和得到输出图像中对应位置的像素值。最终，我们打印输出图像$O$。

这个虚拟数据集和代码示例可以帮助理解Convolution的工作原理和步骤。实际应用中，我们通常会使用更大的输入图像和更复杂的卷积核来处理实际的图像任务。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/822641/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

开源推荐，腾讯正式开源 Spring Cloud Tencent

一、为什么要做 Spring Cloud Tencent Spring Boot + Spring Cloud 仍是 Java 生态最主流的框架 2014 年 4 月 Spring…

人工智能 2023年6月27日
0062
从卷积神经网络（CNN）到图卷积神经网络（GCN）详解

目录一、CNN和GCN的关系二、”图”的预备知识三、图卷积网络（GCN）四、针对于高光谱图像分类的网络优化五、频域的图卷积神经网络最近看到一篇引…

人工智能 2023年6月22日
0088
RML2018.01a数据集的读取与使用

本栏目将简要介绍数据集的组成，并给出数据集的注意事项和处理方法。 [En] This column will briefly introduce the composition o…

人工智能 2023年5月23日
0092
S3C2410——LED灯实验

写在最前面：嵌入式实验，ping不通时一定要先看看网线有没有接通，一般接通都是会有黄绿色色闪烁。一、S3C2410输入/输出的原理 Linux主要有字符设备、块设备和网络设备3类…

人工智能 2023年6月4日
0094
ChatGPT 太猖狂？OpenAI 欲打假并研发“文本水印”，网友吐槽：太“鸡肋”

这到底是人干的，还是 AI 干的？随着 AIGC 的爆火，在 ChatGPT、Stable Diffusion 模型的推动下，当下想要辨别我们所见的代码、图像、文章、小说、脚本、…

人工智能 2023年7月31日
0059
介绍几个好用的小软件

欢迎大家收听PM网事，今天我们聊点儿轻松的，给大家介绍几个我觉得工作中比较好用的小软件。今天给大家介绍4款软件，基本都是免费的软件，或者是免费的版本就已经能基本满足日常需要，这4…

人工智能 2023年5月27日
0071
【开源项目】模型网络可视化查看器Netron

简介 Netron 是神经网络、深度学习和机器学习模型的查看器。 Netron 支持 ONNX、TensorFlow Lite、Caffe、Keras、Darknet、Paddle…

人工智能 2023年7月14日
0071
自动化测试——unittest框架

自动化测试——unittest框架文章目录自动化测试——unittest框架 * unittest 一、TestCase（测试用例）二、TestSuite(测试套件)和Tes…

人工智能 2023年7月3日
0096
【LeetCode1002. 查找共用字符】——数组型哈希表

示例 1： 输入：words = ["bella","label",&qu…

人工智能 2023年6月29日
00106
【GNN框架系列】DGL第一讲：使用Deep Graph Library实现GNN进行节点分类

作者：CHEONG公众号：AI机器学习与知识图谱研究方向：自然语言处理与知识图谱本文先简单概述GNN节点分类任务，然后详细介绍如何使用Deep Graph Library + P…

人工智能 2023年6月1日
0086
论文复现——CE-FPN: Enhancing Channel Information for Object Detection

最近想自己对FPN结构进行一些改进，读了不少有关FPN的论文，有些论文开源了，但是有些最新的论文没有开源，后面打算把最近复现的论文都总结一下，发个论文复现系列的文章。 &#…

人工智能 2023年7月27日
00141
【Anaconda+pycharm+pytorch】超详细pytorch安装教程

基本信息：win10+64位，阅读此文章前建议先明确自己的电脑配置：右键我的电脑-属性，即可查看。 Pytorch安装之旅一、Anaconda下载及安装 * 1.下载安装 2.新…

人工智能 2023年7月13日
0058
【Python 百炼成钢】进制转换、特殊回文数、水仙花数、杨辉三角、字母图形、01字符串、回形取数、排他方数、世纪末的星期日、约瑟夫环

文章目录 🤡前言🤡 💟进制转换💞 * 💗问题描述💗 💗问题分析💗 💗代码实现💗 💟特殊回文数💞 * 🧡问题描述🧡 🧡问题分析🧡 🧡代码实现🧡 💟水仙花数💞 * 💛问题描述💛 💛问题…

人工智能 2023年7月5日
0081
这可能是神经网络 LeNet-5 最详细的解释了！

大家好，我是红色石头！说起深度学习目标检测算法，就不得不提 LeNet- 5 网络。LeNet-5由LeCun等人提出于1998年提出，是一种用于手写体字符识别的非常高效的卷积神…

人工智能 2023年6月23日
0069
JAVA整合Milvus矢量数据库及数据

背景：目前milvsu版本迭代至2.0，已经可以支持直接在docker环境下运行目录一、Milvus的基本情况什么是 Milvus 向量数据库？非结构化数据特征向量向量…

人工智能 2023年6月25日
0083
印度，肯尼亚等地技术标准变更

印度BEE认证更新彩电能效标签有效期，将于6月30日失效 2022年6月7日，印度能源效率局BEE公布现行彩电能效标准将于2022年6月30日失效，而新标准将于2022年7月1日施…

人工智能 2023年6月4日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31