卷积层的滤波器是怎样工作的？滤波器的大小和个数如何确定

2024年1月5日下午8:06 • 人工智能 • 阅读 54

问题描述

卷积层是卷积神经网络（Convolutional Neural Network, CNN）中的关键组件之一，它通过使用滤波器（也称为卷积核或权重）对输入数据进行卷积运算，从而提取出输入数据的特征。本文将详细解释卷积层滤波器的工作原理，并介绍如何确定滤波器的大小和个数。

介绍

卷积层是CNN模型中非常常用的一种层，它具有很多优势，例如，共享权重、局部感知和参数共享等。卷积层的输入通常是一个三维张量，它的形状为（批量大小，高度，宽度，通道数）。卷积层通常有多个滤波器，每个滤波器都是一个小的权重张量，它在输入上滑动，通过计算输入的局部区域与滤波器的点积来生成输出的特征图。

算法原理

卷积层的滤波器可以看作是一组权重，这些权重用于对输入数据的不同位置进行加权运算。滤波器的大小和个数是人为设定的超参数，需要根据具体的任务和数据集来选择。

滤波器大小

滤波器的大小通常是一个二维的正方形或矩形，它决定了每次卷积操作涉及的输入数据的空间范围。在计算机视觉任务中，通常选择的滤波器大小为3×3或5×5，较大的滤波器可以捕获更大尺度的特征，但也会增加模型的复杂度。滤波器的大小还可以根据输入数据的大小和任务的复杂程度进行调整。

滤波器个数

滤波器的个数决定了卷积层输出的特征图的深度。每个滤波器都会生成一个输出特征图，多个滤波器生成的特征图叠加在一起，形成卷积层的最终输出。在实际应用中，通常会逐渐增加滤波器的数量，使得卷积层能够提取更加丰富的特征。

公式推导

卷积操作可以用数学公式进行描述。假设输入数据为一个三维张量$X$，它的形状为（批量大小，输入通道数，输入高度，输入宽度）。滤波器为一个四维张量$W$，它的形状为（滤波器个数，输入通道数，滤波器高度，滤波器宽度）。卷积操作可以表示为：

$$
\text{输出特征图} = \text{卷积}(X, W) = X artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls W
$$

其中$*$表示卷积操作。具体的计算步骤如下：

对于每个滤波器，将其与输入数据进行逐元素的点积运算，并将结果相加，得到一个特征图。
使用不同的滤波器进行相同的操作，得到多个特征图。
将多个特征图叠加在一起，得到最终的卷积层输出。

计算步骤

为了更好地理解卷积操作的计算步骤，以下提供一个具体的示例。假设输入数据$X$的形状为（1，1，5，5），滤波器$W$的形状为（1，1，3，3），那么计算过程如下：

选择第一个滤波器，将其与输入数据的一个3×3的局部区域进行逐元素的点积运算，然后将结果相加，得到一个特征图（即卷积核在输入数据的一个局部区域上提取的特征）。
将滤波器在输入数据上滑动一个步长，继续进行点积运算，得到另一个特征图。
重复上述步骤，直到滤波器遍历整个输入数据，得到最终的输出特征图。

Python代码示例

以下是一个通过Python代码实现卷积操作的示例。首先，我们需要导入必要的库：

import numpy as np

然后，我们可以定义一个函数来进行卷积操作：

def convolution(image, kernel):
 m, n = image.shape
 mk, nk = kernel.shape
 output = np.zeros((m - mk + 1, n - nk + 1))

 for i in range(m - mk + 1):
 for j in range(n - nk + 1):
 output[i, j] = np.sum(image[i:i+mk, j:j+nk] artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls kernel)

 return output

接下来，我们可以生成一个虚拟的输入数据和滤波器：

image = np.array([[1, 2, 3, 4, 5],
 [6, 7, 8, 9, 10],
 [11, 12, 13, 14, 15],
 [16, 17, 18, 19, 20],
 [21, 22, 23, 24, 25]])

kernel = np.array([[1, 0, -1],
 [2, 0, -2],
 [1, 0, -1]])

最后，我们可以调用卷积函数进行计算，并打印输出结果：

output = convolution(image, kernel)
print(output)

代码执行结果如下：

[[ 4. 4. 4. 4.]
 [ 14. 14. 14. 14.]
 [ 24. 24. 24. 24.]
 [ 34. 34. 34. 34.]]

代码细节解释

上述示例代码中的convolution函数实现了卷积操作的计算步骤。

首先，函数接受两个参数，image表示输入数据，kernel表示滤波器。

然后，函数获取输入数据和滤波器的形状，以确定输出特征图的大小。

接下来，函数创建一个输出特征图的零矩阵，其形状为（m – mk + 1，n – nk + 1），其中m和n分别表示输入数据的高度和宽度，而mk和nk分别表示滤波器的高度和宽度。

然后，函数使用两个嵌套的循环遍历滤波器在输入数据上滑动的所有位置。

在每个位置，函数获取输入数据的一个子矩阵，并与滤波器进行逐元素的点积运算。点积运算的结果是一个标量，表示滤波器在当前位置提取的特征。

最后，函数将每个点积运算的结果存储在输出特征图的相应位置，并返回最终的输出特征图。

在示例代码中，我们创建了一个5×5的虚拟输入数据和一个3×3的虚拟滤波器。然后，我们调用convolution函数进行卷积操作，并打印输出结果。输出结果是一个4×4的矩阵，其中每个元素表示滤波器在输入数据的相应位置提取的特征。

以上就是关于卷积层滤波器的工作原理、滤波器大小和个数的解释。通过这些详细的阐述和示例代码，希望能帮助你更好地理解和应用卷积层。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/824101/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

逻辑(logistic)回归算法原理及两种代码实现

一. 原理简单介绍 logistic回归是一种基于线性回归模型的分类算法，常用于数据挖掘，疾病自动诊断，经济预测等领域。例如，探讨引发疾病的危险因素，并根据危险因素预测疾病发生的概…

人工智能 2023年6月16日
0099
c均值聚类中心坐标公式如何使用_统计学习方法第14章：聚类方法

github链接：[gdutthu/Statistical-learning-method] 本人csdn博客链接：https://blog.csdn.net/zhanzi1538…

人工智能 2023年6月2日
0080
反卷积通俗详细解析与nn.ConvTranspose2d重要参数解释

文章目录反卷积的作用卷积中padding的几个概念 * No Padding Half(Same) Padding Full Padding 反卷积 * 反卷积中的Paddin…

人工智能 2023年7月26日
0058
Visual C++ 2010 Express和EasyX的使用介绍

Visual C++ 2010 Express和EasyX初学者入门本文将介绍Visual C++ 2010 Express创建Win32控制台（Console）程序、创建WIN…

人工智能 2023年6月29日
00119
逻辑回归模型在样本不平衡问题上有什么挑战

问题背景在机器学习中，逻辑回归是一种常见的分类算法，被广泛应用于许多领域，例如金融、医疗和广告等。然而，逻辑回归模型在处理样本不平衡问题时会面临一些挑战，即当正类和负类样本数量差…

人工智能 2023年12月31日
0036
Python Pandas 中的数据结构（超详细，你确定不学习一下？）

Pandas有三种数据结构：Series、DataFrame和Panel。Series类似于数组；DataFrame类似于表格；Panel可视为Excel的多表单Sheet目录1….

人工智能 2023年7月6日
0060
Pytorch中torch.sort()和torch.argsort()函数解析

一. torch.sort()函数解析 1. 官网链接 torch.sort()，如下图所示： ; 2. torch.sort()函数解析 torch.sort(input, di…

人工智能 2023年7月22日
0059
为什么回归直线过平均值点_看图说话之线性回归算法

一.从线性回归的故事说起相信大家都听过著名的博物学家，达尔文的大名，而今天这个故事的主人公就是他的表弟高尔顿。高尔顿是一名生理学家，在1995年的时候，他研究了1078堆父子的…

人工智能 2023年6月18日
00106
【论文阅读】GCNN Traffic Classification with Graph Neural Network

GCNN Traffic Classification with Graph Neural Network 摘要介绍流量分类模型 chained graph 摘要目前许多最先…

人工智能 2023年7月3日
0089
【数据库迁移系列】从Oracle迁移到openGauss实战分享

之前的迁移系列中我们介绍了Mysql到openGauss的迁移方法，本篇介绍使用Ora2og工具从Oracle到openGauss数据库的迁移。文章目录简介迁移前准备 * 环…

人工智能 2023年7月31日
0050
使用pandas读取xlsx

一、使用pandas读取xlsx 引用pandas库 import pandas as pd pd.read_excel(path, sheet_name=0, header=0,…

人工智能 2023年7月7日
0065
【OpenCV 例程 300 篇】108. 约束最小二乘方滤波

专栏地址：『youcans 的 OpenCV 例程 300篇 – 总目录』【第 7 章：图像复原与重建】106. 退化图像的逆滤波107. 退化图像的维纳滤波108….

人工智能 2023年7月19日
0063
精选3种张炫酷的动态交互式图表，Pandas一键生成，通俗易懂

大家好！今天来讲一下如何用一行代码在 DataFrame数据集当中生成炫酷的动态交互式的图表，我们先来介绍一下这次需要用到的模块 cufflinks 模块的安装涉及到安装，直接…

人工智能 2023年7月7日
0065
使用pytorch搭建lstm时间序列预测

前言：网上找的代码是keras以tensorflow为后端的，苦于不知道具体版本号，所以各种报错，所以参考网上的代码将其修改为基于pytorch的。最终可用的版本如下：使用py…

人工智能 2023年7月20日
0081
KNN算法在Spark RNN flow中的应用

文章目录 KNN算法原理一、KNN分类算法二、三个问题 * 1.K值如何选取 2.距离如何度量特征归一化 4. KNN优缺点三、RDD Flow KNN算法原理一、KNN…

人工智能 2023年7月2日
0062
3060Ti显卡，tensorflow2.4-GPU安装

一、写在前面：本来一直用的tensorflow2.3，换了新电脑就原样装的，但是怎么都调用不了GPU，2.3版本的安装大家可以参考：(37条消息) TensorFlow2.3（g…

人工智能 2023年5月25日
0088

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31