卷积神经网络中二维卷积核与三维卷积核有什么区别？

2023年6月16日上午2:10 • 人工智能 • 阅读 88

4 如何理解卷积神经网络中的通道（channel）

4.1 多通道

4.2 单通道

一维卷积常用在序列模型、自然语言处理领域；

图中的输入的数据维度为8，过滤器的维度为5。与二维卷积类似，卷积后输出的数据维度为8−5+1=4。
如果过滤器数量仍为1，输入数据的channel数量变为16，即输入数据维度为8×16。这里channel的概念相当于自然语言处理中的embedding，而该输入数据代表8个单词，其中每个单词的词向量维度大小为16。在这种情况下，过滤器的维度由55变为5×16，最终输出的数据维度仍为4。
如果过滤器数量为n，那么输出的数据维度就变为4×n。
一维卷积常用于序列模型，自然语言处理领域。

2 二维卷积神经网络（2D- CNN ）

二维卷积常用在计算机视觉、图像处理领域（在视频的处理中，是对每一帧图像分别利用CNN来进行识别，没有考虑时间维度的信息）；

2.1 单通道

图中的输入的数据维度为14×14，过滤器大小为5×5，二者做卷积，输出的数据维度为10×10（14−5+1=10）。。
上述内容可以说channel的数量为1。如果将二维卷积中输入的channel的数量变为3，即输入的数据维度变为（14×14×3）。由于卷积操作中过滤器的channel数量必须与输入数据的channel数量相同，过滤器大小也变为5×5×3。在卷积的过程中，过滤器与数据在channel方向分别卷积，之后将卷积后的数值相加，即执行10×10次3个数值相加的操作，最终输出的数据维度为10×10。
以上都是在过滤器数量为1的情况下所进行的讨论。如果将过滤器的数量增加至16，即16个大小为10×10×3的过滤器，最终输出的数据维度就变为10×10×16。可以理解为分别执行每个过滤器的卷积操作，最后将每个卷积的输出在第三个维度（channel 维度）上进行拼接。
二维卷积常用于计算机视觉、图像处理领域。

2.2 多通道

多通道卷积。每个卷积核都应用于上一层的输入通道，以生成一个输出通道。所有输出通道组合在一起组成输出层。如下图所示：

动图：https://pica.zhimg.com/50/v2-9b822c07062fed010d0fecbac56c3763_720w.webp?source=1940ef5c

输入层为

的矩阵（即为三通道）。滤波器为

的矩阵（即含有3个卷积核）。首先滤波器中的每个卷积核分别应用于输入层的三个通道。执行上次卷积计算，输出3个

的通道。

https://pica.zhimg.com/50/v2-fa76727d15dfaa1f81c4eab712b4e866_720w.jpg?source=1940ef5c

图是对一个3通道的图片做卷积操作，卷积核的大小为 3 × 3 ，卷积核的数目为3，此时 过滤器指的就是这三个卷积核的集合，维度是 3 × 3 × 3 ，前面的 3 × 3 指的是卷积核的高度（H）和宽度（W），后面的那个 3 指的是卷积核的数目（通道数）。

上面的操作是对三个通道分别做卷积操作，然后将卷积的结果相加，最后输出一个特征图。

即：一个过滤器就对应一个特征图。

2.3 2D卷积的计算

* 超参数：
– 过滤器个数：

– 滑动步长（Stride）：

– 填充值（Padding）：

其中输出层和输入层之间的参数关系为，

3 三维卷积

3.1 3D卷积

在上一个插图中，可以看出，这实际上是在完成3D卷积。但通常意义上，仍然称之为深度学习的2D卷积。因为将滤波器深度和输入层深度相同，3D滤波器仅在2个维度上移动（例如图像的高度和宽度），得到的结果为单通道。

通过将2D卷积的推广，在3D卷积定义为滤波器的深度小于输入层的深度（即卷积核的个数小于输入层通道数），故3D滤波器需要在三个维度上滑动（输入层的长、宽、高）。在滤波器滑动的每个位置执行一次卷积操作，得到一个数值。当滤波器滑过整个3D空间，输出的结构也是3D的。

2D卷积和3D卷积的主要区别为滤波器滑动的空间维度。3D卷积的优势在于描述3D空间中的对象关系。3D关系在某一些应用中十分重要，如3D对象的分割以及医学图像的重构等。

https://pic1.zhimg.com/50/v2-e7e31e6b4a86e54dc07e61a8144ce6dc_720w.webp?source=1940ef5c

3D卷积操作如图所示，同样分为单通道和多通道：

对于单通道输入，与2D卷积不同之处在于，输入图像多了一个深度(depth)维度，卷积核也多了一个维度，因此3D卷积核的尺寸为，每次滑窗与窗口内的值进行相关操作，得到输出3D图像中的一个值。
对于多通道输入，则与2D卷积的操作一样，每次滑窗与3个channels上的窗口内的所有值进行相关操作，得到输出3D图像中的一个值。

这里采用代数的方式对三维卷积进行介绍，具体思想与一维卷积、二维卷积相同。

假设输入数据的大小为a1×a2×a3，channel数为c，过滤器大小为f，即过滤器维度为f×f×f×c（一般不写channel的维度）， 过滤器数量为n。
基于上述情况，三维卷积最终的输出为(a1−f+1)×(a2−f+1)×(a3−f+1)×n。该公式对于一维卷积、二维卷积仍然有效，只有去掉不相干的输入数据维度就行。
三维卷积常用于医学领域（CT影响），视频处理领域（检测动作及人物行为）。

3.2 3D卷积的计算

* 超参数：
– 过滤器个数：

– 滑动步长（Stride）：

– 填充值（Padding）：

其中输出层和输入层之间的参数关系为，

4 如何理解卷积神经网络中的通道（channel）

在卷积神经网络中我们通常需要输入 in_channels 和 out_channels ，即输入通道数和输出通道数，它们代表什么意思呢？

核心观点：

对于最初输入图片样本的通道数 in_channels 取决于 图片的类型，如果是彩色的，即RGB类型，这时候通道数固定为3，如果是灰色的，通道数为1。
卷积完成之后，输出的通道数 out_channels 取决于 过滤器的数量。从这个方向理解，这里的 out_channels 设置的就是过滤器的数目。
对于第二层或者更多层的卷积，此时的 in_channels 就是上一层的 out_channels ， out_channels 还是取决于过滤器数目。

在第2条用的是过滤器，而不是卷积核。

4.1 多通道

对于第1点和过滤器示例可以参考下图：

这里输入通道数是3，每个通道都需要跟一个卷积核做卷积运算，然后将结果相加得到一个特征图的输出，这里有4个过滤器，因此得到4个特征图的输出，输出通道数为4。

单个特征图的计算可看下图：

4.2 单通道

输入是灰色图片，输入通道数是1，卷积核有3个，做三次卷积操作，生成3个特征图，输出通道数为3。

单通道特征图的计算为：

这里可能会有人有疑惑为什么图片的类型是RGB的，它的通道数就是3呢？

这里要从计算机如何识别图片来考虑。在人眼中看到的图片是五颜六色，对于计算机来说就只是数字。那么计算机如何分辨图片颜色呢？——RGB。所有颜色都可以用这三种颜色来表示，因此我们只需要三个数字就可以表示一种颜色。

计算机要表示整张图片，就是用数字去表示整张图片的所有像素，但是每个像素需要三个数值来表示，于是就有了图片的3通道。每个通道分别表示RGB三种颜色。

最初的通道数是3，但是有的神经网络通道数目多达100多个，怎么理解呢？

我们依然可以类比RGB通道，对于多通道我们可以看做是颜色表示的更抽象版本，每一个通道都表示图像某一方面的信息。

卷积神经网络中二维卷积核与三维卷积核有什么区别？ – 知乎 ;

卷积神经网络（CNN）之一维卷积、二维卷积、三维卷积详解 – 程序员大本营

输入是7帧的灰度图。

对input 进行编码。

池化：只对空间维度进行池化。

卷积核是333，第一个3表示时间维度，后面两个表示空间维度

Original: https://blog.csdn.net/weixin_39910711/article/details/124310557
Author: 意念回复
Title: 卷积神经网络中二维卷积核与三维卷积核有什么区别？

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/619049/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习应用——监督学习（下）“手写数字识别”（神经网络实现&KNN实现）

前言机器学习应用博客中，将核心介绍三大类学习，即：无监督学习、监督学习、强化学习。本篇将简要介绍监督学习的”手写数字识别”实例运用MNIST数据集和D…

人工智能 2023年7月13日
0062
Linux进程间通信—信号量

一、概述进程间通信（interprocess communication，简称 IPC）指两个进程之间的通信。系统中的每一个进程都有各自的地址空间，并且相互独立、隔离，每个进程都…

人工智能 2023年6月27日
0079
TCN（Temporal Convolutional Network，时间卷积网络）

1 前言实验表明，RNN 在几乎所有的序列问题上都有良好表现，包括语音/文本识别、机器翻译、手写体识别、序列数据分析（预测）等。在实际应用中，RNN 在内部设计上存在一个严重的…

人工智能 2023年7月29日
0060
EasyOCR，识别图片中的文字真的so easy

原文链接：http://www.juzicode.com/image-ocr-python-easyocr 桔子菌之前在 pytesseract提取识别图片中的文字中介绍过怎么在…

人工智能 2023年6月17日
0088
关于二分类，多分类，及多标签分类的损失函数详解及Pytorch实现

相信很多小伙伴最开始都是从分类任务入手深度学习这个领域的吧，这个就类似学习代码的第一课，”Hello world”一样。深度学习中，除了模型设计之外，最重要…

人工智能 2023年6月19日
00113
【Python数据分析】数据挖掘建模——聚类分析

聚类算法是在没有给定划分类别的情况下，根据数据相似度进行样本分组的一种方法，是一种无监督学习方法。聚类的输入是一组未被标记的样本，聚类根据数据自身的距离或相似度将他们划分为若干组，…

人工智能 2023年6月19日
0086
深度学习面试题-4

声明1：可以通过将所有权重初始化为0 来训练网络。声明2：可以通过将偏差初始化为0来很好地训练网络以上哪些陈述是真实的？ A 1对2错B 1错2对C 1和2都对D 1和2都错 …

人工智能 2023年7月14日
0064
TransUnet官方代码训练自己数据集（彩色RGB3通道图像的分割）

码字不易，收藏之余，别忘了给我点个赞吧！ ———Start 官方代码：https://github.com/Beckschen/TransUNe…

人工智能 2023年7月19日
00145
Mac M1 踩坑之Tensorflow安装 && Processed finished with exit code 132

一.引言之前出过一期Mbp迁移至Mac Mini-M1的教程，使用期间主要使用java，无明显问题，今天尝试在pycharm使用tensorflow，安装conda后，impor…

人工智能 2023年5月26日
00104
pyecharts任意位置添加文字 + 自适应居中 + table表格居中

数据分析（3）以下是工作中遇到问题时，检索到比较好的案例，收集起来方便自己查看。同时，希望也能给遇到相同问题的同学节约时间，快速检索到解决方案。说下自己直观感受，以上3个…

人工智能 2023年7月15日
0063
零基础入门Jetson Nano——Yolov5+TensorRT+Deepstream

Jetson Nano学习——Yolov5+TensorRT+Deepstream 前言一、安装torch&&torchvision * 1、下载官方提供的tor…

人工智能 2023年5月26日
00132
【图像去噪】基于matlab高斯+均值+中值+双边滤波图像去噪【含Matlab源码 1872期】

⛄一、高斯+均值+中值+双边滤波图像去噪简介 1 数字图像去噪技术简述1.1 研究背景及目的图像是人类认识世界的第一视角,我们可以通过图像获得比较真实的信息和直观的结果。但实际上,…

人工智能 2023年6月18日
0097
基于PyTorch搭建CNN实现视频图片动作分类任务

1 前言对视频数据的处理是计算机视觉领域非常重要的一部分内容。视频主要是由大量的视频帧图像所构成。相比于单一的图像，视频中多出了时间维度的信息，物体在先后帧中出现的顺序和状态等信…

人工智能 2023年7月3日
00117
Log Cluster：日志数据聚类和模式挖掘算法

摘要：现代 IT 系统经常产生大量事件日志，事件模式发现就成了重要的日志管理任务。为完成此目标，数据挖掘方法已经预先给出了很多方式。本文提出 Log Cluster 算法，其继承了…

人工智能 2023年6月2日
0065
pytorch和tensorflow函数对应表

🥇作者简介：大家好我是 uu 给刚入门的python的小伙伴带来一套python 完整的入门基础。🥈个人主页：uu主页📑 推荐一款非常火的面试、刷题神器👉 牛客网python基础觉…

人工智能 2023年5月26日
0097
yolov5-pytorch训练自己的数据集-超详细

文章目录前言一、主要代码介绍 * 1.data文件夹 2.model文件夹 3.主要py文件 4.新建weights文件夹二、数据集准备三、训练与测试 * 1. 训练前准备…

人工智能 2023年7月9日
0071

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

卷积神经网络中二维卷积核与三维卷积核有什么区别？

2.1 单通道

2.2 多通道

2.3 2D卷积的计算

3.1 3D卷积

3.2 3D卷积的计算

4.1 多通道

4.2 单通道

大家都在看