深度学习 1×1卷积核的作用

2023年6月17日上午3:25 • 人工智能 • 阅读 102

一、简述

Inception v1（又名GooLeNet）、VGG等神经网络结构中加入了 1×1卷积核操作，为什么要进行1×1卷积核呢？使用 1×1卷积核其实也可以看成是一种全连接。接下来介绍一下使用 1×1卷积核有哪些作用。

二、1×1卷积核的作用

1、降维/升维

1×1卷积核可以通过控制卷积核数量实现降维或升维。

卷积层流程图

从卷积层流程图中可以清楚的看到卷积后的特征图通道数与卷积核的个数是相同的。所以，如果想要升维或降维，只需要通过修改卷积核的个数即可。

举例：如果input的通道个数是3，卷积核个数为4，那么特征图的通道数就为4，达到了升维效果。如果input的通道个数是3，卷积核个数为1，那么特征图的通道数就为1，达到了降维效果。

而1×1卷积核与 3×3 或 5×5 等尺寸更大的卷积核相比有什么优势呢？

优势就在于 1×1卷积核会使用更少的权重参数数量。

举例：Inception v1（又名GooLeNet）的神经网络结构图：

左侧是未加入 1×1卷积核的 Inception，右侧是通过加入 1×1卷积核来实现降维的 Inception。接下来解释这张图：

输入层特征维数： 28x28x192
三种尺寸卷积核大小及卷积通道数分别为 1x1x64 、 3x3x128 、5x5x32
右侧图（b）中，在 3×3 卷积之前增加了 1×1的卷积核，且卷积核个数为96 ； 5×5 卷积之前增加了 1×1的卷积核，且卷积核个数为16; 3×3 max pooling后增加了1×1的卷积核，且卷积核个数为32。

左侧图（a）中间层所需参数数量：（1x1x192x64）+ (3x3x192x128) + (5x5x192x32) = 387072

右侧图（b）中间层所需参数数量： (1x1x192x64) + (1x1x192x96) + (1x1x192x16) + (3x3x96x128) + (5x5x16x32) + (1x1x192x32) = 163328

由此可见，右侧图（b）中网络架构中间层所有参数量比左侧图（a）缩小了一大半。

; 2、增加网络深度（增加非线性）

每使用 1×1卷积核，及增加一层卷积层，所以网络深度得以增加。而使用 1×1卷积核后，可以保持特征图大小与输入尺寸相同，卷积层卷积过程会包含一个激活函数，从而增加了非线性。

在输入尺寸不发生改变的情况下而增加了非线性，所以会增加整个网络的表达能力。

3、跨通道信息交互（通道的变换）

使用1×1卷积核，实现降维和升维的操作其实就是 channel 间信息的线性组合变化。

比如：在尺寸 3×3，64通道个数的卷积核后面添加一个尺寸1×1，28通道个数的卷积核，就变成了尺寸3×3，28尺寸的卷积核。原来的64个通道就可以理解为跨通道线性组合变成了28通道，这就是通道间的信息交互。

注意：只是在通道维度上做线性组合，W和H上是共享权值的滑动窗口。

三、参考博文

https://zhuanlan.zhihu.com/p/40050371?ivk_sa=1024320u

https://blog.csdn.net/a1154761720/article/details/53411365

https://blog.csdn.net/briblue/article/details/83151475

Original: https://blog.csdn.net/qq_27278957/article/details/120209780
Author: 高祥xiang
Title: 深度学习 1×1卷积核的作用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628221/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【问题解决】kersa ModuleNotFoundError: No module named ‘keras_applications‘ kersa_vggface

项目场景： 提示：这里简述…

人工智能 2023年5月23日
0088
Python作业题：组合数据类型（带有答案和详细分析过程）

本次作业涉及到的知识点获取变量地址的id函数（1 Python列表的浅复制和深复制（1 字符串join函数的使用（2 列表的遍历（3 列表元素的排序（4 列表的常用方法（5 作业…

人工智能 2023年7月31日
0089
动手学数据分析 — 2021-11-15

第一章数据的载入及pandas基础 ——参考链接：https://www.cnblogs.com/traditional/p/12514914.html 方法一：df.colum…

人工智能 2023年7月7日
0055
pandas中的read_csv参数详解

1.官网语法 pandas. read_csv (filepath_or_buffer, sep=NoDefault.no_default, delimiter=None, hea…

人工智能 2023年6月19日
00101
模式识别（一）绪论

当萌心第一次写博客时，她决定从专业课程笔记的形式开始。 [En] When Mengxin wrote a blog for the first time, she decided…

人工智能 2023年5月27日
00107
VTK实现三维模型的导出保存，STL、OBJ和PLY等格式

基于之前的博客中实现的三维模型，将其导出保存为3D格式的文件，生成的文件可以使用通用的3D浏览器进行查看。附录的代码实现中各变量的命名使用可以查照之前的博客。 1.STL 保存 S…

人工智能 2023年6月17日
00161
1045 Favorite Color Stripe

Eva is trying to make her own color stripe out of a given one. She would like to keep only…

人工智能 2023年6月28日
00176
Scala系列-2、scala函数式编程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。传送门：大数据系列文章目录目录 * – foreach算子 …

人工智能 2023年6月28日
0071
数据库系统概论第五版_第二章：关系数据库

关系模式的三个组成部分：数据结构（数据的组织方式）关系操作（数据的增删查改怎么进行）关系的完整性（数据之间的联系）关系的形式化定义关系是一种数据结构，是一张二维表。其行称…

人工智能 2023年6月1日
0075
注意力机制——Coordinate Attention

目录摘要 1 介绍 2 相关工作 2.1 Mobile Network 2.2 注意力机制 3 Coordinate Attention 3.1 Revisit SE Block…

人工智能 2023年6月17日
0094
时空结合贝叶斯先验

分类问题一直是机器学习与人工智能领域的基础的研究方向之一。具体到生物识别领域时，如果两个物种的外观差异比较大，仅基于某些特征数据或是图像识别就能得到比较好的结果。但是如果两种生物的…

人工智能 2023年7月2日
0079
2021年度十大开源SLAM算法

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月23日
0095
浅谈构建个人资料库和知识库

当下我们正处在以整个互联网大环境作为基础的” 微时代“，呈现的是一个” 信息爆炸“的时代，它具有” 去中心化&#8220…

人工智能 2023年6月1日
0087
模式识别使用Fish分类算法和感知器分类算法——Fisher线性判别算法

挂一下之前的数据集准备工作的链接模式识别使用Fish分类算法和感知器分类算法——数据集可视化和特征选择_qq_45709176的博客-CSDN博客一、数据集简介本次实验所选取的数…

人工智能 2023年7月1日
00106
【数据科学】06 数据转换-数据离散化、编码分类特征（哑变量矩阵、数字编码）

数据转换的目的是将数据转换为需要的数据格式，便于后续的分析通常情况下，数据集中可能存在两种类型的特征：连续特征连续特征的值用数值（整数或浮点数）表示，有测量单位，可进行加减、…

人工智能 2023年7月1日
0073
opencv改变图片大小，cv2.resize方法详解

cv2.resize可以改变图片的尺寸，方法如下 def resize(src, dsize, dst=None, fx=None, fy=None, interpolation=…

人工智能 2023年6月18日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习 1×1卷积核的作用

1、降维/升维

; 2、增加网络深度（增加非线性）

3、 跨通道信息交互（通道的变换）

大家都在看

3、跨通道信息交互（通道的变换）