Pytorch的nn.Conv2d（）参数详解

2023年6月25日下午9:17 • 人工智能 • 阅读 70

nn.Conv2d()的使用、形参与隐藏的权重参数

二维卷积应该是最常用的卷积方式了，在Pytorch的nn模块中，封装了nn.Conv2d()类作为二维卷积的实现。使用方法和普通的类一样，先实例化再使用。下面是一个只有一层二维卷积的神经网络，作为nn.Conv2d（）方法的使用简介：

class Net(nn.Module):
    def __init__(self):
        nn.Module.__init__(self)
        self.conv2d = nn.Conv2d(in_channels=3,out_channels=64,kernel_size=4,stride=2,padding=1)

    def forward(self, x):
        print(x.requires_grad)
        x = self.conv2d(x)
        return x

print(net.conv2d.weight)
print(net.conv2d.bias)

它的形参由Pytorch手册可以查得，前三个参数是必须手动提供的，后面的有默认值。接下来将一一介绍：

在Pytorch的nn模块中，它是不需要你手动定义网络层的权重和偏置的，这也是体现Pytorch使用简便的地方。当然，如果有小伙伴适应不了这种不定义权重和偏置的方法，Pytorch还提供了nn.Functional函数式编程的方法，其中的F.conv2d()就和Tensorflow一样，要先定义好卷积核的权重和偏置，作为F.conv2d（）的形参之一。回到nn.Conv2d上来，我们可以通过实例名.weight和实例名.bias来查看卷积层的权重和偏置，如上图所示。

in_channels

这个很好理解，就是输入的四维张量[N, C, H, W]中的C了，即输入张量的channels数。这个形参是确定权重等可学习参数的shape所必需的。

out_channels

也很好理解，即期望的四维输出张量的channels数，不再多说。

kernel_size

卷积核的大小，一般我们会使用5×5、3×3这种左右两个数相同的卷积核，因此这种情况只需要写kernel_size = 5这样的就行了。如果左右两个数不同，比如3×5的卷积核，那么写作kernel_size = (3, 5)，注意需要写一个tuple，而不能写一个列表（list）。

stride = 1

卷积核在图像窗口上每次平移的间隔，即所谓的步长。这个概念和Tensorflow等其他框架没什么区别，不再多言。

padding = 0

Pytorch与Tensorflow在卷积层实现上最大的差别就在于padding上。
Padding即所谓的图像填充，后面的int型常数代表填充的多少（行数、列数），默认为0。需要注意的是这里的填充包括图像的上下左右，以padding = 1为例，若原始图像大小为32×32，那么padding后的图像大小就变成了34×34，而不是33×33。

Pytorch不同于Tensorflow的地方在于，Tensorflow提供的是padding的模式，比如same、valid，且不同模式对应了不同的输出图像尺寸计算公式。而Pytorch则需要手动输入padding的数量，当然，Pytorch这种实现好处就在于 输出图像尺寸计算公式是唯一的，即

当然，上面的公式过于复杂难以记忆。大多数情况下的kernel_size、padding左右两数均相同，且不采用空洞卷积（dilation默认为1），因此只需要记 O = （I – K + 2P）/ S +1这种在深度学习课程里学过的公式就好了。

dilation = 1

这个参数决定了是否采用空洞卷积， 默认为1（不采用）。从中文上来讲，这个参数的意义 从卷积核上的一个参数到另一个参数需要走过的距离，那当然默认是1了，毕竟不可能两个不同的参数占同一个地方吧（为0）。

groups = 1

决定了是否采用分组卷积，现在用的比较多的是groups = in_channel。当groups = in_channel时，是在做的depth-wise conv的，具体思想可以参考MobileNet那篇论文。

bias = True

即是否要添加偏置参数作为可学习参数的一个，默认为True。

padding_mode = ‘zeros’

即padding的模式，默认采用零填充。

Original: https://blog.csdn.net/qq_19168521/article/details/115612529
Author: Akita·wang
Title: Pytorch的nn.Conv2d（）参数详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/651611/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【HAT】 Activating More Pixels in Image Super-Resolution Transformer

Activating More Pixels in Image Super-Resolution Transformer （在图像超分辨率transformer中激活更多的像素） …

人工智能 2023年5月28日
0079
pytorch一行实现：计算同一tensor矩阵内每行之间的余弦相似度

文章目录 0 输入数据 1 余弦相似度（Cosine Similarity） 2 torch.cosine_similarity 3 问题 4 分析与解决 * 4.1 答案 5 另…

人工智能 2023年7月22日
0089
简单快速建立pytorch环境YOLOv5目标检测模型跑起来(超简单）

简单快速建立pytorch环境+实现YOLOv5目标检测模型跑起来（超简单）一、下载yolov5模型代码： yolo代码提取码：2022 下载后解压二、简单快速创建pyto…

人工智能 2023年6月17日
0087
VIm环境配置教程

本文章主要介绍在MacOS环境下面如何配置和使用Vim编辑器。美化工作终端参考[[Centos7安装zsh和oh-my-my-zsh]] Vim是什么？ vim vim是一个历史悠…

人工智能 2023年6月4日
0089
图像平滑处理

图像滤波是图像处理和计算机视觉中最常用、最基本的操作。主要是去除图像中的噪声，因为图像平滑处理过程中往往会使得图像变的模糊，因此又叫模糊处理。基本原理图像平滑的基本原理是，将噪…

人工智能 2023年6月19日
0076
吴恩达机器学习python实现（6）：SVM支持向量机（文末附完整代码）

所有的数据来源：链接：https://pan.baidu.com/s/1vTaw1n77xPPfKk23KEKARA提取码：5gl2 1 Support Vector Machin…

人工智能 2023年6月15日
00121
计算机网络（二）—— 物理层（4、5）：编码与调制、信道的极限容量

计算机网络系列内容的学习目录→ \rightarrow →谢希仁计算机网络学习系列内容汇总。 4. 编码与调制 * 4.1 常用编码 4.2 基本调制方法 4.3 混合调制 4.4…

人工智能 2023年5月25日
0094
过滤器的准确性如何衡量？有哪些评估方法和指标可用于评估和比较不同过滤器的性能

问题背景介绍在机器学习和数据挖掘领域中，过滤器被广泛应用于数据预处理、降噪、信息提取等任务中。过滤器的准确性是衡量其性能的重要指标之一。准确性的高低决定了过滤器对于输入数据的筛选…

人工智能 2024年1月5日
0058
0动态规划中等 LeetCode790. 多米诺和托米诺平铺

790. 多米诺和托米诺平铺描述有两种形状的瓷砖：一种是 2 x 1 的多米诺形，另一种是形如 “L” 的托米诺形。两种形状都可以旋转。给定整数 n …

人工智能 2023年6月28日
00103
海康工业相机SDK+OpenCV实例(2)：RawDataFormatConvert详解

海康工业相机SDK+OpenCV实例(2)： RawDataFormatConvert详解文章目录海康工业相机SDK+OpenCV实例(2)： RawDataFormatCon…

人工智能 2023年5月28日
00109
时空AI核心技术：时空知识图谱 | 维智科技

时空AI核心技术：时空知识图谱 | 维智科技时空知识图谱不单单是一个”增强型”的开放域知识图谱，而是需要结合业务场景和领域知识，并针对时空知识自身的特点，…

人工智能 2023年6月1日
0078
因果信号的傅里叶变换_常用信号的傅里叶变换对

第一部分：傅里叶变换的推导和常见信号的傅里叶变换(续) [En] The first part: the derivation of Fourier transform and t…

人工智能 2023年5月27日
0085
Go语言笔记-基础篇

视频(P1-P49)：【狂神说】Go语言零基础学习视频通俗易懂 1. 安装去 Go语言中文网下载安装包，一路下一步。然后配置环境变量 GOROOT、 GOPATH。 GOROOT…

人工智能 2023年6月27日
0088
最详细的Excel模块Openpyxl教程（五）-结合Numpy和Pandas

在上次的推文中，我们介绍了使用Openpyxl来进行数据的过滤和排序的操作，相关推文可以从本公众号的底部相关菜单获取。在那篇推文中我们使用到了Pandas。因此本次推文我们就来看…

人工智能 2023年7月7日
0068
labelme 构造自己的数据集

文章目录前言一、labelme是什么？二、安装三、使用前言在我们训练模型的过程中，都是用的现成的数据集比如cifar10数据集等，在我们实际运用过程中，肯定要训练自己的…

人工智能 2023年6月24日
0096
一款高速的NET版的离线免费OCR

一款基于Paddle的OCR，项目使用ONNX模型，速度更快。本项目同时支持X64和X86的CPU上使用。本项目是一个基于PaddleOCR的C++代码修改并封装的.NET的工具类…

人工智能 2023年6月4日
00113

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31