Tensorflow 1.x 和 Pytorch 中 Conv2d Padding的区别

2023年5月24日下午7:15 • 人工智能 • 阅读 83

Tensorflow 和 Pytorch 中 Conv2d Padding的区别

Pytorch中Conv2d的Padding

Tensorflow 1.x 和 Pytorch 中 Conv2d Padding的区别

它可以有三种形式：整数、二进制和字符串。

[En]

It can be in three forms: integer, binary, and string.

整数(int)。如果输入的padding为整数则代表在上，下，左，右四个方向都充填一样数量的0或者由 padding_mode 确定的padding类型。
二元组(tuple)。如果输入的padding 为二元组(padding[0]，padding[1])，则padding[0]代表上下两个方向的padding大小，padding[1]则代表左右两个方向的padding大小。
字符串(str)。字符串模式可选参数为 valid和 same， valid模式表示不充填， same模式表示输入与输出的形状大小保持一致(但是仅仅适用于stride=1的情况！！！)

可以看出pytorch都是对称的进行padding，要么是四个方向都是一样的padding，要么上下或左右做一样的padding。

最终的输出形状计算公式如下：

[En]

The final output shape calculation formula is as follows:

H o u t = ⌊ H i n + 2 × padding [ 0 ] − dilation [ 0 ] × ( kernel_size [ 0 ] − 1 ) − 1 stride [ 0 ] + 1 ⌋ H_{out} = \left\lfloor\frac{H_{in} + 2 \times \text{padding}[0] – \text{dilation}[0] \times (\text{kernel_size}[0] – 1) – 1}{\text{stride}[0]} + 1\right\rfloor H o u t =⌊stride [0 ]H i n +2 ×padding [0 ]−dilation [0 ]×(kernel_size [0 ]−1 )−1 +1 ⌋

W o u t = ⌊ W i n + 2 × padding [ 1 ] − dilation [ 1 ] × ( kernel_size [ 1 ] − 1 ) − 1 stride [ 1 ] + 1 ⌋ W_{out} = \left\lfloor\frac{W_{in} + 2 \times \text{padding}[1] – \text{dilation}[1] \times (\text{kernel_size}[1] – 1) – 1}{\text{stride}[1]} + 1\right\rfloor W o u t =⌊stride [1 ]W i n +2 ×padding [1 ]−dilation [1 ]×(kernel_size [1 ]−1 )−1 +1 ⌋

; Tensorflow 中 Conv2d的padding

可以是字符串和列表两种形式:

字符串。字符串是可选 SAME和 VALID。 SAME模式下，根据以下公式计算各方向的padding:

P a d H = m a x ( f i l t e r H − ( I n H % s t r i d e H ) , 0 ) Pad_{H} = max(filter_H – (In_H \space \% \space stride_H),0)P a d H =m a x (f i l t e r H −(I n H %s t r i d e H ),0 )

P a d W = m a x ( f i l t e r W − ( I n W % s t r i d e W ) , 0 ) Pad_{W} = max(filter_W – (In_W \space \% \space stride_W),0)P a d W =m a x (f i l t e r W −(I n W %s t r i d e W ),0 )

P a d t o p = ⌊ P a d H 2 ⌋ Pad_{top} =\left\lfloor \frac{Pad_{H}}{2} \right\rfloor P a d t o p =⌊2 P a d H ⌋

P a d b o t t o m = P a d H − P a d t o p Pad_{bottom} = Pad_{H} – Pad_{top}P a d b o t t o m =P a d H −P a d t o p

P a d l e f t = ⌊ P a d W 2 ⌋ Pad_{left} = \left\lfloor \frac{Pad_{W}}{2} \right\rfloor P a d l e f t =⌊2 P a d W ⌋

P a d r i g h t = P a d W − P a d l e f t Pad_{right} = Pad_{W} – Pad_{left}P a d r i g h t =P a d W −P a d l e f t

不同于pytorch，tensorflow的 SAME模式适用于任何的Stride时的padding，输出的形状为:
O u t H = I n H s t r i d e Out_{H} = \frac{In_{H}}{stride}O u t H =s t r i d e I n H

O u t W = I n W s t r i d e Out_{W} = \frac{In_{W}}{stride}O u t W =s t r i d e I n W

可以看出，tensorflow的padding不要求是对称的，上下左右的padding大小都可以不一样，而且优先进行右边和下边的padding(因为 SAME模式设计的初衷就是为了应对输出形状无法整除卷积核大小，而导致的最右边或最下边无法卷积的情况)，当你不关心padding的方向和大小，只关心输出的形状是不是原来形状的整数倍时，就可以无脑使用 SAMEpadding 模式，tensorflow会自动帮你计算好要padding的大小。

VALID模式下，与pytorch一样，直接不padding 。当输入形状不能整除卷积核大小，滑动窗口滑到最右边发现无法满足卷积条件时，多出来的那部分直接会被舍弃掉，输出的形状为：
O u t H = I n H − f i l t e r H + 1 s t r i d e H Out_{H} = \frac{In_H – filter_H + 1}{stride_{H}}O u t H =s t r i d e H I n H −f i l t e r H +1

O u t W = I n W − f i l t e r W + 1 s t r i d e W Out_{W} = \frac{In_W – filter_W + 1}{stride_{W}}O u t W =s t r i d e W I n W −f i l t e r W +1

列表(list)。Tensor格式为默认的“NHWC” 时， padding list的格式为 [[0,0]，[pad_top，pad_bottom]，[pad_left，pad_right]，[0,0]]；采用的“NCHW”格式存储的Tensor时，padding list 的格式为 [[0,0]，[0,0]，[pad_top，pad_bottom]，[pad_left，pad_right]]。输出的形状为:

O u t H = I n H + pad t o p + pad b o t t o m − dilation H × ( filter H − 1 ) − 1 stride H Out_{H} = \frac{In_{H} + \text{pad}{top}+\text{pad}{bottom} – \text{dilation}{H} \times (\text{filter}{H}- 1) – 1}{\text{stride}_{H}}O u t H =stride H I n H +pad t o p +pad b o t t o m −dilation H ×(filter H −1 )−1

O u t W = I n W + pad r i g h t + pad l e f t − dilation W × ( filter W − 1 ) − 1 stride W Out_{W} = \frac{In_{W} + \text{pad}{right}+\text{pad}{left} – \text{dilation}{W} \times (\text{filter}{W}- 1) – 1}{\text{stride}_{W}}O u t W =stride W I n W +pad r i g h t +pad l e f t −dilation W ×(filter W −1 )−1

注意: Tensorflow 和 Pytorch 中Conv2D 对输出的形状大小的小数部分处理不一样。Pytorch中都是做 截断处理 ，或者说 向下取整 ，例如输出若为 117.5 则直接取 117；而Tensorflow中对小数的处理采用的则是 向上取整 ，输出若为117.5，则取128。

参考

https://www.tensorflow.org/api_docs/python/tf/nn#notes_on_padding_2

https://www.tensorflow.org/api_docs/python/tf/nn/conv2d

https://pytorch.org/docs/stable/generated/torch.nn.Conv2d.html

Original: https://blog.csdn.net/daimashiren/article/details/123708688
Author: daimashiren
Title: Tensorflow 1.x 和 Pytorch 中 Conv2d Padding的区别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/508987/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[附源码]Python计算机毕业设计Django海南与东北的美食文化差异及做法的研究展示平台

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0067
GAN手写体生成(MINIST)

参考教材：人工智能导论(第4版) 王万良高等教育出版社实验环境：Python3.7 + Tensor flow 2.1 人工智能导论实验导航实验一：斑马问题 https://b…

人工智能 2023年7月13日
0071
MindSpore尝鲜之爱因斯坦求和

技术背景在前面的博客中，我们介绍过关于numpy中的张量网络的一些应用，同时利用相关的张量网络操作，我们可以实现一些分子动力学模拟中的约束算法，如LINCS等。在最新的night…

人工智能 2023年6月4日
0095
gbdt python_GBDT回归的原理及Python实现

一、原理篇 1.1 温故知新回归树是GBDT的基础，之前的一篇文章曾经讲过回归树的原理和实现。链接如下： 1.2 预测年龄仍然以预测同事年龄来举例，从《回归树》那篇文章中我们可以知…

人工智能 2023年6月18日
0045
YOLOv5 目标框回归(三)

文章目录 * – 1. 目标框标注格式 – 2. 目标框的回归 – + YOLOv/v4目标框回归公式: + YOLOv5目标框回归计算公式，和…

人工智能 2023年6月17日
0074
Azure AI的又一里程碑，Neural TTS新模型呈现真人般情感饱满的AI语音

在人与人之间的对话中，即使是同样的字句，也会因为所处情景和情感的不同而表现出丰富的抑扬顿挫，而这种动态性恰恰是各种AI合成语音的”软肋”。相比于人类讲话时丰…

人工智能 2023年5月23日
0085
C++构造函数

类的6个默认的成员函数: 类中如果什么都没有定义:—有六个默认的成员函数: 构造函数:主要完成对象的初始化工作析构函数:主要完成对象中资源的清理工作拷贝构造函数:拷…

人工智能 2023年6月28日
0062
基于OpenCV的摄像头测距（2022-1-1）

基于OpenCV的摄像头测距前言去年暑假参加了一个比赛，比赛内容中需要确定目标的位置本来想全用图像完成的，最后发现不是很符合要求。比完赛之后，就忙别的事了。直到现在突然想试试…

人工智能 2023年6月19日
0078
Python 之Opencv的Numpy函数：矩形框四个顶点顺时针排序

学习目标图像处理可以简单理解为对数据处理的过程，针对图像中一个矩形区域给出的4 个顶点坐标，按照固定顺序对4 个顶点坐标进行顺时针排序。坐标的这种排序方式是进行透视变换、匹配对象…

人工智能 2023年5月28日
0068
基于Python+MySQL的图书管理系统

目录前言一、开发环境与开发工具二、系统需求分析三、系统功能分析四、数据库设计1、数据库概念结构设计（1）数据流程图（2）系统ER图2、数据库逻辑结构设计3、数据库物理结构设计五、…

人工智能 2023年7月5日
0071
【小样本学习】ICLR2022：基于原型记忆力和注意力机制的少样本图像生成

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月3日
0093
Jetson Xavier NX基于YOLOv5+CSI摄像头实现目标检测

Jetson Xavier NX基于YOLOv5+CSI摄像头实现目标检测文章目录 * Jetson Xavier NX基础环境搭建 – 基础环境搭建踩坑指南 + 1…

人工智能 2023年5月26日
00104
物理信息驱动的深度学习方向重要进展与趋势

喜欢可点赞关注，并收藏，您的支持就是我的写作的动力物理信息驱动的深度学习(PINN)方向重要进展与趋势物理信息驱动的深度学习入门到详解近年来，物理信息驱动的深度学习方法发展迅…

人工智能 2023年6月17日
00101
应用回归分析（知识点整理）（一）

文章目录一、回归分析概述 * 1、回归分析、相关分析的联系与区别 2、建模的基本步骤二、一元线性回归 * 1、模型的基本假设 2、参数估计方法（思想，性质（最小二乘和极大似然估…

人工智能 2023年6月17日
0063
Pytorch安装方法（使用清华源安装）

一般按默认选项一步一步安装即可，安装完成之后，在开始列表找到Anaconda Prompt打开，可以看到（base）C:\Users\Zlw，表示安装成功。注1： anacond…

人工智能 2023年6月15日
00113
从0开始的深度学习——【tensorflow】创建一个神经网络

我们用 tf.keras来创建神经网络：什么是 tf.keras?,简单地说就是tensorflow中已经帮你封装好的一些包，它的作用是可以帮你快速搭建网络模型。我们以创建一个能…

人工智能 2023年5月24日
00102

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tensorflow 1.x 和 Pytorch 中 Conv2d Padding的区别

Pytorch中Conv2d的Padding

; Tensorflow 中 Conv2d的padding

大家都在看