torch.nn.Conv1d计算过程简易图解

2023年7月5日上午9:29 • 人工智能 • 阅读 82

参考：
Pytorch 从 0 开始学（6）——Conv2d 详解 – 知乎 (zhihu.com)
Conv1d — PyTorch 1.11.0 documentation

本文结合图例说明Conv1d的基本计算过程。

Conv1d

torch.nn.Conv1d(in_channels, out_channels, kernel_size,
    stride=1, padding=0, dilation=1, groups=1,
    bias=True, padding_mode='zeros', device=None, dtype=None)

输入维度(N, Cin, Lin)
输出维度(N, Cout, Lout)

这里，N为batchsize，C i n , C o u t C_{in}, C_{out}C i n ,C o u t 分别表示输入输出channel数，L i n , L o u t L_{in}, L_{out}L i n ,L o u t 分别表示输入输出的channel内信号长度。
下文简写作Cin、Cout、Lin、Lout。

关键参数如下:

in_channels, out_channels: 输入输出通道数
kernel_size: 卷积核长度
stride=1: 卷积核步长
padding=0, padding_mode=’zeros’: 边沿扩充, 目前略过
dilation=1: 采样间隔
bias=True: 是否加入bias

计算过程

输入输出维度

本文关注简单情形，假设采用默认参数(即 stride=1, padding=0, dilation=1)，
则 L o u t = L i n − k e r n e l _ s i z e + 1 L_{out} = L_{in} – kernel_size + 1 L o u t =L i n −k e r n e l _s i z e +1。

参数假设：

模型：Cin = 4，Cout = 3，kernel_size = 2。
输入：batchsize=1, Cin = 4, Lin = 3，即shape为（1, 4, 3）

Lout 计算

由上述公式：

Lout = 3 – 2 + 1 = 2，见下图：

因此输出维度 (Cout, Lout) 为 (3, 2)。

下面将由这个例子出发，说明计算过程。
in, out分别表示输入、输出tensor。

; 模型参数

模型有两类可学习参数：

weight: shape = (Cout, Cin, kernel_size) = (3, 4, 2)
bias: bias=True 时有效, shape = (Cout) = (3)

互相关(cross-correlation)计算

根据 pytorch 的计算公式:

o u t ( j ) = b i a s ( j ) + ∑ i = 0 C i n − 1 w e i g h t ( j , i ) ⋆ i n ( i ) out(j) = bias(j) + \sum_{i=0}^{C_{in}-1} weight(j, i) \star in(i)o u t (j )=b i a s (j )+i =0 ∑C i n −1 w e i g h t (j ,i )⋆i n (i )

其中 ⋆ \star ⋆ 表示互相关算符(cross-correlation operator), 下面以 w e i g h t ( j , i ) ⋆ i n ( i ) weight(j, i) \star in(i)w e i g h t (j ,i )⋆i n (i ) 为例, 取 j=1, i=2。

求和符号 Σ 后每一项的计算过程如下图：

weight 以”窗口滑动”的方式, 与 in(2) 中的元素(i0, i1, i2)依次运算。
计算结果为(j1, j2)，构成输出的一部分。

最终 out(j) 的计算方式如下图：

求 out(1)，需要用到 weight(1,*) 和 bias(1)。
对输入的每个 channel i，与 weight(1,i) 运算后得到 Cin 个新向量，这里是 4 个 (1, 2) 向量[蓝/白色]。
4 个向量直接相加，合并为 1 个向量[黄色]。
合并后的向量各个位置加上 bias(1) [灰色]，就得到了最终的 out(1)[橙色]。

; 过程总结

最终的out由out(1)、out(2)、out(3)拼接而成, 整体过程总结如下:

对输入的每个 channel，都算出一个与输出 shape 一致的 tensor，然后叠加。最后再加上 bias，即为输出。

Cin 维度上：每个 in_channel 影响所有 out_channel，反过来每个 out_channel 也可包含所有 in_channel 的信息。
Lin 维度上：通过 weight 将长为 kernel_size 的一段元素联系起来。

验证

python 代码如下，可以验证上述过程：

import numpy as np
import torch
import torch.nn as nn

conv = nn.Conv1d(in_channels=4, out_channels=3, kernel_size=2)
bias = torch.FloatTensor([0.1, 0.2, 0.3])
weight = np.arange(24).reshape(3,4,2)
weight = torch.FloatTensor(weight)
for name, param in conv.named_parameters():
    if name == 'weight':
        param.data = weight
    if name == 'bias':
        param.data = bias
    print(name, param.shape, param)

input = [
    [0,0,0],
    [0,0,1],
    [0,1,1],
    [1,1,1]
]
input = torch.FloatTensor(input).reshape(1,4,3)
with torch.no_grad():
    print('\ninput:\n', input)
    output = conv(input)
    print('output:\n', output)

输出结果为：


weight torch.Size([3, 4, 2]) Parameter containing:
tensor([[[ 0.,  1.],
         [ 2.,  3.],
         [ 4.,  5.],
         [ 6.,  7.]],

        [[ 8.,  9.],
         [10., 11.],
         [12., 13.],
         [14., 15.]],

        [[16., 17.],
         [18., 19.],
         [20., 21.],
         [22., 23.]]], requires_grad=True)
bias torch.Size([3]) Parameter containing:
tensor([0.1000, 0.2000, 0.3000], requires_grad=True)

input:
 tensor([[[0., 0., 0.],
         [0., 0., 1.],
         [0., 1., 1.],
         [1., 1., 1.]]])
output:
 tensor([[[ 18.1000,  25.1000],
         [ 42.2000,  65.2000],
         [ 66.3000, 105.3000]]])

Original: https://blog.csdn.net/weixin_42410798/article/details/124451826
Author: Hughpp
Title: torch.nn.Conv1d计算过程简易图解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/671504/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

全球与中国无线演示器行业市场前瞻及未来发展趋向预测报告2022-2028年

全球与中国无线演示器行业市场前瞻及未来发展趋向预测报告2022-2028年 /-/-/-/-/-/-/-/-/-/-/-/-/*-详情内容请咨询鸿晟信合研究网！【全新修订】：202…

人工智能 2023年7月15日
0066
目标检测的Tricks | 【Trick12】分布式训练（Multi-GPU）与DistributedParallel使用相关总结

如有错误，恳请指出。用这篇博客记录多卡（也就是mutil-gpu）的使用，目的是加快训练过程，在pytorch中称之为分布式训练。在pytorch中主要使用的是Distribut…

人工智能 2023年7月12日
0065
R语言ggplot2绘图

R语言绘图之ggplot2 一.绘图的基本要素 * 1.图形映射 2.分面： 3.添加平滑曲线二.绘制条形图设置坐标抽格式一.绘图的基本要素首先载入tidyverse包 i…

人工智能 2023年7月14日
0056
【canny边缘检测】canny边缘检测原理及代码详解

文章目录前言 canny边缘检测算法主要流程一、高斯模糊二、图像梯度计算三、非极大值抑制四、双阈值边界跟踪前言本文通过介绍canny边缘检测原理与代码解析，希望能让大…

人工智能 2023年6月17日
0061
TensorRT(二)TensorRT使用教程（Python版）

一、前言 1.1 本文目标本文主要是宏观地阐述一下如何使用TensorRT来部署深度学习模型以实现对模型的加速，从而提高深度学习模型运行的效率，根据我自己的实测，确实可以达到官方…

人工智能 2023年6月16日
0067
不平衡数据分类网络-Pytorch试验

不平衡数据分类网络-Pytorch试验注意：本试验在参考此代码的基础上。为方便起见，之后简称A 1.1 制作不平衡数据集 (下载的为平衡数据集) 脚本：cifar10_to_pn…

人工智能 2023年7月1日
0070
为什么CUDA装好了，Tensorflow-GPU不能用？

原因 * – 1.CUDA、cudnn、Tensorflow、python版本并不配套！！！（大多都是这个原因） – 2.CUDA没有装好： –…

人工智能 2023年5月25日
0076
Grad-CAM源码保姆级讲解（pytorch）

博客中代码已上传至：https://github.com/974938429/Grad-CAM Grad-CAM是2019年发表在IJCV上的一篇文章，其目的是不更改网络结构的情况…

人工智能 2023年6月16日
00112
《Spatial-Spectral T ransformer for Hyperspectral Image Classification》论文笔记

论文题目《Spatial-Spectral T ransformer for Hyperspectral Image Classification》论文作者：Xin He 1 , …

人工智能 2023年6月3日
0069
神经网络对多变量的性别结果预测

神经网络这几年可谓是火得一塌糊涂，它是目前最为火热的研究方向——深度学习的基础。在神经网络刚被发明之初，人们欢呼雀跃，认为是创造出来了比人更强的思维怪兽。它类比于人的神经元的工作方…

人工智能 2023年6月26日
0088
关于GAN训练过程中的报错：one of the variables needed for gradient computation has been modified by an inplace

首先说明，按照我目前的查询，这可能是全网唯一公开的正确解决方法，所以一定要看下去在github和百度上搜索gan示例代码的时候，通常会得到下面这种代码：先更新辨别器，再更新生成器…

人工智能 2023年7月22日
0044
一文读懂K-Means原理与Python实现

目录一、K-Means原理 1.聚类简介 ①分层聚类 ②质心聚类 ③其他聚类 2.K-means的原理 3.K-means的应用场景二、K-Means的案例实战 1.数据查看 …

人工智能 2023年6月23日
0056
OpenART mini使用教程

前言 OpenART mini 是我们在 NXP 的 OpenART 套件的基础上，去除非视觉部分而制作出来的迷你版。虽说只是迷你版，但”麻雀虽小，五脏俱全&#8221…

人工智能 2023年7月28日
00171
CUDA out of memory. Tried to allocate 16.00 MiB (GPU 0； 6.00 GiB total capacity；总结（1）

CUDA out of memory. Tried to allocate 16.00 MiB (GPU 0; 6.00 GiB total capacity; 4.54 GiB …

人工智能 2023年6月17日
0068
数字图像隐写术之JPEG 隐写分析

目录问题描述一、程序功能 1.程序功能描述（task1-task5为五个主程序，其余为辅程序） 2.程序输入 3.程序输出二、隐写分析原理三、程序设计四、总结讨论及探索 …

人工智能 2023年6月18日
0063
DolphinScheduler 集群部署

上传相关组件apache-dolphinscheduler-2.0.5-bin.tar.gzmysql-connector-java-8.0.16.jar tar -zxvf ap…

人工智能 2023年6月28日
0095

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30