Pytorch中卷积层转向全连接层时，全连接层输入维度的确定

2023年7月21日下午11:50 • 人工智能 • 阅读 62

Pytorch中卷积层转向全连接层时，全连接层输入维度的确定

*
– 一、代码法：
–
+ 改变的AlexNet网络结构：
+ AlexNet
– 二、公式法：

一、代码法：

改变的AlexNet网络结构：

输入维度为（ N ， 1 , 100 ， 100 ）（N，1, 100，100）（N ，1 ,1 0 0 ，1 0 0 ），N N N为输入的样本数。

import torch.nn as nn
import torch.nn.functional as F
import torch
from torchsummary import summary

class AlexNet(nn.Module):
    def __init__(self):
        super(AlexNet, self).__init__()
        self.conv1 = nn.Conv2d(1, 96, 11, stride=2)
        self.conv2 = nn.Conv2d(96, 256, 5, stride=1, padding=2)
        self.conv3 = nn.Conv2d(256, 384, 3, stride=1, padding=1)
        self.conv4 = nn.Conv2d(384, 384, 3, stride=1, padding=1)
        self.conv5 = nn.Conv2d(384, 256, 3, stride=1, padding=1)
        self.fc1 = nn.Linear(256*6*6, 4096)
        self.fc2 = nn.Linear(4096, 4096)
        self.fc3 = nn.Linear(4096, 1000)

    def forward(self, x):
        out = F.relu(self.conv1(x))
        out = F.max_pool2d(out, 2)
        out = F.relu(self.conv2(out))
        out = F.max_pool2d(out, 2)
        out = F.relu(self.conv3(out))
        out = F.relu(self.conv4(out))
        out = F.relu(self.conv5(out))
        out = F.max_pool2d(out, 2)
        out = out.view(out.size(0), -1)
        out = F.relu(self.fc1(out))
        out = F.relu(self.fc2(out))
        out = self.fc3(out)
        return out

以 AlexNet 网络结构为例，如上代码。在 AlexNet的基础上，将第一层的卷积层的输入通道变成1。代码法相对直观，随机产生一个维度的数据作为调试，我们选择的维度为（ 1 , 100 , 100 ）（1,100,100）（1 ,1 0 0 ,1 0 0 ），代码如下：

net = AlexNet()
image = torch.randn(2, 1, 100, 100)
out = F.relu(net.conv1(image))
out = F.max_pool2d(out, 2)
out = F.relu(net.conv2(out))
out = F.max_pool2d(out, 2)
out = F.relu(net.conv3(out))
out = F.relu(net.conv4(out))
out = F.relu(net.conv5(out))
out = F.max_pool2d(out, 2)
out.size()

得到输出为：

torch.Size([2, 256, 5, 5])

卷积层的输出维度为：（2, 256, 5, 5）。
全连接层的输入维度为卷积层的输出维度为：256 × 5 × 5 256\times 5\times 5 2 5 6 ×5 ×5 。则 AlexNet中下面的这行代码：

self.fc1 = nn.Linear(256*6*6, 4096)

需要改为：

self.fc1 = nn.Linear(256*5*5,4096)

全连接层输入的维度为每个图片总的像素点个数。

AlexNet

import torch.nn as nn
import torch.nn.functional as F
import torch
from torchsummary import summary

class AlexNet(nn.Module):
    def __init__(self):
        super(AlexNet, self).__init__()
        self.conv1 = nn.Conv2d(3, 96, 11, stride=4)
        self.conv2 = nn.Conv2d(96, 256, 5, stride=1, padding=2)
        self.conv3 = nn.Conv2d(256, 384, 3, stride=1, padding=1)
        self.conv4 = nn.Conv2d(384, 384, 3, stride=1, padding=1)
        self.conv5 = nn.Conv2d(384, 256, 3, stride=1, padding=1)
        self.fc1 = nn.Linear(256*6*6, 4096)
        self.fc2 = nn.Linear(4096, 4096)
        self.fc3 = nn.Linear(4096, 1000)

    def forward(self, x):
        out = F.relu(self.conv1(x))
        out = F.max_pool2d(out, 2)
        out = F.relu(self.conv2(out))
        out = F.max_pool2d(out, 2)
        out = F.relu(self.conv3(out))
        out = F.relu(self.conv4(out))
        out = F.relu(self.conv5(out))
        out = F.max_pool2d(out, 2)
        out = out.view(out.size(0), -1)
        out = F.relu(self.fc1(out))
        out = F.relu(self.fc2(out))
        out = self.fc3(out)
        return out

调试代码为：

net = AlexNet()
image = torch.randn(2, 3, 227, 227)
out = F.relu(net.conv1(image))
out = F.max_pool2d(out, 2)
out = F.relu(net.conv2(out))
out = F.max_pool2d(out, 2)
out = F.relu(net.conv3(out))
out = F.relu(net.conv4(out))
out = F.relu(net.conv5(out))
out = F.max_pool2d(out, 2)
out.size()

输出为：

torch.Size([2, 256, 6, 6])

全连接层的输入维度为：256 × 6 × 6 256\times 6\times 6 2 5 6 ×6 ×6。

二、公式法：

torch.nn.Conv2d(in_channels,
               out_channels,
               kernel_size,
               stride=1,
               padding=0,
               dilation=1,
               groups=1,
               bias=True,
               padding_mode='zeros',
               device=None,
               dtype=None)

参数如下：

n_channels (int) ：输入图片的维度；
out_channels (int) ：卷积层的输出维度；
kernel_size (int or tuple) ：卷积核的大小；
stride (int or tuple, optional) ：卷积核在原图上扫描时，需要跳跃的格数，默认跳一格；
padding (int, tuple or str, optional) ：输入四个边的填充值，默认为0 ，不填充；
padding_mode (string, optional) ：填充的方式有’zeros’, ‘reflect’, ‘replicate’ or ‘circular’. 默认为’zeros’，填充0值；
dilation (int or tuple, optional) ：卷积核元素间的间隔，默认为1；
groups (int, optional) ：输入通道和输出通道间的联系类别数，默认为1；
bias (bool, optional) ：如果为真，添加一个学习的偏置到输出上，默认为真。

Original: https://blog.csdn.net/guangxxie/article/details/125365563
Author: guangxxie
Title: Pytorch中卷积层转向全连接层时，全连接层输入维度的确定

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/708031/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【pytorch】interpolate的简单使用

interpolate是用于做插值处理的，常见用途是用于上采样(upsampling);当然也是可以做下采样的(downsampling) 官方的介绍如下参数列表如下 ; 简单使…

人工智能 2023年7月22日
0072
kaggle房价预测-回归模型

目录 1 项目背景 2 初始数据分析目标值分析特征与目标值相关性变量特征相关性 3 数据预处理目标变量正态分布化异常值处理缺失值处理转换特征保存训练集和测试集 4 …

人工智能 2023年7月4日
0085
Global Tracking Transformers 详细解读

文章目录介绍 Preliminarie Global tracking transformers * 4.1 Tracking transformers 4.2 训练 4.3 O…

人工智能 2023年7月13日
0065
TensorFlow基本概念与常用函数

TensorFlow基本概念与常用函数文章目录 TensorFlow基本概念与常用函数 * 一：张量 – (一)：张量概念 (二)：TensorFlow中的数据类型 …

人工智能 2023年5月25日
0074
嵌入式端音频开发（基础篇）之2021-2022年国内主流语音识别芯片科普(1)

自动控制，1 单位介绍……………………………&#…

人工智能 2023年5月23日
00104
Hql的经典例题(详细分类)

理论：一、窗口函数over()和group by 的区别：聚合函数作用于由 GROUP BY 子句聚合的组，而窗口函数则作用于一个窗口，这里，窗口是由一个 OVER 子句定…

人工智能 2023年7月1日
0089
YOLOv3&YOLOv5输出结果说明

本文使用的yolov3和yolov5工程文件均为github上ultralytics基于pytorch的v3和v5代码，其训练集输出结果类型基本一致，主要介绍了其输出结果，本文是一…

人工智能 2023年7月29日
0076
深度学习经典网络解析目标检测篇（二）：Fast R-CNN

深度学习经典网络解析目标检测篇（二）：Fast R-CNN 1.背景介绍 2.R-CNN 与 Fast R-CNN * 2.1 R-CNN存在的问题： 2.2 Fast R-CNN…

人工智能 2023年7月12日
0090
ChatGPT写的一篇数字化转型文章

文末附ChatGPT调戏链接，无需注册登录直接使用。数字化转型是指企业利用数字技术来改善业务流程、增强竞争力和降低成本。它旨在帮助企业更快、更有效地实现业务发展和创新，并为客户提…

人工智能 2023年7月31日
0063
李航《统计学习方法》笔记之朴素贝叶斯法

; 第4章朴素贝叶斯法朴素是整个算法的强假设，即变量之间是强相互独立的。例子路人拿出来3颗豆，两颗红豆1颗绿豆，我和路人各自抽了一颗,路人发现自己抽中的是绿豆，他想用剩下的那…

人工智能 2023年6月16日
0073
DGL-KE：亚马逊开源知识图谱嵌入库

这个库的开源已经是去年(2020)的事情了，突然感觉时间好快~，当时并没有在意，最近关注到这个库是因为自己在训练知识图谱 Embedding 的时候做的一些调研，考虑到后续大规模知…

人工智能 2023年6月1日
0079
Yolo-v1学习笔记

Yolo-v1学习笔记简介 YOLO与目标检测 YOLO算法原理训练的数据集格式最后一维输出的张量损失值的计算损失函数中的权重分配 YOLO-V1的缺点简介 YOLO(…

人工智能 2023年7月10日
0073
“看得见的”卷积神经网络（图文并茂+代码解读）（卷积神经网络可视化）

这篇博客主要是想和大家分享一下我学习卷积神经网络可视化之后的总结和心得。学习完卷积神经网络的大致流程之后，会感觉到它和其他深度学习网络一样，像个” 黑盒子“…

人工智能 2023年7月13日
0075
一文了解数据分析师与商业分析师的区别（一）

数据分析师与商业分析师到底有什么不同？很多初入数据岗的职场新人都不明所以，也不知道自己该选择哪个职业方向进行深入发展。没关系，下面小编让你一文了解两者的主要区别。如果拿武侠小…

人工智能 2023年7月18日
0080
Sklearn机器学习——ROC曲线、ROC曲线的绘制和AUC面积、运用ROC曲线找到最佳阈值

目录 1 ROC曲线 2 ROC曲线的绘制 2.1 Sklearn中的ROC曲线和AUC面积 2.2 利用ROC曲线找到最佳阈值 1 ROC曲线上篇博客介绍了ROC曲线的概率和阈…

人工智能 2023年6月15日
0079
超分辨率重建——（一）何为超分和分类

图像超分辨重建图像超分辨率（SR）是计算机视觉中提高图像和视频分辨率的一类重要技术。图像超分辨率重建( Super-resolution Reconstruction，SR) 是…

人工智能 2023年7月2日
0080

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch中卷积层转向全连接层时，全连接层输入维度的确定

Pytorch中卷积层转向全连接层时，全连接层输入维度的确定

一、代码法：

改变的AlexNet网络结构：

AlexNet

二、公式法：

大家都在看