神经网络——Conv2d的使用

2023年7月4日下午3:27 • 人工智能 • 阅读 85

在Convolution Layers 卷积层中有很多函数，像：nn.Conv1d 表示1维的；nn.Conv2d 表示2维的，如图片，等。其中Conv2d使用最多，故本文重点讲下nn.Conv2d的使用。

一、Conv2d的官方文档

torch.nn.Conv2d(in_channels,
out_channels,
kernel_size,
stride=1,
padding=0,
dilation=1,
groups=1,
bias=True,
padding_mode=’zeros’,
device=None,
dtype=None)

看着里面的参数，非常的多，但其实很多都有默认值，下面我们来看下给出的参数解释：

in_channels (int) – 输入图像中的通道数

out_channels (int)– 卷积产生的通道数即输出图片的通道数

kernel_size (int or tuple) – 卷积核的大小(可以是个数，也可以是元组)

stride (int or tuple, optional)– 卷积的步幅。默认值：1

padding (int, tuple or str, optional)– 填充添加到输入的所有四个边。默认值：0

padding_mode (string, optional)–填充的几个选择 ‘zeros’, ‘reflect’, ‘replicate’ 或 ‘circular’。默认值：”零”

dilation (int or tuple, optional)– 内核元素之间的间距。默认值：1

groups (int, optional) – 从输入通道到输出通道的阻塞连接数。默认值：1

bias (bool, optional) — 如果为真，则为输出添加可学习的偏差。默认值：真

其中， 标红的参数使用的较多。

shape:

在搭建神经网络中，我们可以根据已知数据来推算出其他的。

; 二、实例操作

1.理解参数之间的关系

Conv2d中常用的参数有 in_channels, out_channels, kernel_size, stride, padding，学习之前可以先了解一些参数之间的关系。

可以进行简单的理解：

当in_channels = 1，out_channels = 1时，表示输入的图像数量是1, 输出的数量也是1，这时有一个卷积核。

而当in_channels = 1，out_channels = 2时，表示输入的图像数量是1, 输出的数量也是2，这时有两个卷积核，这两个卷积核可能一样，也可能不一样。

2.实例练习

练习代码如下：

import torchvision
import torch
from torch import nn
from torch.utils.data import DataLoader
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from torch.nn import Conv2d

#使用CIFAR10数据集
dataset_conv = torchvision.datasets.CIFAR10(“./dataset”, train=False, transform=transforms.ToTensor(), download=True)

#将数据集放入dataloader中，让它进行加载
dataloder = DataLoader(dataset=dataset_conv, batch_size=64, shuffle=True, num_workers=0, drop_last=False)

class Test(nn.Module): #创建一个Test类，继承nn.Module
def init(self):
super(Test, self).init() #完成父类的初始化
self.conc1 = Conv2d(in_channels=3, out_channels=6, kernel_size=3, stride=1, padding=0) #在Test这个网络写入个卷积层
def forward(self, x):
x = self.conc1(x)
return (x)

#初始化这个网络并输出
test = Test()
print(test)

#写入tensorboard中
writer = SummaryWriter(“logs”)
step = 0
for data in dataloder:
imgs, target = data
output = test(imgs) #输出的数据是经过神经网络处理的数据

查看数据类型代码

print(imgs.shape)
print(output.shape)

torch.Size([64, 3, 32, 32])

writer.add_images(“conv2d”, imgs, global_step=step) #因为不是一张图片，所以使用images

torch.Size([64, 6, 30, 30]) ——>[xx, 3, 30, 30] 因为彩色图片是3channals的，但是我们输出是6channals，,它识别不出来所以会报错

output = torch.reshape(output, (-1, 3, 30, 30))

使用reshape来变换通道，因为batch我们不知道，直接输入-1，它会根据后面内容，自动推导出来（这个方法有点取巧，供学习理解）

writer.add_images(“output”, output, step)
step = step + 1
writer.close()

Original: https://blog.csdn.net/m0_51816252/article/details/125082831
Author: 晓亮.
Title: 神经网络——Conv2d的使用

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/669939/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

功率放大器的作用和工作原理是什么

很多人都听说过功率放大器，但是对功率放大器的工作原理等了解的还是不够，今天安泰电子就来给大家做个科普，为大家带来这篇文章详细的解释功率放大器的工作原理和作用是什么内容。高压功率放…

人工智能 2023年6月28日
00127
数学建模：相关性分析学习——皮尔逊（pearson）相关系数与斯皮尔曼（spearman）相关系数

目录前言一、基本概念及二者适用范围比较 1、什么是相关性分析 2、什么是相关系数 3、适用范围比较二、相关系数 1.皮尔逊相关系数（Pearson correlation） …

人工智能 2023年7月29日
0082
KITTI 3D目标检测的评估指标

3D目标检测使用RGB图像、RGB-D深度图像和激光点云，输出物体类别及在三维空间中的长宽高、旋转角等信息的检测。多类别目标的检测问题可以转换为”某类物体检测正确、…

人工智能 2023年7月10日
0084
how is it going是什么意思_“是我”别随口说成“It's me”，这些你都搞清楚了吗？…

1、I: The Subject “I” is a nominative pronoun, which means that it is used as t…

人工智能 2023年6月1日
0085
决策树（python）

目录一、分类决策树 1.决策树的划分依据 2.剪枝（对付”过拟合”的主要⼿段） 3.案例（泰坦尼克号乘客⽣存预测） 4.利弊二、回归决策树决策树思想的…

人工智能 2023年6月13日
0078
使用TF-IDF算法进行数据处理（附代码）

· 什么是TF-IDF？ TF-IDF(term frequency–inverse document frequency)是一种加权技术，用于文本数据的挖掘与清洗。 · 使用情境…

人工智能 2023年6月11日
00108
（一）Spring启示录

文章目录启示代码代码存在的问题引出IoC（控制反转）引出Spring框架 Spring学习目录下一篇：（二）Spring概述启示代码一个简单的业务需求：使用Mysql…

人工智能 2023年6月28日
00127
数据分析（二）特征值和特征向量、奇异值、傅里叶变换

一、特征值和特征向量(只能是方阵) 对于n阶方阵A，如果存在数a和非零n维列向量x，使得Ax=ax，则称a是矩阵A的一个特征值，x是矩阵A属于特征值a的特征向量 eigvals, …

人工智能 2023年6月11日
00104
基于协同过滤算法的课程推荐（采用皮尔逊相关系数) 。

解决问题：根据用户的选课情况，推荐相应的课程。对应的文件如下：相关文件：提取码：zxcv复制这段内容后打开百度网盘手机App，操作更方便哦) 协同过滤算法的基本步骤：1:收集用户…

人工智能 2023年7月8日
0094
计算机视觉（二）图像分类

一、图像分类难点：对问题的拆解目前流行的图像分类方法分类器设计与学习图像表示分类器损失函数优化算法训练过程评价指标一、图像分类图像分类：核心任务，根据图像信息…

人工智能 2023年7月1日
00125
【原创】基于TensorFlow2识别人是否配戴眼镜的研究

随着时代的发展，电子产品种类越来越丰富，方便我们日常生活的同时，也造成了越来越多人面临近视问题，为更快速准确地统计人群的戴眼镜率，本文基于TensorFlow2，先运用爬虫爬取到了…

人工智能 2023年7月20日
0062
【微服务】Nacos服务发现源码分析

💖Spring家族及微服务系列文章 ✨【微服务】SpringBoot监听器机制以及在Nacos中的应用✨【微服务】Nacos服务端完成微服务注册以及健康检查流程✨【微服务】Naco…

人工智能 2023年6月26日
00120
机器学习系列(10)_决策树与随机森林回归

注：本篇文章接上一篇文章》》机器学习系列(9)_决策树详解01 文章目录一、决策树优缺点二、泰坦尼克号幸存者案例三、随机森林介绍 * 1、随机森林的分类 2、重要参数 &#8…

人工智能 2023年6月17日
0078
使用ncnn在树莓派部署自己的yolov5lites模型

使用ncnn在树莓派部署自己的yolov5lites模型文章目录使用ncnn在树莓派部署自己的yolov5lites模型前言一、windows10上训练自己的yolov5l…

人工智能 2023年6月24日
00109
Pandas常见方法（2）-pandas对数据的预处理

说明：本blog基于python3， pandas 1.3.5版本本文主要介绍如何对数据做预处理，包括缺失值过滤、缺失值补全、数据转换（重复值删除，数据映射、数据替换）、简单运…

人工智能 2023年7月17日
0059
Pandas中创建DataFrame对象以及相关的列操作，行操作

创建DataFrame对象 pd.DataFrame(data=None,index=None,columns=None,dtype=None,copy=None) 使用嵌套列表创…

人工智能 2023年6月19日
00117

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31