Pytorch面试题面经

2023年6月17日上午12:09 • 人工智能 • 阅读 112

1.conv2d的实现：

接口定义：

class torch.nn.Conv2d(in_channels,
    out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1,
    bias=True)

参数说明：

in_channels (int) – 输入通道个数。
out_channels (int) – 输出通道个数。有多少个out_channels，就需要多少个卷积（也就是卷积核的数量）
kernel_size(int or tuple) –
卷积核的尺寸；卷积核的第二个维度由in_channels决定，所以实际上卷积核的大小为kernel_size * in_channels
stride (int or tuple, optional) – 卷积操作的步长, 默认：1
padding (int or tuple, optional) – 输入数据各维度各边上要补齐0的层数，默认： 0
dilation (int or tuple, optional) – 卷积核各元素之间的距离，默认： 1
groups (int, optional) – 输入通道与输出通道之间相互隔离的连接的个数，默认：1
bias (bool, optional) – 如果被置为True，向输出增加一个偏差量，此偏差是可学习参数。默认：True

channel的理解：

最初输入的图片样本的 channels ，取决于图片类型，比如RGB；
卷积操作完成后输出的 out_channels ，取决于卷积核的数量。此时的 out_channels 也会作为下一次卷积时的卷积核的 in_channels；
卷积核中的 in_channels ，刚刚2中已经说了，就是上一次卷积的 out_channels，如果是第一次做卷积，就是1中样本图片的 channels 。

2.pytorch如何微调fine tuning：

在加载了预训练模型参数之后，需要finetuning模型，可以使用不同的方式finetune：

局部微调： 加载了模型参数后，只想调节最后几层，其它层不训练，也就是不进行梯度计算，pytorch提供的requires_grad使得对训练的控制变得非常简单。

model = torchvision.models.resnet18(pretrained=True)
for param in model.parameters():
    param.requires_grad = False

model.fc = nn.Linear(512, 100)

optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)

全局微调： 对全局微调时，只不过我们希望改换过的层和其他层的学习速率不一样，这时候把其它层和新层在optimizer中单独赋予不同的学习速率。

ignored_params = list(map(id, model.fc.parameters()))
base_params = filter(lambda p: id(p) not in ignored_params,
                     model.parameters())

optimizer = torch.optim.SGD([
            {'params': base_params},
            {'params': model.fc.parameters(), 'lr': 1e-3}
            ], lr=1e-2, momentum=0.9)

3.pytorch使用多gpu。

model.gpu() 把模型放在gpu上
model = nn . DataParallel ( model ) 。DataParallel并行的方式，是将输入一个batch的数据均分成多份，分别送到对应的GPU进行计算，各个GPU得到的梯度累加。与Module相关的所有数据也都会以浅复制的方式复制多份，在此需要注意，在module中属性应该是只读的。
对模型和相应的数据进行.cuda()处理，可以将内存中的数据复制到gpu显存中去

model = Model(input_size, output_size)
if torch.cuda.device_count() > 1:
  print("Let's use", torch.cuda.device_count(), "GPUs!")

  model = nn.DataParallel(model)

if torch.cuda.is_available():
   model.cuda()

torch.nn：核心数据结构是Module,抽象的概念，既可以表示神经网络某个层layer，也可以表示一个包含很多层的神经网络。常见做法是继承nn.Module,编写自己的层。

自定义层必须继承nn.Module，并且在其构造函数中需调用nn.Module的构造函数，super(xx,self). init()
在构造函数__init__中必须自定义可学习的参数，并封装成Parameter
forward函数实现前向传播过程，其输入可以是一个或者多个tensor。无需写反向传播函数，nn.Module能够利用autograd自动实现反向传播，这比function简单的多
Module中可学习参数可以通过named_parameters()或者parameters()返回迭代器，前者会给每个parameter附上名字，使其更具有辨识度。
pytorch实现了大部分的layer,这些layer都继承于nn.Module

nn.conv2d卷积层
AvgPool,Maxpool,AdaptiveAvgPool
TransposeConv逆卷积
nn.Linear全连接层
nn.BatchNorm1d(1d,2d,3d)
nn.dropout
nn.ReLU
nn.Sequential
nn.ModuleList（），可以包含几个子module，可以像list一样使用它，但不能直接把输入传给MuduleList
nn.LSTM(4,3,1) 输入向量4维，隐藏元3,1层 nn.LSTMCell(4,3) 对应层数只能是一层
nn.Embedding(4,5)4个词，每个词使用5个向量表示
损失函数也是nn.Module的子类。nn.CrossEntropLoss() loss = criterion(score,label)

torch.optim 将深度学习常用优化方法全部封装在torch.optim中，所有优化方法继承基类optim.Optimizer，并实现了自己的优化步骤

optimizer = optim.SGD(param=net.parameters(),lr=1)
optimizer.zero_grad() #梯度清零，等价于net.zero_grad()
input = t.randn(1,3,32,32)
output = net(input)
output.backward(output)
optimizer.step()
对不同网络设置不同学习率


optimizer =optim.SGD([
                {'params': net.features.parameters()},
                {'params': net.classifier.parameters(), 'lr': 1e-2}
            ], lr=1e-5)

调整学习率的方法，两种

修改optimizer.param_groups中对应的学习率
新建优化器


old_lr = 0.1
optimizer1 =optim.SGD([
                {'params': net.features.parameters()},
                {'params': net.classifier.parameters(), 'lr': old_lr*0.1}
            ], lr=1e-5)

for param_group in optimizer.param_groups:
    param_group['lr'] *= 0.1

nn.functional中的函数和nn.Module主要区别：

nn.Module实现的layers是一个特殊的类，都是有class layer(nn.Module)定义，会自动提取可学习的参数
nn.functional中的函数更像是纯函数，由def function(input)定义
也就是说如果模型有可学习的参数，最好用nn.Module否则使用哪个都可以，二者在性能上没多大差异，
对于卷积，全连接等具有可学习参数的网络建议使用nn.Module
激活函数（ReLU,sigmoid,tanh），池化等可以使用functional替代。对于不具有可学习参数的层，将他们用函数代替，这样可以不用放在构造函数__init__中。

如何在多个gpu上并行计算,pytorch提供了两个函数，可实现简单高效的并行gpu计算

nn.parallel.data_parallel(module, inputs, device_ids=None,
output_device=None, dim=0, module_kwargs=None)
class torch.nn.DataParallel(module, device_ids=None,
output_device=None, dim=0)
通过device_ids参数可以指定在哪些gpu上优化

DataLoader函数

定义如下：对batch的数据进行操作，同时还需要对数据进行shuffle和并行加速等。
DataLoader(dataset, batch_size=1, shuffle=False, sampler=None, num_workers=0, collate_fn=default_collate, pin_memory=False, drop_last=False)

dataset：加载的数据集(Dataset对象)
batch_size：batch size
shuffle:：是否将数据打乱
sampler：样本抽样，后续会详细介绍
num_workers：使用多进程加载的进程数，0代表不使用多进程
collate_fn：如何将多个样本数据拼接成一个batch，一般使用默认的拼接方式即可
pin_memory：是否将数据保存在pin memory区，pin memory中的数据转到GPU会快一些
drop_last：dataset中的数据个数可能不是batch_size的整数倍，drop_last为True会将多出来不足一个batch的数据丢弃

Original: https://blog.csdn.net/toCVer/article/details/126250107
Author: 3D_vision
Title: Pytorch面试题面经

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627495/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

自回归滑动平均（ARMA）模型

目录一. 功率谱密度二.ARMA过程三.ARMA建模及应用一.功率谱密度功率谱反映被分析对象的能量随频率分布情况，如雷达信号处理中，回波信号的功率谱密度，谱峰宽度、高度和…

人工智能 2023年6月18日
0099
matlab改变图片亮度（HSV模型）

目录 1 解决思路 * 1.1 问题背景 1.2 解决思路 2 采用”渐变”的方式改变调整的”力度” * 2.1 线性调整 2.2 …

人工智能 2023年6月18日
00331
C. Boboniu and Bit Operations(暴力+枚举)

波波尼奥喜欢位操作。他想和你玩一个游戏。 Boboniu给你两个非负整数序列a1,a2,…,an和b1,b2,…,bm。对于每一个i（1≤i≤n），要求你…

人工智能 2023年6月28日
00102
【web前端开发】前端生日礼物–注册页面篇

文章目录总计划注册界面 * 页面背景设置 – 注意字体选择 – 不明原因：在父相子绝下字体不对齐父类登录浮窗 – 制作透明盒子给盒子设…

人工智能 2023年6月2日
0075
自然语言处理NLP星空智能对话机器人系列：NLP on Transformers 101 第19章：NLP阅读理解MRC(Machine Reading Comprehension)数学原理、技术本质

自然语言处理NLP星空智能对话机器人系列：NLP on Transformers 101 第19章：NLP阅读理解MRC(Machine Reading Comprehension…

人工智能 2023年5月31日
0087
python获取声音波形的关键特征

; python获取声音波形的关键特征一、声音波形如下 ; 二、特征提取导入音频处理库： pip install librosa pip install numpy pip i…

人工智能 2023年6月28日
0091
深度可分离卷积

目录 1. 深度可分离卷积模型结构 2. 深度可分离卷积的由来 2.1 InceptionV3模型结构 2.2 引入深度可分离卷积 3. 深度可分离卷积与普通卷积的计算量 3.1 …

人工智能 2023年7月14日
0073
《菜菜的机器学习sklearn课堂》聚类算法Kmeans

聚类算法聚类算法 * 无监督学习与聚类算法 sklearn中的聚类算法 KMeans * KMeans是如何工作的簇内误差平方和的定义和解惑 sklearn.cluster.K…

人工智能 2023年6月2日
0067
逻辑回归模型如何处理多分类问题

问题：逻辑回归模型如何处理多分类问题？多分类问题是机器学习中常见的一个任务，逻辑回归是一种用于二分类的机器学习模型。然而，我们可以通过一些方法将逻辑回归扩展到解决多分类问题。以下…

人工智能 2023年12月31日
0035
ZYNQ图像处理项目——模板匹配数字识别(1)

一、数字识别基础 FPGA全并行运行的特点，特别适合用于图像的处理。数字识别是一项关键技术，是图像识别等的基础，数字识别主要由以下这几种方法。基于模板分类匹配的数字识别算法模版匹配…

人工智能 2023年6月22日
0068
利用Tensorflow构建生成对抗网络GAN以生成数据

使用生成对抗网络(GAN)生成数据本文主要内容介绍了自动编码器的基本原理比较了生成模型与自动编码器的区别描述了GAN模型的网络结构分析了GAN模型的目标核函数以及训练过程…

人工智能 2023年5月26日
00100
Python处理Excel表格——了解Groupby与merge的用法

作为数据分析师日常工作中会遇到各种各样的数据处理需求，因为数据量巨大的原因无法手动处理表格，正好会应用Python工具，今天就借此机会来展示Pandas中Groupby与Merg…

人工智能 2023年7月6日
0076
基于JAVA的企业信息员工管理系统的设计与实现（附：源码论文 sql文件）

摘要随着电子信息的飞速发展，计算机已经融入到了生活的各个方面，越来越多的企业开始使用电子计算机来对企业进行管理，信息化的时代已经到来，各个企业无论大小都需要一个信息化的管理系统…

人工智能 2023年7月30日
0071
图像特征及提取

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月2日
0071
Facebook AI推出“杂食者”：一个模型解决图像、视频和3D数据三大分类任务，性能还不输独立模型

最近，Meta AI推出了这样一个 “杂食者” （Omnivore）模型，可以对不同视觉模态的数据进行分类，包括图像、视频和3D数据。喜欢记得关注、收…

人工智能 2023年7月2日
0088
蓝桥杯嵌入式 cubeMX生成代码解读

文章目录前言一、代码风格二、为什么要这些注释？三、生成的独立模块的代码总结前言本篇文章讲介绍一下cubeMX生成代码的风格。一、代码风格在main.c中可以看到非…

人工智能 2023年7月31日
0068

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31