【Pytorch】2022 Pytorch基础入门教程（完整详细版）

2023年7月30日下午12:43 • 人工智能 • 阅读 93

一、Pytorch

1.1 简介

Pytorch是torch的python版本，是由Facebook开源的神经网络框架，专门针对 GPU 加速的深度神经网络（DNN）编程。Torch 是一个经典的对多维矩阵数据进行操作的张量（tensor ）库，在机器学习和其他数学密集型应用有广泛应用。与Tensorflow的静态计算图不同，pytorch的计算图是动态的，可以根据计算需要实时改变计算图。但由于Torch语言采用 Lua，导致在国内一直很小众，并逐渐被支持 Python 的 Tensorflow 抢走用户。作为经典机器学习库 Torch 的端口，PyTorch 为 Python 语言使用者提供了舒适的写代码选择。

至于为什么推荐使用Pytorch，我想最主要的原因就是它非常的简洁，非常符合Python的风格。

1.2 安装

首先确保你已经安装了GPU环境，即Anaconda、CUDA和CUDNN

随后进入Pytorch官网PyTorch

官网会自动显示符合你电脑配置的Pytorch版本，复制指令到conda环境中运行即可

测试是否安装成功

import torch

print(torch.__version__) # pytorch版本
print(torch.version.cuda) # cuda版本
print(torch.cuda.is_available()) # 查看cuda是否可用

二、Tensor

Tensor张量是Pytorch里最基本的数据结构。直观上来讲，它是一个多维矩阵，支持GPU加速，其基本数据类型如下

数据类型CPU tensorGPU tensor8位无符号整型torch.ByteTensortorch.cuda.ByteTensor8位有符号整型torch.CharTensortorch.cuda.CharTensor16位有符号整型torch.ShortTensortorch.cuda.ShortTensor32位有符号整型torch.IntTensortorch.cuda.IntTensor64位有符号整型torch.LongTensortorch.cuda.LonfTensor

32位浮点型

torch.FloatTensortorch.cuda.FloatTensor64位浮点型torch.DoubleTensortorch.cuda.DoubleTensor布尔类型torch.BoolTensortorch.cuda.BoolTensor

2.1 Tensor创建

2.1.1 torch.tensor() && torch.tensor([])

二者的主要区别在于创建的对象的size和value不同

2.1.2 torch.randn && torch.randperm

生成的数据类型为浮点型，与numpy.randn生成随机数的方法类似，生成的浮点数的取值满足均值为0，方差为1的正态分布

torch.randpern(n)为创建一个n个整数，随机排列的Tensor

2.1.3 torch.range(begin，end，step)

生成一个一维的Tensor，三个参数分别的起始位置，终止位置和步长

2.1.4 指定numpy

很多时候我们需要创建指定的Tensor，而numpy就是一个很好的方式

2.2 Tensor运算

函数作用torch.abs(A)绝对值torch.add(A，B)相加，A和B既可以是Tensor也可以是标量torch.clamp(A，max，min)裁剪，A中的数据若小于min或大于max，则变成min或max，即保证范围在[min，max]torch.div(A，B)相除，A%B，A和B既可以是Tensor也可以是标量

torch.mul(A，B)

点乘，A*B，A和B既可以是Tensor也可以是标量

torch.pow(A,n)

求幂，A的n次方 torch.mm(A,B.T)矩阵叉乘，注意与torch.mul之间的区别torch.mv(A,B)矩阵与向量相乘，A是矩阵，B是向量，这里的B需不需要转置都是可以的A.item()将Tensor转化为基本数据类型，注意Tensor中只有一个元素的时候才可以使用，一般用于在Tensor中取出数值A.numpy()将Tensor转化为Numpy类型A.size()查看尺寸

A.shape

查看尺寸A.dtype查看数据类型A.view()重构张量尺寸，类似于Numpy中的reshapeA.transpose(0，1)行列交换

A[1:]

A[-1，-1]=100

切面，类似Numpy中的切面A.zero_()归零化torch.stack((A，B)，sim=-1)拼接，升维torch.diag(A)取A对角线元素形成一个一维向量torch.diag_embed(A)将一维向量放到对角线中，其余数值为0的Tensor

2.2.1 A.add() && A.add_()

所有的带_符号的函数都会对原数据进行修改

2.2.2 torch.stack

stack为拼接函数，函数的第一个参数为需要拼接的Tensor，第二个参数为细分到哪个维度

A=torch.IntTensor([[1,2,3],[4,5,6]])
B=torch.IntTensor([[7,8,9],[10,11,12]])
C1=torch.stack((A,B),dim=0) # or C1=torch.stack((A,B))
C2=torch.stack((A,B),dim=1)
C3=torch.stack((A,B),dim=2)
C4=torch.stack((A,B),dim=-1)
print(C1,C2,C3,C4)

dim=0，C1 = [ A,B ]

dim=1，C2 = [[A[0],B[0] ], [A[1],B[1] ]]

dim=2，C3 = [[[A[0][0],B[0][0] ], [A[0][1],B[0][1] ], [A[0][2],B[0][2] ]],

[[A[1][0],B[1][0] ], [A[1][1],B[1][1] ], [A[1][2],B[1][2] ]]]

dim=-1，C4 = C3

三、CUDA

CUDA是一种操作GPU的软件架构，Pytorch配合GPU环境这样模型的训练速度会非常的快

3.1 使用GPU

import torch

测试GPU环境是否可使用
print(torch.__version__) # pytorch版本
print(torch.version.cuda) # cuda版本
print(torch.cuda.is_available()) # 查看cuda是否可用

#使用GPU or CPU
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

判断某个对象是在什么环境中运行的
a.device

将对象的环境设置为device环境
A = A.to(device)

将对象环境设置为COU
A.cpu().device

若一个没有环境的对象与另外一个有环境a对象进行交流,则环境全变成环境a
a+b.to(device)

cuda环境下tensor不能直接转化为numpy类型,必须要先转化到cpu环境中
a.cpu().numpy()

创建CUDA型的tensor
torch.tensor([1,2],device)

四、其他技巧

4.1 自动微分

神经网络依赖反向传播求梯度来更新网络的参数，求梯度是个非常复杂的过程，在Pytorch中，提供了两种求梯度的方式，一个是backward，将求得的结果保存在自变量的grad属性中，另外一种方式是torch.autograd.grad

4.1.1 backward求导

使用backward进行求导。这里主要介绍了求导的两种对象，标量Tensor和非标量Tensor的求导。两者的主要区别是非标量Tensor求导的主要区别是加了一个gradient的Tensor，其尺寸与自变量X的尺寸一致。在求完导后，需要与gradient进行点积，所以只是一般的求导的话，设置的参数全部为1。最后还有一种使用标量的求导方式解决非标量求导，了解了解就好了。

import numpy as np
import torch

标量Tensor求导
求 f(x) = a*x**2 + b*x + c 的导数
x = torch.tensor(-2.0, requires_grad=True)
a = torch.tensor(1.0)
b = torch.tensor(2.0)
c = torch.tensor(3.0)
y = a*torch.pow(x,2)+b*x+c
y.backward() # backward求得的梯度会存储在自变量x的grad属性中
dy_dx =x.grad
dy_dx

非标量Tensor求导
求 f(x) = a*x**2 + b*x + c 的导数
x = torch.tensor([[-2.0,-1.0],[0.0,1.0]], requires_grad=True)
a = torch.tensor(1.0)
b = torch.tensor(2.0)
c = torch.tensor(3.0)
gradient=torch.tensor([[1.0,1.0],[1.0,1.0]])
y = a*torch.pow(x,2)+b*x+c
y.backward(gradient=gradient)
dy_dx =x.grad
dy_dx

使用标量求导方式解决非标量求导
求 f(x) = a*x**2 + b*x + c 的导数
x = torch.tensor([[-2.0,-1.0],[0.0,1.0]], requires_grad=True)
a = torch.tensor(1.0)
b = torch.tensor(2.0)
c = torch.tensor(3.0)
gradient=torch.tensor([[1.0,1.0],[1.0,1.0]])
y = a*torch.pow(x,2)+b*x+c
z=torch.sum(y*gradient)
z.backward()
dy_dx=x.grad
dy_dx

4.1.2 autograd.grad求导


import torch

#单个自变量求导
求 f(x) = a*x**4 + b*x + c 的导数
x = torch.tensor(1.0, requires_grad=True)
a = torch.tensor(1.0)
b = torch.tensor(2.0)
c = torch.tensor(3.0)
y = a * torch.pow(x, 4) + b * x + c
#create_graph设置为True,允许创建更高阶级的导数
#求一阶导
dy_dx = torch.autograd.grad(y, x, create_graph=True)[0]
#求二阶导
dy2_dx2 = torch.autograd.grad(dy_dx, x, create_graph=True)[0]
#求三阶导
dy3_dx3 = torch.autograd.grad(dy2_dx2, x)[0]
print(dy_dx.data, dy2_dx2.data, dy3_dx3)

多个自变量求偏导
x1 = torch.tensor(1.0, requires_grad=True)
x2 = torch.tensor(2.0, requires_grad=True)
y1 = x1 * x2
y2 = x1 + x2
#只有一个因变量,正常求偏导
dy1_dx1, dy1_dx2 = torch.autograd.grad(outputs=y1, inputs=[x1, x2], retain_graph=True)
print(dy1_dx1, dy1_dx2)
若有多个因变量，则对于每个因变量,会将求偏导的结果加起来
dy1_dx, dy2_dx = torch.autograd.grad(outputs=[y1, y2], inputs=[x1, x2])
dy1_dx, dy2_dx
print(dy1_dx, dy2_dx)

4.1.3 求最小值

使用自动微分机制配套使用SGD随机梯度下降来求最小值

#例2-1-3 利用自动微分和优化器求最小值
import numpy as np
import torch

f(x) = a*x**2 + b*x + c的最小值
x = torch.tensor(0.0, requires_grad=True)  # x需要被求导
a = torch.tensor(1.0)
b = torch.tensor(-2.0)
c = torch.tensor(1.0)
optimizer = torch.optim.SGD(params=[x], lr=0.01)  #SGD为随机梯度下降
print(optimizer)

def f(x):
    result = a * torch.pow(x, 2) + b * x + c
    return (result)

for i in range(500):
    optimizer.zero_grad()  #将模型的参数初始化为0
    y = f(x)
    y.backward()  #反向传播计算梯度
    optimizer.step()  #更新所有的参数
print("y=", y.data, ";", "x=", x.data)

4.2 Pytorch层次结构

Pytorch中一共有5个不同的层次结构，分别为硬件层、内核层、低阶API、中阶API和高阶API（torchkeras）

硬件层底层的计算资源包括CPU和GPU内核层使用C++来实现低阶APIPython实现的操作符，提供了封装C++内核的低级API指令，主要包括各种张量操作算子、自动微分、变量管理. 如torch.tensor,torch.cat,torch.autograd.grad,nn.Module. 中阶APIPython实现的模型组件，对低级API进行了函数封装，主要包括各种模型层，损失函数，优化器，数据管道等等。如 torch.nn.Linear,torch.nn.BCE,torch.optim.Adam,torch.utils.data.DataLoader. 高阶APIPython实现的模型接口。Pytorch没有官方的高阶API。为了便于训练模型，我们仿照 keras中的模型接口，使用了不到300行代码，封装了Pytorch的高阶模型接口 torchkeras.Model

五、数据

Pytorch主要通过Dataset和DataLoader进行构建数据管道

5.1 Dataset and DataLoader

Dataset一个数据集抽象类，所有自定义的Dataset都需要继承它，并且重写__getitem__()或__get_sample__()这个类方法DataLoader

一个可迭代的数据装载器。在训练的时候，每一个for循环迭代，就从DataLoader中获取一个batch_sieze大小的数据。

5.2 数据读取与预处理

DataLoader的参数如下

DataLoader(
 dataset,
 batch_size=1,
 shuffle=False,
 sampler=None,
 batch_sampler=None,
 num_workers=0,
 collate_fn=None,
 pin_memory=False,
 drop_last=False,
 timeout=0,
 worker_init_fn=None,
 multiprocessing_context=None,
)

在实践中，主要修改的参数以下标为橙色
dataset

数据集，决定数据从哪里读取，以及如何读取
batch_size

批次大小，默认为1
shuffle

每个epoch是否乱序sampler样本采样函数，一般无需设置batch_sampler批次采样函数，一般无需设置
num_workers

使用多进程读取数据，设置的进程数collate_fn整理一个批次数据的函数pin_memory是否设置为锁业内存。默认为False，锁业内存不会使用虚拟内存(硬盘)，从锁业内存拷贝到GPU上速度会更快
drop_last

是否丢弃最后一个样本数量不足batch_size批次数据timeout加载一个数据批次的最长等待时间，一般无需设置worker_init_fn每个worker中dataset的初始化函数，常用于 IterableDataset。一般不使用

顺带介绍一下Epoch、Iteration、Batchsize之间的关系
Epoch

所有的样本数据都输入到模型中，称为一个epoch
Iteration

一个Batch的样本输入到模型中，称为一个Iteration
Batchsize

一个批次的大小，一个Epoch=Batchsize*Iteration

先看数据读取的主要流程

进入DataLoaderIter，判断单线程还是多线程
进入Sampler进行采样，获得一批一批的索引，这些索引告诉我们需要读取哪些数据、
进入DatasetFetcher，依据索引读取数据
Dataset告诉我们数据的地址
自定义的Dataset中会重写__getietm__方法，针对不同的数据来进行定制化的数据读取
到这里就获取的数据的Text和Label
进入collate_fn将之前获取的个体数据进行组合成batch
一个一个batch组成Batch Data

再来看一个具体的代码

from torch.utils.data import DataLoader
from torch.utils.data.dataset import TensorDataset

自构建数据集
dataset = TensorDataset(torch.arange(1, 40))
dl = DataLoader(dataset,
                batch_size=10,
                shuffle=True,
                num_workers=1,
                drop_last=True)
数据输出
for batch in dl:
    print(batch)

因为自定义的数据集只有39条，最后一个batch的数据量小于10，被舍弃掉了

而数据预处理主要是重写Dataset和DataLoader中的方法，因此总体代码如下所示

5.5 Pytorch工具

基于Pytorch已经产生了一些封装完备的工具，而缺点也很明显，数据处理不是很灵活，对于初学者来说，多写代码比较踏实，因此作者不太推荐使用这些方法

torchvision图像视频处理torchaudio音频处理torchtext自然语言处理

六、torch.nn

torch.nn是神经网路工具箱，该工具箱建立于Autograd(主要有自动求导和梯度反向传播功能)，提供了网络搭建的模组，优化器等一系列功能。

搭建一个神经网络模型整个流程是怎么样的呢？

搭建网络流程
1 数据读取
2 定义模型
3 定义损失函数和优化器
4 模型训练
5 获取训练结果

我们拿一个最简单的FNN网络来对经典数据集diabetes糖尿病数据集来进行分类预测。


import numpy as np
import torch
import matplotlib.pyplot as plt
from torch.utils.data import Dataset, DataLoader

Prepare the dataset
class DiabetesDateset(Dataset):
    # 加载数据集
    def __init__(self, filepath):
        xy = np.loadtxt(filepath, delimiter=',', dtype=np.float32, encoding='utf-8')
        self.len = xy.shape[0]  # shape[0]是矩阵的行数,shape[1]是矩阵的列数
        self.x_data = torch.from_numpy(xy[:, :-1])
        self.y_data = torch.from_numpy(xy[:, [-1]])

    # 获取数据索引
    def __getitem__(self, index):
        return self.x_data[index], self.y_data[index]

    # 获得数据总量
    def __len__(self):
        return self.len

dataset = DiabetesDateset('diabetes.csv')
train_loader = DataLoader(dataset=dataset, batch_size=32, shuffle=True, num_workers=2)  # num_workers为多线程

Define the model
class FNNModel(torch.nn.Module):
    def __init__(self):
        super(FNNModel, self).__init__()
        self.linear1 = torch.nn.Linear(8, 6)  # 输入数据的特征有8个,也就是有8个维度,随后将其降维到6维
        self.linear2 = torch.nn.Linear(6, 4)  # 6维降到4维
        self.linear3 = torch.nn.Linear(4, 2)  # 4维降到2维
        self.linear4 = torch.nn.Linear(2, 1)  # 2w维降到1维
        self.sigmoid = torch.nn.Sigmoid()  # 可以视其为网络的一层,而不是简单的函数使用

    def forward(self, x):
        x = self.sigmoid(self.linear1(x))
        x = self.sigmoid(self.linear2(x))
        x = self.sigmoid(self.linear3(x))
        x = self.sigmoid(self.linear4(x))
        return x

model = FNNModel()

Define the criterion and optimizer
criterion = torch.nn.BCELoss(reduction='mean')  # 返回损失的平均值
optimizer = torch.optim.SGD(model.parameters(), lr=0.01)

epoch_list = []
loss_list = []

Training
if __name__ == '__main__':
    for epoch in range(100):
        # i是一个epoch中第几次迭代,一共756条数据,每个mini_batch为32,所以一个epoch需要迭代23次
        # data获取的数据为(x,y)
        loss_one_epoch = 0
        for i, data in enumerate(train_loader, 0):
            inputs, labels = data
            y_pred = model(inputs)
            loss = criterion(y_pred, labels)
            loss_one_epoch += loss.item()

            optimizer.zero_grad()
            loss.backward()
            optimizer.step()
        loss_list.append(loss_one_epoch / 23)
        epoch_list.append(epoch)
        print('Epoch[{}/{}],loss:{:.6f}'.format(epoch + 1, 100, loss_one_epoch / 23))

    # Drawing
    plt.plot(epoch_list, loss_list)
    plt.xlabel('epoch')
    plt.ylabel('loss')
    plt.show()

Result

注意点

1 创建模型的参数与__init__中的参数一致

2 训练模型的参数与forward中的参数一致

参考资料

本文章主要参考Github的各个大牛团队以及Pytorch的官方文档，感谢开源，开源万岁！

1 Chinese-Text-Classfication-Pytorch

2 Pytorch official Chinese documents

3 Pytorch official English doccuments

4 B站 PyTorch深度学习快速入门教程（小土堆）

5 pytorch-tutorial

6 Youtube–Pytorch

7 Pytorch–handbook

8 Deep Learning with PyTorch: A 60 Minute Blitz

以下是作者两个较为有诚意的工程，已开源。其中的代码框架结构是我看了较多论文源码后总结出来的一套较为清晰、规范的模板。工程的内容也是热门的CV和NLP领域两个基础性的任务，适合学完Pytorch后的工程实践

Bert/Roberta+Transformer_BILSTM_TextCNN实现IMDB文本分类

LeNet、AlexNet、GoogleLeNet、VGG16、ResNet实现COIL20图像分类

Original: https://blog.csdn.net/ccaoshangfei/article/details/126074300
Author: 北村南
Title: 【Pytorch】2022 Pytorch基础入门教程（完整详细版）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/724086/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

强化学习——多智能体强化学习

文章目录前言多智能体系统的设定合作关系设定下的多智能体系统 * 策略学习的目标函数合作关系下的多智能体策略学习算法MAC-A2C 非合作关系下的多智能体策略学习算法MAC-…

人工智能 2023年6月13日
00120
李宏毅HLP笔记(一): End-to-End ASR Model (LAS)

LAS: Listen, Attend and Spell [Chorowski et al., NIPS’15] 基于Attention机制的end-to-end语音…

人工智能 2023年5月25日
0093
开源！手把手教你搭建Arduino+英伟达Jetson的ROS小车（中）

1 引言前面的两篇推文：《开源！手把手教你搭建Arduino+英伟达Jetson的ROS小车（上）》中，我们介绍了一台Jetson-nano小车所需要的硬件部分；《开源！手把手教…

人工智能 2023年6月24日
00132
CVPR：Refining Pseudo Labels with Clustering Consensus over Generations for Unsupervised Object Re-ID

; 方法概述基于世代聚类共识的伪标签改进无监督目标重识别。1，文章引入了使用时序嵌入来正则化无监督目标重识别中的噪音伪标签。2，文章提出了一种伪标签改进策略: 在训练的迭代过程…

人工智能 2023年5月31日
0093
【深度学习案例】手写数字项目实现-1.数据集介绍

【深度学习入门教程】手写数字项目实现-1.数据集介绍 1. 项目简介 2. 数据集介绍 3. 数据集文件读取项目简介手写数字识别是指给定一系列的手写数字图片以及对应的数字标签，…

人工智能 2023年7月1日
0096
深度学习、目标检测情景中常见的模型评测指标

作者：RayChiu_Labloy版权声明：著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处二分类混淆矩阵：图：贴心的给出中文图：四种情况的解释假设我们…

人工智能 2023年7月10日
0096
ChatGPT 试用

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0063
深度学习实战（十）：使用 PyTorch 进行 3D 医学图像分割

深度学习实战（十）：使用 PyTorch 进行 3D 医学图像分割 1. 项目简介 2. 3D医学图像分割的需求 3. 医学图像和MRI 4. 三维医学图像表示 5. 3D-Une…

人工智能 2023年6月16日
0095
字符串离散化+数据合并（join&merge）+数据分组聚合（groupby）+索引（行索引index+列索引set_index+复合索引[series和dataframe]）

整体框架目录整体框架一、字符串离散化——one-hot特征工程二、合并通过join按照index进行合并通过merge按照列进行合并 1、内连接 2、外连接，取并集 3…

人工智能 2023年7月8日
0051
Qt配置opencv+opencv_contrib

Qt配置opencv+opencv_contrib ①环境概述：Qt5.12.2 + python3.7.1_32 + cmake3.18.5_x64②源文件：1.github下载…

人工智能 2023年7月20日
0078
【CUDA安装详细教程】

目录前言一、cuda的下载及安装 * 1.cuda版本 2.CUDA toolkit Download 3.cuda安装二、cuDNN下载及安装 * 1.cuDNN下载 2….

人工智能 2023年6月12日
00161
Pandas学习笔记

目录一、groupby相关操作 * 1.1 groupby agg 条件频率统计 apply相关操作 plot相关操作 * 1. 双轴图表一、groupby相关操作当 li…

人工智能 2023年7月7日
0064
FCN——语义分割的开山鼻祖（基于tf-Kersa复现代码）

1、什么是语义分割（semantic segmentation）？图像语义分割，简而言之就是对一张图片上的所有像素点进行分类，将所有属于同一类的物体标记为同一像素点。而今天要来…

人工智能 2023年5月26日
00101
阅读《基于知识图谱技术的数据资产管理设计与应用验证研究》笔记

文章目录 * – 1、摘要 – 2、前言 – 3、研究概述 – + 3.1 数据资产管理内涵 + 3.2 数据资产管理的意义 &#8…

人工智能 2023年6月1日
00100
电脑主板线路连接图解_专业音响设备常见的连接线

专业音响设备通用连接电缆 [En] Common connecting cables for professional audio equipment 扩声系统音频信号流程一常…

人工智能 2023年5月27日
00180
如何使用优化器来训练深度学习模型

如何使用优化器来训练深度学习模型在深度学习中，优化器被广泛应用于训练神经网络模型。优化器的目标是通过调整模型参数来最小化损失函数，以提高模型的准确性和性能。本文将详细介绍如何使用…

人工智能 2024年1月1日
0041

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31