Pytorch 官方文档教程整理 (一)

2023年6月16日下午11:43 • 人工智能 • 阅读 104

Pytorch 官方文档教程整理 (一)

对应官方的 Instuction to Pytorch 前半部分

运行的Python版本： 3.9.12

所使用的库：

numpy                     1.23.0
pandas                    1.4.3
pip                       21.2.4
tensorboard               2.9.1
torch                     1.12.0+cu116
torchaudio                0.12.0+cu116
torchvision               0.13.0+cu116

注：后面涉及的链接均不再附上都可以在官方文档找到

大多数机器学习工作涉及：数据、模型建立、模型参数优化、保存模型

本教程将根据流程的pytorch实现来进行教学

学习者应有一定的Python和深度学习基础

张量是一种特殊的数据结构，类似于NumPy的ndarrays，与NumPy数组通常可以共享相同的底层内存，从而消除了复制数据的需要。

张量提供了 GPU或者其他硬件的加速、从而也对自动微分(automatic differentiation)进行了优化

import torch
import numpy as np

*Initializing a Tensor


data = [[1,2],[3,4]]
x_data = torch.tensor(data)
print(x_data)

np_array = np.array(data)
x_np = torch.from_numpy(np_array)
print('\n', x_np)

x_ones = torch.ones_like(x_data)
x_rand = torch.rand_like(x_data, dtype=torch.float)
print(f"\nOnes Tensor: \n {x_ones} \n")
print(f"Random Tensor: \n {x_rand} \n")

tensor([[1, 2],
        [3, 4]])

 tensor([[1, 2],
        [3, 4]])

Ones Tensor:
 tensor([[1, 1],
        [1, 1]])

Random Tensor:
 tensor([[0.7730, 0.6609],
        [0.8345, 0.5773]])


shape = (2,3,)
rand_tensor = torch.rand(shape)
ones_tensor = torch.ones(shape)
zeros_tensor = torch.zeros(shape)

print(f"Random Tensor: \n {rand_tensor} \n")
print(f"Ones Tensor: \n {ones_tensor} \n")
print(f"Zeros Tensor: \n {zeros_tensor}")

Random Tensor:
 tensor([[0.9749, 0.8934, 0.1137],
        [0.1913, 0.0333, 0.6570]])

Ones Tensor:
 tensor([[1., 1., 1.],
        [1., 1., 1.]])

Zeros Tensor:
 tensor([[0., 0., 0.],
        [0., 0., 0.]])

*Attributes of a Tensor

张量的性质包括：shape(形状), datatype(数据类型), device(运行设备cpu,gpu)

tensor = torch.rand(3,4)

print(f"Shape of tensor: {tensor.shape}")
print(f"Datatype of tensor: {tensor.dtype}")
print(f"Device tensor is stored on: {tensor.device}")

Shape of tensor: torch.Size([3, 4])
Datatype of tensor: torch.float32
Device tensor is stored on: cpu

*Operations on Tensors

对于张量的操作有一百多种，比如：算术、线性代数、矩阵操作(转置、索引、切片)、采样等等（更多介绍见官网）

每一种操作都可以在GPU完成

默认张量的操作在CPU完成，我们需要用 .to方法将张量转移到GPU（但是需要注意的是在不同的device之间转移大型张量是很浪费时间和资源的）


device = 'cuda' if torch.cuda.is_available() else 'cpu'
print(f'Using device {device}!')

tensor = tensor.to(device)
print(tensor.device)

Using device cuda!

cuda:0


tensor = torch.ones(4, 4)
print(tensor)

print(f"First row: {tensor[0]}")
print(f"First column: {tensor[:, 0]}")
print(f"Last column: {tensor[..., -1]}")
tensor[:,1] = 0
print(tensor)

tensor([[1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.],
        [1., 1., 1., 1.]])
First row: tensor([1., 1., 1., 1.])
First column: tensor([1., 1., 1., 1.])
Last column: tensor([1., 1., 1., 1.])
tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])

t1 = torch.cat([tensor, tensor, tensor], dim=1)
print(t1)

tensor([[1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
        [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
        [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.],
        [1., 0., 1., 1., 1., 0., 1., 1., 1., 0., 1., 1.]])

print(tensor)

y1 = tensor @ tensor.T
y2 = tensor.matmul(tensor.T)

y3 = torch.rand_like(y1)
torch.matmul(tensor, tensor.T, out=y3)
print(y3)

z1 = tensor * tensor
z2 = tensor.mul(tensor)

z3 = torch.rand_like(tensor)
torch.mul(tensor, tensor, out=z3)
print(z1)

tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])
tensor([[3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.],
        [3., 3., 3., 3.]])
tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])

agg = tensor.sum()
agg_item = agg.item()
print(agg_item, type(agg_item))

12.0 <class 'float'>
</class>

In-place operations 节约了内存但是会导致导数丢失没办法进行方向传播之类的操作要注意使用

print(f"{tensor} \n")
tensor.add_(5)
print(tensor)

tensor([[1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.],
        [1., 0., 1., 1.]])

tensor([[6., 5., 6., 6.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.],
        [6., 5., 6., 6.]])

*Bridge with NumPy

在CPU上的张量可以和numpy数组公用一个底层内存


t = torch.ones(5)
print(f"t: {t}")
n = t.numpy()
print(f"n: {n}")

t.add_(1)
print(f"t: {t}")
print(f"n: {n}")

t: tensor([1., 1., 1., 1., 1.])
n: [1. 1. 1. 1. 1.]
t: tensor([2., 2., 2., 2., 2.])
n: [2. 2. 2. 2. 2.]


n = np.ones(5)
t = torch.from_numpy(n)

np.add(n, 1, out=n)
print(f"t: {t}")
print(f"n: {n}")

t: tensor([2., 2., 2., 2., 2.], dtype=torch.float64)
n: [2. 2. 2. 2. 2.]

为了将数据代码和模型代码分离，获得更好的可读性和模块化pytorch提供了 torch.utils.data.DataLoader和 torch.utils.data.Dataset以便于预处理好数据、便于使用时便捷的访问数据

pytorch本身提供了许多音频、图像、文本等等数据集可以直接下载成一个Dataset对象

下面以Fashion-Mnist数据集为例来演示
该数据包含60000个训练样本，10000个测试样本
每个样本由一个 28×28 的灰度图像和一个对应标签组成

下面通过以下参数来加载一个数据集

root 下载路径
train 是否为训练集（测试\训练）
download 是否下载 (未下载则下载已下载则直接加载
transform and target_transform 对数据、标签进行transform

import torch
from torch.utils.data import Dataset
from torchvision import datasets
from torchvision.transforms import ToTensor
import matplotlib.pyplot as plt

training_data = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor()
)

test_data = datasets.FashionMNIST(
    root="data",
    train=False,
    download=True,
    transform=ToTensor()
)

*Iterating and Visualizing the Dataset

我们可以对dataset进行索引
然后通过matplolib进行样本可视化

labels_map = {
    0: "T-Shirt",
    1: "Trouser",
    2: "Pullover",
    3: "Dress",
    4: "Coat",
    5: "Sandal",
    6: "Shirt",
    7: "Sneaker",
    8: "Bag",
    9: "Ankle Boot",
}

figure = plt.figure(figsize=(8, 8))
cols, rows = 3, 3
for i in range(1, cols * rows + 1):
    sample_idx = torch.randint(len(training_data), size=(1,)).item()

    img, label = training_data[sample_idx]

    figure.add_subplot(rows, cols, i)
    plt.title(labels_map[label])
    plt.axis("off")
    plt.imshow(img.squeeze(), cmap="gray")
plt.show()

*Creating a Custom Dataset for your files

创建自己的数据集

建立自己的数据集需要实现 __init__ __len__ __getitem__方法
(假设)FashionMNIST的图像样例存储在 img_dir 他们对应的标签存储在 annotations_file

下面来看看这些方法内部的实现过程

import os
import pandas as pd
from torchvision.io import read_image

标签文件格式如下

shirt1.jpg, 0
tshirt2.jpg, 0
…

ankleboot999.jpg, 9


def __init__(self, annotations_file, img_dir, transform=None, target_transform=None):
    self.img_labels = pd.read_csv(annotations_file)
    self.img_dir = img_dir
    self.transform = transform
    self.target_transform = target_transform


def __len__(self):
    return len(self.img_labels)

根据文件路径和参数 idx返回图片样本和标签

如果有transform那么进行transform后返回

def __getitem__(self, idx):
    img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0])
    image = read_image(img_path)
    label = self.img_labels.iloc[idx, 1]
    if self.transform:
        image = self.transform(image)
    if self.target_transform:
        label = self.target_transform(label)
    return image, label

完整实现如下

import os
import pandas as pd
from torchvision.io import read_image

class CustomImageDataset(Dataset):
    def __init__(self, annotations_file, img_dir, transform=None, target_transform=None):
        self.img_labels = pd.read_csv(annotations_file)
        self.img_dir = img_dir
        self.transform = transform
        self.target_transform = target_transform

    def __len__(self):
        return len(self.img_labels)

    def __getitem__(self, idx):
        img_path = os.path.join(self.img_dir, self.img_labels.iloc[idx, 0])
        image = read_image(img_path)
        label = self.img_labels.iloc[idx, 1]
        if self.transform:
            image = self.transform(image)
        if self.target_transform:
            label = self.target_transform(label)
        return image, label

*Preparing your data for training with DataLoaders

Dataset一次只返回一个样本

我们在训练时一次update往往需要一个minibatch个样本将全部数据都update一遍就称为一个epoch

为了避免过拟合每个epoch都通过dataloader进行reshuffle

同时也采用Python的多线程来加速数据检索

from torch.utils.data import DataLoader

train_dataloader = DataLoader(training_data, batch_size=64, shuffle=True)
test_dataloader = DataLoader(test_data, batch_size=64, shuffle=True)

*Iterate through the DataLoader

dataloader每次迭代都会返回minibatch个样本特征和其对应的label
因为shuffle=true所以每次遍历完所有的数据之后就会将顺序重新打乱


train_features, train_labels = next(iter(train_dataloader))
print(f"Feature batch shape: {train_features.size()}")
print(f"Labels batch shape: {train_labels.size()}")

img = train_features[0].squeeze()
print(f"img shape: {img.size()}")
label = train_labels[0]

plt.imshow(img, cmap="gray")
plt.show()
print(f"Label: {label}")

Feature batch shape: torch.Size([64, 1, 28, 28])
Labels batch shape: torch.Size([64])
img shape: torch.Size([28, 28])

Label: 8

你使用的或者下载来的数据样本和其标签不一定满足你训练模型所需要的格式
我们可以使用transforms来对他们进行一些变化

所有的Torchvision的dataset都提供了 transform和 target_transforms分别对特征和标签进行变化
torchvision.transforms提供了一些变化方法

FashionMNIST 的特征是PIL image 标签是整数格式
为了适应训练模型，使用 ToTensor方法和 Lamda方法进行转化

import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),

    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

*ToTensor()

ToTensor 将PIL image图像或者numpy数组转化成FloatTensor型数据
并且将图片每个像素限制在[0,1]范围内

*Lamda Transforms

用户自定义一个转换方式
上文中将整数转换成了独热码张量

target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

未完待续

Original: https://blog.csdn.net/qq_53580131/article/details/126009967
Author: 说梦人丶
Title: Pytorch 官方文档教程整理 (一)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627359/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

YOLOv5更换激活函数（FReLU+SE机制）

介绍本次我们在卷积层添加SE注意力模块来改进YOLOv5算法，同时用FReLU替换SILU激活函数，并通过添加跳转连接来改进PANet特征融合网络。为了本次实验的对比性，我使用…

人工智能 2023年6月17日
0088
〖Python自动化办公篇⑥〗- word文件自动化 – word操作与读取word文件

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月5日
00103
特征融合的分类和方法

1、特征融合的定义特征融合方法是模式识别领域的一种重要的方法，计算机视觉领域的图像识别问题作为一种特殊的模式分类问题，仍然存在很多的挑战，特征融合方法能够综合利用多种图像特征，实…

人工智能 2023年7月4日
0085
Mac Neo4j安装与使用 2020-05-09

关于图数据库的一些介绍 https://www.cnblogs.com/mantoudev/p/10414495.html 摘录一下：图数据很多，图数据库比普通的要更快 neo4…

人工智能 2023年6月1日
00108
对公知识图谱-资金流向风险图谱

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月1日
0069
复旦黄萱菁：顶会也喜欢“搞事情”文章，提示学习等已成为NLP领域的研究重点…

导读：近年来，顶会投稿数量稳步增长，一些热门会议甚至出现投稿数破万的情况，”顶会热”成为AI领域关注的话题。同时，预训练模型等技术快速发展，推动着NLP领域…

人工智能 2023年5月28日
0098
DHU 数据科学技术与应用【15】第八次单元测验时序与语音数据处理答案

写在更前面本文章免费提供给需要的同学使用我知道可能动了有些人的蛋糕（有人第四次开课时发的，题目差不多，但是收费），被举报抄袭了，笑死知识无价，做作业是为了更好地了解知识，并且…

人工智能 2023年5月23日
0093
源码分析基础

1、抽象类特点：1、方法只有声明，没有实现体2、抽象类不可以被实例化，不能被final修饰3、抽象类必须由子类重写所有抽象方法才能实例化该子类4、抽象类不一定非要有抽象方法 2、…

人工智能 2023年6月30日
0076
支持哪些类型

问题描述在进行数据分析和机器学习任务时，我们经常需要将不同类型的数据转换为数字类型，以便进行进一步的处理。然而，并不是所有类型的数据都可以直接转换为数字形式。因此，需要一种方法来…

人工智能 2024年1月3日
0053
【神经网络】一文带你轻松解析神经网络（附实例恶搞女友）

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将讲解关于神经网络的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉python网…

人工智能 2023年7月27日
0062
贝叶斯线性回归

不同于频率派的线性回归Y = ω T X + ω 0 Y=\omega^TX+\omega_0 Y =ωT X +ω0 ，贝叶斯学派认为ω T \omega^T ωT不是一个…

人工智能 2023年6月18日
0094
数据分析实战 – 超市销售数据分析，csv输入输出（附带样本集）

导语：给你这样一份数据，来自收银台记账数据，你能提取什么信息？有多大价值？找出这样的信息需要多久时间？如果使用自动化工具，几十行python代码，能做什么？首先，导入数据集： …

人工智能 2023年7月15日
0062
葡萄干数据集

原文： Raisin Dataset Data Set Images of the Kecimen and Besni raisin varieties were obtained…

人工智能 2023年7月28日
0072
多智能体强化学习—QMIX

多智能体强化学习—QMIX 论文地址：https://arxiv.org/pdf/1803.11485.pdf 1 介绍首先介绍一下VDN（value decomposition…

人工智能 2023年6月23日
00105
三、DMSP/OLS夜间灯光数据校正一相互校正、饱和校正

DMSP由于多代传感器，每一代传感器之间存在重叠年份，且未完成星上辐射校正，DN值存在异常情况。对其的预处理主要解决年份重叠、DN值异常、灯光饱和等问题，要完成相互校正、连续性校正…

人工智能 2023年6月11日
0077
【mmaction2 入门教程 01】 slowfast训练配置日志分析测试结果分析

目录 0 参考资料 1 GPU平台 2 训练配置（Training setting） * 2.1 官网的训练配置文档 2.2 官网的时空动作检测的配置文件系统解析（Config S…

人工智能 2023年6月24日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch 官方文档教程整理 (一)

Pytorch 官方文档教程整理 (一)

未完待续

大家都在看