PyTorch 介绍 | 快速开始

2023年6月16日上午6:48 • Linux • 阅读 88

本节介绍有关机器学习常见任务重的API。请参阅每一节的链接以深入了解。

Working with data

PyTorch有两个有关数据工作的原型： torch.utils.data.DataLoader 和 torch.utils.data.Dataset。 Dataset 存储了样本及其对应的标签，而 DataLoader为 Dataset 生成了一个迭代器。

import torch
from torch import nn
from torch.utils.data import DataLoader
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda, Compose
import matplotlib.pyplot as plt

torchvision.datasets 模块包含多种真实世界的视觉数据集 Dataset 对象，如CIFAR、COCO（full list here）。本教程中，我们使用FashionMNIST数据集。每个TorchVision Dataset 均包括两个参数： transform 和 target_transform分别用于修改样本和标签。

&#x4ECE;&#x516C;&#x5F00;&#x6570;&#x636E;&#x96C6;&#x4E0A;&#x4E0B;&#x8F7D;&#x8BAD;&#x7EC3;&#x6570;&#x636E;
training_data = datasets.FashionMNIST(
    root='data',
    train=True,
    download=True,
    transform=ToTensor(),
)

Download test data from open datasets.

test_data = datasets.FashionMNIST(
    root='data',
    train=False,
    download=True,
    transform=ToTensor(),
)

输出：

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-images-idx3-ubyte.gz to data/FashionMNIST/raw/train-images-idx3-ubyte.gz
Extracting data/FashionMNIST/raw/train-images-idx3-ubyte.gz to data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/train-labels-idx1-ubyte.gz to data/FashionMNIST/raw/train-labels-idx1-ubyte.gz
Extracting data/FashionMNIST/raw/train-labels-idx1-ubyte.gz to data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-images-idx3-ubyte.gz to data/FashionMNIST/raw/t10k-images-idx3-ubyte.gz
Extracting data/FashionMNIST/raw/t10k-images-idx3-ubyte.gz to data/FashionMNIST/raw

Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz
Downloading http://fashion-mnist.s3-website.eu-central-1.amazonaws.com/t10k-labels-idx1-ubyte.gz to data/FashionMNIST/raw/t10k-labels-idx1-ubyte.gz
Extracting data/FashionMNIST/raw/t10k-labels-idx1-ubyte.gz to data/FashionMNIST/raw

我们将 Dataset 作为参数传递给 DataLoader。这为我们的dataset包装了一个迭代器，并支持自动生成batch、抽样、打乱和多进程数据加载。这里定义了一个大小为64的batch，即，dataloader迭代的每一个元素将返回一个包含64个样本及对应标签的batch。

batch_size = 64

Create data loaders
train_dataloader = DataLoader(training_data, batch_size=batch_size)
test_dataloader = DataLoader(test_data, batch_size=batch_size)

for X, y in test_dataloader:
    print("Shape of X [N, C, H, W]: ", X.shape)
    print("Shape of y: ", y.shape, y.dtpe)
    break

输出：

Shape of X [N, C, H, W]:  torch.Size([64, 1, 28, 28])
Shape of y:  torch.Size([64]) torch.int64

创建模型

为了在PyTorch定义模型，我们创建了一个类，继承自nn.Module。我们在 __init__函数中定义是网络的layers，并在 forward 函数中指定data如何通过网络。为加快神经网络中的操作，若GPU可用，则把其移动到GPU上。

Get cpu or gpu device for training
device = 'cuda' if torch.cuda.is_availabel() else "cpu"
print(f"Using {device} device")

Define model
class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        self.flatten = nn.Flatten()
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512),
            nn.ReLU(),
            nn.Linear(512, 512),
            nn.ReLU(),
            nn.Linear(512, 10)

        )

    def forward(self, x):
        x = self.flatten(x)
        logits = self.linear_relu_stack(x)
        return logits

model = NeuralNetwork().to(device)
print(model)

输出：

Using cuda device
NeuralNetwork(
  (flatten): Flatten(start_dim=1, end_dim=-1)
  (linear_relu_stack): Sequential(
    (0): Linear(in_features=784, out_features=512, bias=True)
    (1): ReLU()
    (2): Linear(in_features=512, out_features=512, bias=True)
    (3): ReLU()
    (4): Linear(in_features=512, out_features=10, bias=True)
  )
)

优化模型参数

loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=1e-3)

在单个训练循环中，模型在训练集上作出预测（分批喂给模型），并且反向传播预测误差来调整模型参数。

def train(dataloader, model, loss_fn, optimizer):
    size = len(dataloader.dataset)
    model.train()
    for batch, (X, y) in enumerate(dataloader):
        X, y = X.to(device), y.to(device)

        # Compute prediction error
        pred = model(X)
        loss = loss_fn(pred, y)

        # Backpropagation
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        if batch % 100 == 0:
            loss, current = loss.item(), batch * len(x)
            print(f"loss: {loss:>7f} [{current:>5d}/{size:>5d}]")

我们还可以检查模型在测试集上的性能，确保模型是在学习。

def test(dataloader, model, loss_fn):
    size = len(dataloader.dataset)
    num_batches = len(dataloader)
    model.eval()
    test_loss, correct = 0, 0
    with torch.no_grad():
        for X, y in dataloader:
            X, y = X.to(device), y.to(device)
            pred = model(X)
            test_loss += loss_fn(pred, y).item()
            # &#x7B2C;&#x4E00;&#x7EF4;&#x5EA6;&#x662F;batch&#xFF0C;&#x7B2C;&#x4E8C;&#x7EF4;&#x5EA6;&#x662F;&#x9884;&#x6D4B;&#x503C;
            correct += (pred.argmax(1) == y).type(torch.float).sum().item()
    test_loss /= num_batches
    correct /= size
    print(f"Test Error: \n Accuracy: {(100 * correct):>0.1f}%, Avg loss: {test_loss:>8f}\n")

训练过程由几次迭代（ epochs）组成。每一个epoch，模型学习参数，作出更好的预测。我们在每次epoch都打印了模型的准确率和损失，我们希望看到随着每次epoch，准确率升高，而损失降低。

epochs = 5
for t in range(epochs):
    print(f"Epoch {t+1}\n-----------------------")
    train(train_dataloader, model, loss_fn, optimizer)
    test(test_dataloader, model, loss_fn)
print("Done!")

输出：

点击查看代码

`
Epoch 1
loss: 2.169147 [ 0/60000]
loss: 2.165468 [ 6400/60000]
loss: 2.118014 [12800/60000]
loss: 2.129221 [19200/60000]
loss: 2.074899 [25600/60000]
loss: 2.022606 [32000/60000]
loss: 2.033795 [38400/60000]
loss: 1.976709 [44800/60000]
loss: 1.982757 [51200/60000]
loss: 1.881978 [57600/60000]
Test Error:
Accuracy: 57.4%, Avg loss: 1.902724

Epoch 3
loss: 1.592845 [ 0/60000]
loss: 1.556097 [ 6400/60000]
loss: 1.417763 [12800/60000]
loss: 1.478243 [19200/60000]
loss: 1.357680 [25600/60000]
loss: 1.356057 [32000/60000]
loss: 1.360733 [38400/60000]
loss: 1.298324 [44800/60000]
loss: 1.329920 [51200/60000]
loss: 1.219030 [57600/60000]
Test Error:
Accuracy: 63.4%, Avg loss: 1.250318

Epoch 5

Original: https://www.cnblogs.com/DeepRS/p/15727075.html
Author: Deep_RS
Title: PyTorch 介绍 | 快速开始

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/621340/

转载文章受原作者版权保护。转载请注明原作者出处！

Linux

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

秒搞VirtualBox 、CentOS 的安装过程

镜像下载、域名解析、时间同步请点击阿里云开源镜像站一、介绍背景： VirtualBox ：由德国 InnoTek 软件公司出品 Open Source Software, OS…

Linux 2023年5月27日
0086
【证券从业】金融基础知识笔记与思维导图

注1：金融基础知识一本书已整理成完整的思维导图和笔记，需要分享请留言注2：接下来整理金融法律法规，待整理成完整的笔记后再合并 posted @2022-06-29 23:48 陈…

Linux 2023年6月13日
00118
通过示例学习PYTORCH

核心是：PyTorch提供了两个主要的特性：一个n维的Tensor，与Numpy相似但可以在GPU上运行构建和训练神经网络的自动微分我们将使用一个三阶多项式拟合 (y=sin…

Linux 2023年6月14日
00107
pycharm 设置默认换行符

作者：Outsrkem原文链接：https://www.cnblogs.com/outsrkem/p/16488693.html本文版权归作者所有，欢迎转载，但未经作者同意必须保留…

Linux 2023年6月6日
00106
【AutoSAR】 CP 和 AP

概述 AutoSAR,全称为Automotive Open System Architecture(汽车开放系统架构)。是由全球各家汽车制造商、零部件供应商以及各种研究、服务机构共…

Linux 2023年6月13日
00126
2020年12月-第01阶段-前端基础-HTML CSS 项目阶段(四)

品优购项目(四) 1). 详情页 detail.html 常用单词名称说明主体 de_container 面包屑导航 crumb_wrap 产品介绍 product_intr…

Linux 2023年6月8日
0095
MySQL之存储引擎、基本数据类型及约束条件

一、存储引擎数据库存储引擎是数据库底层软件组织，数据库管理系统（DBMS）使用数据引擎进行创建、查询、更新和删除数据。不同的存储引擎提供不同的存储机制、索引技巧、锁定水平等功能，…

Linux 2023年6月14日
0090
【MQTT】iniparser库的安装和使用

iniparser库 * – iniparser库介绍 – 下载库 – iniparser中的API – dictionary中的一…

Linux 2023年6月13日
0096
Elasticsearch_exporter 监控指标

github地址：https://github.com/justwatchcom/elasticsearch_exporter Name Type Cardinality Help…

Linux 2023年5月27日
0082
剑指offer计划29（动态规划困难）—java

1.1、题目1 剑指 Offer 19. 正则表达式匹配 1.2、解法动态规划后面再研究 1.3、代码 class Solution { public boolean isMat…

Linux 2023年6月11日
00106
DNS

DNS是域名系统（Domain Name System）,简单来说就是平时上网输入的URL，如 www.baidu.com 就是域名，而DNS就是将这个域名解析成IP地址，如 ww…

Linux 2023年6月7日
0076
MSSQL·FOR XML PATH语法转义尖括号解决方案

阅文时长 | 0.14分钟字数统计 | 225.6字符主要内容 | 1、引言&背景 2、示例及解决方案 3、声明与参考资料『MSSQL·FOR XML PATH语法转义尖括…

Linux 2023年6月14日
0083
JuiceFS V1.0 RC1 发布，大幅优化 dump/load 命令性能，深度用户不容错过

各位社区的伙伴， JuiceFS v1.0 RC1 今天正式发布了！这个版本中，最值得关注的是对元数据迁移备份工具 dump/load 的优化。这个优化需求来自于某个社区重度用…

Linux 2023年6月14日
0077
linux版powershell中，tab补全，linux外部命令参数名，的模块介绍

关键字 linux powershell pwsh 补全 complete bash zsh 摘要：linux用户的福音！在linux版powershell中，补全linux外部命…

Linux 2023年6月14日
0087
【XML】学习笔记第二章-dtd

XML-DTD DTD语句基本声明语句引用外部DTD DTD元素四种元素类型元素定义关键字修饰符号 DTD中的属性属性修饰属性类型 DTD中的实体和符号符号坑 X…

Linux 2023年6月14日
00117
Windows server 2008 域控制器

Windows的网络架构 Windows的网络架构大致分为：工作组架构域架构工作组架构：工作组是由一组通过网络连接在一起的计算机组成，组内的计算机可以共享本机的文件，打印机等…

Linux 2023年6月7日
0091

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

PyTorch 介绍 | 快速开始

Working with data

创建模型

优化模型参数

大家都在看