PYTORCH: 60分钟 | 训练一个分类器

2023年7月25日上午2:28 • 技术杂谈 • 阅读 75

你已经知道怎样定义神经网络，计算损失和更新网络权重。现在你可能会想，

那么，数据呢？

通常，当你需要解决有关图像、文本或音频数据的问题，你可以使用python标准库加载数据并转换为numpy array。然后将其转换为 torch.Tensor。

对于图像，例如Pillow，OpenCV
对于音频，例如scipy和librosa
对于文本，原生Python或基于Cython的加载，或NLTK和SpaCy

针对视觉领域，我们创建了一个名为 torchvision 的包，拥有用于ImageNet、CIFAR10、MNIST等常见数据集加载的data loaders，以及用于图片变换的data transfomer，即， torchvision.datasets 和 torch.utils.data.DataLoader。

这提供了很大的方便，避免重复造轮子。

在本教程中，我们将使用CIFAR10数据集。它包括：”airplane”，”automobile”，”bird”，”cat”，”deer”，”dog”，”frog”，”horse”，”ship”，”truck”。CIFAR-10的图片大小是3x32x32，也就是3通道、大小32×32像素。

cifar10

训练一个图片分类器

我们将依次进行以下步骤

使用torchvision加载CIFAR10训练集和测试集，并进行标准化
定义一个卷积神经网络
定义一个损失函数
在训练集上训练网络
在测试集上测试网络

1. 加载和标准化CIFAR10

使用 torchvision，加载CIFAR10非常容易。

import torch
import torchvision
import torchvision.transforms as transforms

torchvision数据集输出的是范围[0, 1]、PILImage格式的图片。我们将其归一化到[-1, 1]，并转换为Tensor。

注意：如果你在Windows上运行，并出现BrokenPipeError，尝试设置torch.utils.data.DataLoader()的num_worker为0

transform = transforms.Compose(
    [transforms.ToTensor(),
    # &#x9010;&#x901A;&#x9053;&#x6807;&#x51C6;&#x5316;&#xFF0C;&#x8FD9;&#x91CC;&#x4F20;&#x5165;&#x7684;mean=std=(0.5,0.5,0.5)&#x662F;&#x56FA;&#x5B9A;&#x503C;&#xFF0C;&#x8FD9;&#x4E00;&#x505A;&#x6CD5;&#x53EF;&#x4EE5;&#x4F7F;&#x4F20;&#x5165;&#x7684;[0,1]&#x7684;tensor
    # &#x8F6C;&#x6362;&#x4E3A;[-1,1]&#xFF0C;&#x4F46;&#x53EF;&#x80FD;&#x4E0D;&#x7B26;&#x5408;&#x6B63;&#x6001;&#x5206;&#x5E03;&#xFF0C;&#x9664;&#x975E;&#x4F20;&#x5165;&#x7684;&#x662F;&#x6839;&#x636E;&#x5B9E;&#x9645;&#x6570;&#x636E;&#x8BA1;&#x7B97;&#x7684;mean&#x548C;std
     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

batch_size = 4

trainset = torchvision.datasets.CIFAR10(root='./data', train=True,
                                        download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=batch_size,
                                        shuffle=True, num_workers=2)

testset = torchvision.datasets.CIFAR10(root='./data', train=False,
                                       download=True, transform=transform)
testloader = torch.utils.data.DataLoader(testset, batch_size=batch_size,
                                         shuffle=False, num_workers=2)

classes = ('plane', 'car', 'bird', 'cat',
           'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

输出：

Downloading https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz to ./data/cifar-10-python.tar.gz
Extracting ./data/cifar-10-python.tar.gz to ./data
Files already downloaded and verified

查看一些训练图片

import matplotlib.pyplot as plt
import numpy as np

functions to show an image
def imshow(img):
    # &#x8FD9;&#x91CC;&#x4EC5;&#x4EC5;&#x662F;&#x5C06;[-1,1]&#x7684;&#x503C;&#x8F6C;&#x6362;&#x4E3A;[0,1]
    img = img / 2 + 0.5 # unnormalize
    npimg = img.numpy()
    plt.imshow(np.transpose(npimg, (1, 2, 0)))

get some random training images
dataiter = iter(trainloader)
images, labels = dataiter.next() # &#x53D6;1&#x4E2A;batch

show images
.make_grid()&#x5C06;4D&#xFF08;BxCxHxW&#xFF09;mini-batch&#x7684;Tensor&#x6216;&#x540C;&#x6837;&#x5927;&#x5C0F;&#x7684;&#x56FE;&#x7247;list&#x62FC;&#x6210;&#x4E00;&#x526F;&#x56FE;&#x7247;
imshow(torchvision.utils.maker_grid(images))
&#x6253;&#x5370;labels
&#x5FAA;&#x73AF;&#x8BFB;&#x53D6;batch&#x4E2D;&#x6BCF;&#x4E2A;&#x56FE;&#x7247;&#x7684;label&#xFF08;&#x6570;&#x5B57;&#xFF09;&#xFF0C;&#x5E76;&#x628A;&#x5176;&#x5BF9;&#x5E94;&#x7684;&#x7C7B;&#x522B;&#x6253;&#x5370;&#x51FA;&#x6765;&#xFF08;&#x5B57;&#x7B26;&#x4E32;&#xFF09;
print(' '.join('%5s' % classes[labels[j]] for j in range(batch_size)))

输出：

   cat plane  bird  ship

2. 定义一个卷积神经网络

拷贝之前的”Neural Network”节内的神经网络，并且修改成接受3-channel的图片（代替之前定义的1-channel图片）

import torch.nn as nn
import torch.nn.functional as F

class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = torch.flatten(x, 1) # flatten all dimensions except batch
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

net = Net()

3. 定义损失函数和优化器

使用Classification Cross-Entropy损失函数和SGD with momentum优化器。

import torch.optim as optim

criterion = nn.CrossEntropyLoss()
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

4. 训练网络

事情变得有趣了起来，我们只需要循环遍历数据迭代器，并将输入提供给网络进行优化即可。

for epoch in range(2): # loop over the dataset multiple times

    running_loss = 0.0
    # &#x6CBF;&#x7740;&#x7B2C;&#x4E00;&#x4E2A;&#x7EF4;&#x5EA6;&#xFF08;batchs&#xFF09;&#x679A;&#x4E3E;
    for i, data in enumerate(trainloader, 0):
        inputs, labels = data

        # zero the parameter gradients
        optimizer.zero_grad()

        # forward + backward + optimize
        outputs = net(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

        # print statistics
        running_loss += loss.item()
        if i % 2000 == 1999: # print every 2000 mini-batches
            print('[%d, %5d] loss: %.3f' %
                   (epoch + 1, i + 1, running_loss / 2000))
            running_loss = 0.0
print('Finished Training')

输出：

[1,  2000] loss: 2.128
[1,  4000] loss: 1.793
[1,  6000] loss: 1.649
[1,  8000] loss: 1.555
[1, 10000] loss: 1.504
[1, 12000] loss: 1.444
[2,  2000] loss: 1.379
[2,  4000] loss: 1.344
[2,  6000] loss: 1.336
[2,  8000] loss: 1.327
[2, 10000] loss: 1.294
[2, 12000] loss: 1.280
Finished Training

快速保存模型

PATH = './cifar_net.pth'
torch.save(net.state_dict(), PATH)

这里有关于保存PyTorch模型更多的细节。

5. Test the network on the test data

我们已经遍历2次训练集来训练网络了。但我们需要检查该网络是否已经学会了所有东西。

我们将通过对比神经网络输出预测的类别标签和真值来检查该网络的性能。如果预测是正确的，我们会将其添加到正确预测的列表中。

第一步,先展示测试集图片熟悉一下。

dataiter = iter(testloader)
images, labels = dataiter.next()

print images
imshow(torchvision.utils.make_grid(images))
print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range(4)))

输出：

GroundTruth:   cat  ship  ship plane

接下来，把我们保存的模型加载进来（注意：保存和重新加载在这里不是必须的，我们只是去展示怎么做）：

net = Net()
net.load_state_dict(torch.load(PATH))

现在，让我们来看一下神经网络对以上样例是怎么判断的：

outputs = net(images)

outputs是10类对应的分数。某类的分数越高，那么网络就越认为图片对应该类。所以，让我们获取最高分数的索引：

outputs&#x7684;&#x7EF4;&#x5EA6;&#x5E94;&#x8BE5;&#x662F;4x10&#xFF08;4&#x4E2A;&#x6837;&#x672C;&#xFF0C;&#x6BCF;&#x4E2A;&#x6837;&#x672C;10&#x4E2A;&#x7C7B;&#x522B;&#x5206;&#x6570;&#xFF09;
&#x8FD9;&#x91CC;&#x6CBF;&#x7740;&#x7B2C;&#x4E8C;&#x4E2A;&#x7EF4;&#x5EA6;&#x53D6;&#x6700;&#x5927;&#x503C;&#x53CA;&#x5176;&#x7D22;&#x5F15;
_, predicted = torch.max(outputs, 1)

print('Predicted: ', ' '.join('%5s' % classes[predicted[j]]
                               for j in range(4)))

输出：

Predicted:  frog  ship  ship  ship

结果看起来还不错
让我们来看看网络在整个数据集上表现如何

correct = 0
total =0
&#x56E0;&#x4E3A;&#x6211;&#x4EEC;&#x4E0D;&#x662F;&#x8BAD;&#x7EC3;&#xFF0C;&#x6240;&#x4EE5;&#x4E0D;&#x9700;&#x8981;&#x8BA1;&#x7B97;&#x68AF;&#x5EA6;
with torch.no_grad():
    for data in testloader:
        images, labels = data
        # &#x5C06;&#x56FE;&#x7247;&#x8F93;&#x5165;&#x7F51;&#x7EDC;&#x8BA1;&#x7B97;outputs
        outputs = net(images)
        # &#x6700;&#x9AD8;&#x5206;&#x6570;&#x5BF9;&#x5E94;&#x7684;&#x7C7B;&#x522B;&#x5373;&#x4E3A;&#x6211;&#x4EEC;&#x7684;&#x9884;&#x6D4B;&#x503C;
        _, predicted = torch.max(outputs.data, 1)
        total += labels.size(0)
        correct += (predicted == labels).sum().item()
print('Accuracy of the network on the 10000 test images: %d %%' % (100 * correct / total))

输出：

Accuracy of the network on the 10000 test images: 54 %

看起来比随机的准确率10%（随机从10类里面选择1类）要好得多。看起来网络学到了一些东西。

Hmmm，哪些类表现得好一点，哪些类表现得不好：

prepare to count predictions for each class
correct_pred = {classname: 0 for classname in classes}
total_pred = {classname: 0 for classname in classes}

again no gradients needed
with torch.no_grad():
    for data in testloader:
        images, labels = data
        outputs = net(images)
        # &#x4F9D;&#x7136;&#x662F;&#x6C42;&#x51FA;&#x6700;&#x5927;&#x503C;&#x7684;&#x7D22;&#x5F15;&#xFF0C;label&#x4E5F;&#x662F;&#x7C7B;&#x522B;&#x7684;&#x7D22;&#x5F15;&#xFF0C;&#x6240;&#x4EE5;&#x53EF;&#x4EE5;&#x76F4;&#x63A5;&#x6BD4;&#x8F83;
        # &#x5E76;&#x4E14;&#x5747;&#x8DDF;classes&#x662F;&#x5BF9;&#x5E94;&#x7684;&#xFF0C;&#x6240;&#x4EE5;&#x5C31;&#x80FD;&#x627E;&#x5230;&#x5BF9;&#x5E94;&#x7684;&#x7C7B;&#x522B;&#x4E86;
        _, predictions = torch.max(outputs, 1)
        # collect the correct predictions for each class
        for label, prediction in zip(labels, predictions):
            if label == prediction:
                correct_pred[classes[label]] += 1
            total_pred[classes[label]] += 1
for classname, correct_count in correct_pred.items():
    accuracy = 100 * float(correct_count) / total_pred[classname]
    print("Accuracy for class {:5s} is: {:.1f} %".format(classname, accuracy))

输出：

Accuracy for class plane is: 59.4 %
Accuracy for class car   is: 66.7 %
Accuracy for class bird  is: 22.7 %
Accuracy for class cat   is: 52.7 %
Accuracy for class deer  is: 59.1 %
Accuracy for class dog   is: 28.9 %
Accuracy for class frog  is: 70.8 %
Accuracy for class horse is: 57.6 %
Accuracy for class ship  is: 67.4 %
Accuracy for class truck is: 62.2 %

好的，那么接下来呢？

我们怎么将神经网络运行在GPU上嗯？

在GPU上训练

将神经网络转移到GPU上就像如何将Tensor移到GPU上一样。
如果CUDA可用，首先定义设备为第一个可见设备：

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

&#x5047;&#x8BBE;&#x662F;&#x5728;&#x4E00;&#x4E2A;CUDA&#x673A;&#x5668;&#x4E0A;&#xFF0C;&#x90A3;&#x4E48;&#x5E94;&#x8BE5;&#x6253;&#x5370;&#x4E00;&#x4E2A;CUDA&#x8BBE;&#x5907;&#xFF1A;
print(device)

输出：

cuda:0

本节剩下的部分假设 device 是一个CUDA设备

然后下面的方法将递归遍历模型的所有部分，并将它们的参数和缓存转换为CUDA tensors：

net.to(device)

记住你还必须把每一步的inputs和targets送到GPU上。

inputs, labels = data[0].to(device), data[1].to(device)

为什么我没有看到相比CPU有巨大的速度提升？因为网络实在太小了。
练习：尝试提高网络width（第一个 nn.Conv2d 的第二个参数，第二个 nn.Conv2d 的第一个参数，它们必须一样），观察速度提升的如何。

目标达成：

高度理解PyTorch的Tensor库和神经网络
训练一个小型神经网络分类图片

在多GPUs上训练

如果你想看到使用所有GPUs带来更多的速度提升，查看Optional：Data Parallelism

Original: https://www.cnblogs.com/DeepRS/p/15722883.html
Author: Deep_RS
Title: PYTORCH: 60分钟 | 训练一个分类器

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/714160/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

cube.js 0.30.30 之后自定义driver 开发的一些问题说明

private assertDriverFactoryResult( val: DriverConfig | BaseDriver, ) { if (val instanceof …

技术杂谈 2023年5月30日
0070
NTP和chrony时间同步

古代计时方式 ●在远古时期，人类用来确定时间的方式是一些自然界”相对”亘古不变的周期。如地球的公转是为一年，月球的公转是为一月，地球的自转是为一天等，最早的…

技术杂谈 2023年7月24日
0082
关于实现

404. 抱歉，您访问的资源不存在。可能是网址有误，或者对应的内容被删除，或者处于私有状态。代码改变世界，联系邮箱 contact@cnblogs.com 园子的商业化努力-困…

技术杂谈 2023年5月31日
0081
搭建eureka服务注册中心，单机版

单独搭建的搭建springboot项目（1）pom文件 <?xml version="1.0" encoding="UTF-8"?…

技术杂谈 2023年7月23日
0066
华为測试公共子串计算

题目标题：计算两个字符串的最大公共字串的长度，字符不区分大写和小写输入两个字符串输出一个整数案例输入：asdfas werasdfaswer 案例输出：6 #include…

技术杂谈 2023年5月31日
0089
利用select/poll监听多个设备详解

如果一个应用程序去处理多个设备，例如应用程序读取网路数据，按键，串口，一般能想到的有三种方法：方法1：串行+阻塞的方式读取：while(1) {read(标准输入);read(网…

技术杂谈 2023年5月31日
0085
【赵渝强老师】MySQL的闪回

MySQL DBA或开发人员，有时会误删或者误更新数据，如果是线上环境并且影响较大，就需要能快速回滚。传统恢复方法是利用备份重搭实例，再应用去除错误sql后的binlog来恢复数据…

技术杂谈 2023年7月24日
0064
Netty源码分析之自定义编解码器

在日常的网络开发当中，协议解析都是必须的工作内容，Netty中虽然内置了基于长度、分隔符的编解码器，但在大部分场景中我们使用的都是自定义协议，所以Netty提供了 MessageT…

技术杂谈 2023年7月25日
0091
【已解决】error: failed to push some refs to ‘xxx’

【已解决】error: failed to push some refs to ‘xxx’ 【已解决】error: failed to push some …

技术杂谈 2023年6月21日
0093
VScode 安装PHPdebug新版Xdebug3.0

安装 vscode插件 PHP Debug(ctrl+shift+x) 进入Xdebug 官网安装哪个版本可以本地浏览器 http://127.0.0.1/?phpinfo=-…

技术杂谈 2023年5月31日
0066
正则表达式

正则表达式，又称规则表达式（英语：Regular Expression，在代码中常简写为regex、regexp或RE）。正则表达式是对字符串操作的一种逻辑公式，就是用事先定义好的…

技术杂谈 2023年7月25日
0085
【对话生成】常见对话生成数据集整理，含下载链接(更新至2022.06.04)

本文主要整理对话生成领域相关的数据集，尤其是开放域对话生成。当前可以把开放域对话生成任务划分为：传统开放域对话生成、多模态对话生成、情感对话生成、个性化对话生成、策略控制对话生成等…

技术杂谈 2023年7月24日
0067
mybatisplus不支持sum，但支持这个

我们知道，要对数据求和，写sql很简单：select sum(exp) from table_name我们在用mybatisplus做求和计算的时候，mybatisplus的Wra…

技术杂谈 2023年7月11日
0062
Hello World

写Hello World的步骤新建文件夹存放代码新建一个java文件文件后缀名为.java Hello.java 【注意】系统可能没有显示后缀名，需要手动打开（如果没有Win…

技术杂谈 2023年6月21日
0078
Sonarqube安装（Docker）

一，拉取相关镜像并运行拉取sonarqube镜像 docker pull sonarqube:9.1.0-community 在运行之前要提前安装postgres并允许，新建数据…

技术杂谈 2023年7月10日
0072
QQ音乐歌单获取所有歌名tempmonkey

QQ音乐歌单获取所有歌名tempmonkey csharp;gutter:true; // ==UserScript== // @name 歌名获取 // @namespace h…

技术杂谈 2023年5月31日
0075

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30