【Pytorch】MNIST 图像分类代码 – 超详细解读

2023年7月20日下午11:22 • 人工智能 • 阅读 77

最近机器学习在低年级本科生中热度剧增，小编经常看见在自习室里啃相关书籍的小伙伴。但由于缺少经验指导，也许原理清楚了，但是由于很多书中对细节上的函数等等介绍不多，很多小伙伴对于具体代码只是一知半解。这篇文章基于当下最热门的学习框架 Pytorch，详细讲解图像分类中最基础的图像分类 —— MNIST 数据集分类。
同时，希望这篇文章会帮助大家领会基本的深度学习思路。

看本文之前，需掌握基础的深度学习知识（包括CNN（卷积神经网络））。 如没有基础或者基础薄弱，请至少先按照此表格顺序熟悉一下相关内容：

熟悉以上文章之后，基本就可以开始阅读这篇博客啦！

文章中遇到任何关于Pytorch框架代码的问题，可先查询快速手册 – Pytorch官网相关内容。如未找到，请在Pytorch官网查询。

一、代码框架

下面是我本人比较喜欢的代码框架，可以参考。

文件名： model.py

1.引入包
2.设置相关参数
3.处理数据集
—— 定义transform
—— 导入数据集
—— 装载（DataLoader）
—— 预览（可选）
4.构建网络
5.训练
6.保存模型

二、实现代码

1.引入包

代码如下：

import torch
import torch.nn as nn
from torch.nn import Sequential
from matplotlib import pyplot as plt
import torchvision.datasets as datasets
from torch.utils.data import DataLoader
from torchvision.utils import make_grid
import torchvision.transforms as transforms

包名功能torch核心包torch.nn包含神经网络的Modules和用来继承的包以及一些函数方法（nn.functional）torchvision包含一些数据集、模型、图像处理方法torch.utils一个工具包matplotlib用于显示数据集图片

2.设置相关参数

epochs = 10
batch_size = 64
lr = 0.001

参数意义epochs被训练几轮batch_size每批次大小，即每轮迭代训练时每次的数据量lrlearning rate，即学习率。一般用很小的值

这里详细解释一下 epochs和 batch_szie：
-> batch_size表示每轮迭代训练时每次训练的数据量；
-> epochs表示训练几轮。

每一次迭代（Iteration）都是一次权重更新，每一次权重更新需要batch_size个数据进行正向传递（Forward）运算得到损失函数，再通过反向传导（Backward）更新参数（注意，在这个过程中需要把梯度（Grad）设置为0，这个后面再讲）。1个迭代等于使用 batch_size个样本训练一次。比如有256个样本数据，完整训练完这些样本数据需要：
-> batch_size=64；
-> 迭代4次；
-> epochs=1。

而通常会将 epochs设为不仅1次，这就跟磨面一样，磨完一轮不够，磨多轮才能得到更加精细的面粉。

3.处理数据集


transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize(
        mean=[0.5, ],
        std=[0.5, ]
    )
])

data_train = datasets.MNIST(root='data/', transform=transform, train=True, download=True)

data_test = datasets.MNIST(root='data/', transform=transform, train=False)

dataloader_train = DataLoader(dataset=data_train, batch_size=64, shuffle=True)

dataloader_test = DataLoader(dataset=data_test, batch_size=64, shuffle=True)

除了 代码内的注释 之外，在这段代码中一些方法或参数的解释如下。

对于 transform：

参数意义transforms.ToTensor()把数据转换为张量（Tensor）transforms.Normalize标准化，即使数据服从期望值为 0，标准差为 1 的正态分布mean期望std标准差

对于 datasets.MNIST：

参数意义root数据集（此处为MNIST）路径transform转换形式train是否训练。对于训练集，train=True，对于测试集，train=Falsedownload是否下载（会自动判断是否下载过或数据集是否存在于root下，是的话再次训练时就不下载了）

对于 DataLoader：

参数意义dataset要处理的数据集batch_size批次大小shuffle是否打乱数据顺序

预览（可选）


images, labels = next(iter(dataloader_train))
img = make_grid(images)
img = img.numpy().transpose(1, 2, 0)
mean = [0.5, 0.5, 0.5]
std = [0.5, 0.5, 0.5]
img = img * std + mean
print([labels[i] for i in range(16)])
plt.imshow(img)
plt.show()

方法作用iter(dataloader_train)生成dataloader_train的迭代器next返回迭代器的下一个项目（配合iter()使用）make_grid生成网格img.numpy().transpose(1, 2, 0)将img的numpy数组矩阵的C、W、H位置调换。括号内的1, 2, 0表示将原来第1, 2, 0位置换位0, 1, 2（即把原本[C, W, H]矩阵转换为[H, W, C]矩阵。Pytorch中使用的数据格式与plt.imshow()函数的格式不一致，Pytorch中为[C, H, W]，而plt.imshow()中则是[H, W, C]。其中C=Channel，即颜色通道；H=Height，图像长度；Width，图片宽度）plt.imshow(img)和plt.show()显示图片

效果：

4.构建网络


class CNN(nn.Module):
    def __init__(self):

        super(CNN, self).__init__()

        self.conv1 = Sequential(
            nn.Conv2d(in_channels=1, out_channels=64, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.conv2 = Sequential(
            nn.Conv2d(in_channels=64, out_channels=128, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.dense = Sequential(
            nn.Linear(7 * 7 * 128, 1024),
            nn.ReLU(),
            nn.Dropout(p=0.5),
            nn.Linear(1024, 10)
        )

    def forward(self, x):
        x1 = self.conv1(x)
        x2 = self.conv2(x1)
        x = x2.view(-1, 7 * 7 * 128)
        x = self.dense(x)
        return x

除了 代码内的注释 之外，在这段代码中一些方法或参数的解释如下：

方法或参数意义或作用nn.Conv2d对二维图像的卷积操作。其中 in_channels

代表输入通道， out_channels

代表输出通道， kernel_size

代表卷积核大小（n * n）， stride

代表卷积核移动的步长， padding

代表填充大小（属于基础内容。具体内容请自行百度）nn.BatchNorm2dBatch Normalization（BN），批标准化。使一批次特征图（Feature Map）满足均值为0，方差为1的正态分布。作用：加速收敛；控制过拟合，以少用或不用Dropout和正则；降低网络对初始化权重不敏感；允许使用较大的学习率nn.ReLU一种常用激活函数，不作赘述nn.MaxPool2d对二维图像做最大池化处理，不做赘述nn.Linear不再赘述nn.DropoutDropout，防止过拟合，不做赘述x2.view(-1, 7 * 7 * 128)参数扁平化，使全连接层输出的参数维度和其输入维度匹配

5.训练

6.保存模型

torch.save(cnn, 'data/model.pth')

恭喜！如果你做到了这一步，训练的所有步骤就完成啦！

MNIST 图像识别完整代码如下：

import torch
import torch.nn as nn
from torch.nn import Sequential
from matplotlib import pyplot as plt
import torchvision.datasets as datasets
from torch.utils.data import DataLoader
from torchvision.utils import make_grid
import torchvision.transforms as transforms

epochs = 10
batch_size = 64
lr = 0.001

transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize(
        mean=[0.5, ],
        std=[0.5, ]
    )
])

data_train = datasets.MNIST(root='data/', transform=transform, train=True, download=True)

data_test = datasets.MNIST(root='data/', transform=transform, train=False)

dataloader_train = DataLoader(dataset=data_train, batch_size=64, shuffle=True)

dataloader_test = DataLoader(dataset=data_test, batch_size=64, shuffle=True)

images, labels = next(iter(dataloader_train))
img = make_grid(images)
img = img.numpy().transpose(1, 2, 0)
mean = [0.5, 0.5, 0.5]
std = [0.5, 0.5, 0.5]
img = img * std + mean
print([labels[i] for i in range(16)])
plt.imshow(img)
plt.show()

class CNN(nn.Module):
    def __init__(self):

        super(CNN, self).__init__()

        self.conv1 = Sequential(
            nn.Conv2d(in_channels=1, out_channels=64, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(64),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.conv2 = Sequential(
            nn.Conv2d(in_channels=64, out_channels=128, kernel_size=3, stride=1, padding=1),
            nn.BatchNorm2d(128),
            nn.ReLU(),
            nn.MaxPool2d(kernel_size=2, stride=2)
        )

        self.dense = Sequential(
            nn.Linear(7 * 7 * 128, 1024),
            nn.ReLU(),
            nn.Dropout(p=0.5),
            nn.Linear(1024, 10)
        )

    def forward(self, x):
        x1 = self.conv1(x)
        x2 = self.conv2(x1)
        x = x2.view(-1, 7 * 7 * 128)
        x = self.dense(x)
        return x

def get_Variable(x):
    x = torch.autograd.Variable(x)

    return x.cuda() if torch.cuda.is_available() else x

cnn = CNN()

if torch.cuda.is_available():
    cnn = cnn.cuda()

loss_F = nn.CrossEntropyLoss()

optimizer = torch.optim.Adam(cnn.parameters(), lr=lr)

for epoch in range(epochs):
    running_loss = 0.0
    running_correct = 0.0
    print("Epoch [{}/{}]".format(epoch, epochs))
    for data in dataloader_train:

        X_train, y_train = data
        X_train, y_train = get_Variable(X_train), get_Variable(y_train)
        outputs = cnn(X_train)
        _, pred = torch.max(outputs.data, 1)

        optimizer.zero_grad()

        loss = loss_F(outputs, y_train)

        loss.backward()

        optimizer.step()

        running_loss += loss.item()
        running_correct += torch.sum(pred == y_train.data)

    testing_correct = 0.0

    for data in dataloader_test:
        X_test, y_test = data
        X_test, y_test = get_Variable(X_test), get_Variable(y_test)
        outputs = cnn(X_test)
        _, pred = torch.max(outputs, 1)
        testing_correct += torch.sum(pred == y_test.data)

    print("Loss: {:.4f}  Train Accuracy: {:.4f}%  Test Accuracy: {:.4f}%".format(
        running_loss / len(data_train), 100 * running_correct / len(data_train),
        100 * testing_correct / len(data_test)))

torch.save(cnn, 'data/model.pth')

注：在 inference.py内加载模型时：


cnn = torch.load('data/model.pth')
cnn.eval()

三、其他

作者是某高校大二学生，计算机科学与技术在读。大一下学期接触机器学习，之前主攻超分辨率重构。机器学习纯属业余爱好，几乎无人指导，故文章若有纰漏，望批评指正！

*本博客部分内容来源于网络。

Original: https://blog.csdn.net/qq_25426559/article/details/121712992
Author: 千鱼干
Title: 【Pytorch】MNIST 图像分类代码 – 超详细解读

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/705939/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

小样本利器3. 半监督最小熵正则 MinEnt & PseudoLabel代码实现

在前两章中我们已经聊过对抗学习FGM，一致性正则Temporal等方案，主要通过约束模型对细微的样本扰动给出一致性的预测，推动决策边界更加平滑。这一章我们主要针对低密度分离假设，聊…

人工智能 2023年6月4日
0076
模拟量分布式IO模块BL200Pro逻辑运算

模拟量分布式IO模块BL200Pro组合逻辑说明传送带没有运行，电机的温度超过 50 度，风扇开启，触发报警器 DO4 寄存器REG1003。步骤说明：（ 1 ）在组合逻辑项，…

人工智能 2023年6月27日
0088
使用 Logistic 回归进行鸢尾花品种分类【课堂笔记】

前言感觉如果只是看一遍老师提供的课件的话，对 pandas 库以及 sklearn 库中许多功能还是没有一个全面的认识，我感觉还是得自己多动手实践一下才行。（下文代码中使用的库均…

人工智能 2023年6月17日
0072
【微信小程序 | 实战开发】配置微信小程序APPID并快速接入

微同商城是一个以Java进行开发_的 _微信小程序_商城源码。减少重复造轮子，开源 _微信小程序_商城（前后端开源：uni _app+Java），秒杀、优惠券、多商户、直播卖货…

人工智能 2023年5月30日
0089
中文NER的那些事儿6. NER新范式！你问我答之MRC详解&代码实现

就像Transformer带火了”XX is all you need”的论文起名大法，最近也看到了好多”Unified XX Framewor…

人工智能 2023年6月4日
0090
孪生网络（Siamese Network）实现手写数字聚类

Siamese Network通常用于小样本的学习，是meta learning的方法。 Siamese Network，其使用CNN网络作为特征提取器，不同类别的样本，共用一个C…

人工智能 2023年6月2日
00121
【机器学习】之第十三章——半监督学习

13.1、未标记样本在现实生活中，通常学习任务是已标记样本较少，而未标记的样本很多，那么按照传统监督学习的思想，便只能用已标记的少部分样本去训练学习器，这将会导致学习器的泛…

人工智能 2023年7月16日
0062
YOLOv5的Tricks | 【Trick12】YOLOv5使用的数据增强方法汇总

如有错误，恳请指出。时隔两个多月重新看yolov5的代码显然开始力不从心，当时应该一鼓作气的整理完的。在专栏前面的内容一直介绍的是yolov5训练时候使用的一些技巧，这里用这篇…

人工智能 2023年6月16日
0088
数字图像处理第四章——频率域滤波

目录 4.1 基本概念 4.1.1 复数 4.1.2 傅立叶级数 4.1.3 冲激及其取样特性 4.1.4 连续变量函数的傅里叶变换 4.1.5 卷积 4.2 取样和取样函数的傅里…

人工智能 2023年6月20日
00107
【图像处理】高斯模糊、高斯函数、高斯核、高斯卷积操作

通常，图像处理软件会提供”模糊”（blur）滤镜，使图片产生模糊的效果。 “模糊”的算法有很多种，其中有一种叫做”高斯模…

人工智能 2023年5月26日
00179
用Python进行GEO数据挖掘（学习笔记四）：富集分析

在之前我们已经的到了差异表达基因（数据/矩阵），接下来就可以进行富集分析了！ python的第三方库GSEApy就是专门用来做富集分析的。在正式操作之前，先了解富集分析的原理。 1…

人工智能 2023年6月19日
00242
Python中tensorflow Import使用错误集合

cannot import name ‘BatchNormalization’ from ‘keras.layers.normalization…

人工智能 2023年5月24日
0074
No module named ‘torchvision.models.utils‘

笔者在使用 pytorch=1.10.0, torchvision=0.11.1 的环境运行代码时，运行到语句 from torchvision.models.utils impo…

人工智能 2023年6月16日
0071
分布式事务及解决方案

前言分布式事务也不是一开始就出现的，它是随着技术架构的演变才渐渐发生的，所以在讲分布式事务之前有必要说下本地事务的概念本地事务事务有四个特性，如下一致性：数据操作前后需要一…

人工智能 2023年6月30日
00118
深度剖析monai(一) Data和Transforms部分

目录前言简单使用其他数据增强方法自定义数据读取器自定义数据增强操作总结前言最近没什么事，研究了一下 monai，它是一个优秀的基于 pytorch的医学深度学习框架…

人工智能 2023年7月27日
0056
【数值分析】用幂法计算矩阵的主特征值和对应的特征向量（附matlab代码）

题目用幂法计算下列矩阵的按模最大特征值及对应的特征向量 ; 幂法代码 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%% % &#x7…

人工智能 2023年6月26日
00172

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【Pytorch】MNIST 图像分类代码 – 超详细解读

目录

1.引入包

2.设置相关参数

3.处理数据集

4.构建网络

5.训练

6.保存模型

大家都在看