Pytorch实现手写数字识别【基于全连接神经网络】

2023年7月21日上午5:06 • 人工智能 • 阅读 66

使用pytorch实现手写数字识别的主要步骤如下：

（1） 导入需要的各类包

（2） 定义代码中用到的各个超参数

（3） 对数据进行预处理

（4） 下载和分批加载数据集

（5） 利用nn工具箱构建神经网络模型，实例化模型，并定义损失函数及优化器

（6） 对模型进行训练

（7） 运用训练好的模型在测试集上检验效果

（8） 通过可视化的方法输出模型性能结果

神经网络结构设计如下：
四层神经网络：输入层 + 隐藏层1+ 隐藏层2 + 输出层
（实际上我们激活函数均使用的ReLU）

; 前言

MNIST数据集

torchvision提供的mnist数据集几乎是每个深度学习新手的入门数据集，所以我们先来了解一下它：
MNIST 包括6万张图像和标签的训练集，1万张图像和标签的测试集，每张为28×28大小的灰度图片（784个像素点，每个点用一个浮点数表示其亮度），其中包含一个0-9的数字。我们的任务就是训练一个模型尽可能的准确识别出图像中的数字。

案例说明

本次案例仅简单设计了全连接层，并不包含卷积层、池化层等，因此最终的识别准确率相对来说没有那么高，这样做对于新手来说，一来可以及时巩固神经网络的学习成果，二来可以简化模型复杂度而更加注重了解一个实际项目的完整工作流程，三来也可以后续在此模型基础上添加卷积池化等，进一步感受模型性能的提升。

注：案例中包含大量注释以便理解其含义

1、导入各类需要的包

import torch
import numpy as np

from torchvision.datasets import mnist

import torchvision.transforms as transforms

from torch.utils.data import DataLoader

from torch import nn

import torch.nn.functional as F

import torch.optim as optim

import matplotlib.pyplot as plt

2、定义超参数


train_batch_size = 64
test_batch_size = 128
num_epoches = 20
lr = 0.01
momentum = 0.5

3、预处理数据

由于pytorch读取数据集minst中的图像时默认使用python中的PIL，所以我们首先需要把PIL图像转化为更加适合pytorch计算使用的图像张量，其次需要把原始0 ~ 255之间的像素值通过归一化处理成0 ~ 1之间的值，这两步预处理的目的都是欲使数据在神经网络中运算更高效。

transforms.ToTensor()
作用就是将PIL中28×28的灰度图像转化为tensor张量其维度为1x28x28（CxWxH）其中1的含义为单通道（彩色图像时调整为三通道）

transforms.Normalize([0.1307], [0.3081])
使用minst数据集的均值和标准差将数据标准化处理


transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize([0.1307], [0.3081])])

4、加载数据集

之所以要分批加载数据集，是因为虽然我们的mnist数据集只有几十兆完全可以一次性加载进内存以供训练模型使用，但是当我们的训练的模型需要的数据集大小远超我们内存大小时，分批加载数据就可以解决这一问题。


train_dataset = mnist.MNIST('.\data', train=True, transform=transform, download=True)
test_dataset = mnist.MNIST('.\data', train=False, transform=transform,download=True)

train_loader = DataLoader(train_dataset, batch_size=train_batch_size, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=test_batch_size, shuffle=False)

5、定义神经网络模型并实例化


class Net(nn.Module):
    def __init__(self,in_dim,n_hidden_1,n_hidden_2,out_dim):
        super(Net,self).__init__()
        self.layer1=nn.Sequential(nn.Linear(in_dim,n_hidden_1),nn.ReLU(True))
        self.layer2=nn.Sequential(nn.Linear(n_hidden_1,n_hidden_2),nn.ReLU(True))
        self.layer3=nn.Linear(n_hidden_2,out_dim)
    def forward(self,x):
        x=self.layer1(x)
        x=self.layer2(x)
        x=self.layer3(x)
        return x

device=torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')

model=Net(28*28,300,100,10)

model.to(device)

criterion=nn.CrossEntropyLoss()
optimizer=optim.SGD(model.parameters(),lr=lr,momentum=momentum)

其中：CrossEntropyLoss() == LogSoftmax() + NLLLoss()
Softmax： 在K分类问题中，此函数运算公式如下所示，可将K个输入值经过运算后得到的K个输出值拥有两个特性：（1）每个输出都大于0（2）K个输出之和等于1，由此K个输出即可代表每个分类的概率大小。

NLLLoss: 负对数似然损失函数，公式如下所示，其中Y帽即为Softmax中输出的概率，Y为图像真实标签值

6、模型训练及测试


losses = []
acces = []
eval_losses = []
eval_acces = []

for epoch in range(num_epoches):
    train_loss = 0
    train_acc = 0
    model.train()

    if epoch%5==0:
        optimizer.param_groups[0]['lr'] *= 0.9
    for img, label in train_loader:
        img = img.to(device)
        label = label.to(device)
        img = img.view(img.size(0), -1)

        out = model(img)
        loss = criterion(out, label)

        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

        train_loss += loss.item()

        _, pred = out.max(1)

        num_correct = (pred == label).sum().item()

        acc = num_correct / img.shape[0]
        train_acc += acc

    losses.append(train_loss / len(train_loader))
    acces.append(train_acc / len(train_loader))

    eval_loss = 0
    eval_acc = 0

    model.eval()

    for img, label in test_loader:
        img=img.to(device)
        label = label.to(device)
        img = img.view(img.size(0), -1)
        out = model(img)
        loss = criterion(out, label)

        eval_loss += loss.item()

        _, pred = out.max(1)
        num_correct = (pred == label).sum().item()
        acc = num_correct / img.shape[0]
        eval_acc += acc

    eval_losses.append(eval_loss / len(test_loader))
    eval_acces.append(eval_acc / len(test_loader))

    print('epoch: {}, Train Loss: {:.4f}, Train Acc: {:.4f}, Test Loss: {:.4f}, Test Acc: {:.4f}'
          .format(epoch, train_loss / len(train_loader), train_acc / len(train_loader),
                     eval_loss / len(test_loader), eval_acc / len(test_loader)))

训练结果如下：

; 7、模型训练结果可视化


plt.title('train loss')
plt.plot(np.arange(len(losses)), losses)
plt.legend(['Train Loss'], loc='best')

输出结果如下：

如下图所示，比较直观的看出模型的损失函数趋于收敛

Original: https://blog.csdn.net/weixin_44851176/article/details/125858319
Author: consult_
Title: Pytorch实现手写数字识别【基于全连接神经网络】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/706401/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

中介效应检验（一）

一、中介效应开篇前，我们先看看学者是如何定义中介效应的。根据温忠麟等（2004）学者的观点：考虑自变量X对因变量Y的影响，如果X通过影响变量M来影响Y，则称M为中介变量。例如，…

人工智能 2023年7月15日
0076
Swin Transformer详解

目录 * – 1. Swin Transformer整体架构 – + (a) Architecture + (b) Two Successive Swin …

人工智能 2023年7月12日
0073
R语言大作业

2022春期末总结报告题目：要求：1. 数据要求：自己任意选择一个数据集，数据量不少于4000条。（1.可在数据集网站中选择，如kaggle等。2.从网上爬取数据） 2. 数据…

人工智能 2023年7月15日
00133
甲基化系列 3. 甲基化芯片数据分析完整版（ChAMP）

点击关注，桓峰基因桓峰基因生物信息分析，SCI文章撰写及生物信息基础知识学习：R语言学习，perl基础编程，linux系统命令，Python遇见更好的你 104篇原创内容公众…

人工智能 2023年7月15日
0062
git三大对象

文章目录 git三大对象 * 概述： – Git对象注意：演示+分析 – 涉及命令 blob对象(数据对象) tree（树对象） commit（提交对象…

人工智能 2023年6月26日
0077
kaggle实战：基于6大回归模型预测航空公司机票

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月17日
0085
VisionTransformer（二）—— 多头注意力-Multi-Head Attention及其实现

多头注意力-Multi-Head Attention及其实现目录多头注意力-Multi-Head Attention及其实现前言一、为什么要有Attention，注意力是什…

人工智能 2023年7月28日
0083
数据库实时同步利器——CDC（变化数据捕获技术）

在进行数据ETL过程中，我们经常需要通过周期性的定时调度将业务数据按照T+1的方式同步到数据仓库中，进行数据分析处理，最终通过BI报表展示给最终用户。但这种方式实时性较差，用户往往…

人工智能 2023年6月19日
00108
Linux搭建深度学习平台tensorflow，并使用jupyter notebook远程访问服务器。

文章目录前言一、Tensorflow 二、screen命令运行jupyter notebook 前言本文介绍如何搭建深度学习平台，并在jupyter notebook上运行…

人工智能 2023年5月24日
0074
pytorch框架自动调整学习率的几种方式

目录 * – 一、前言 – 二、Pytorch中自动调整学习率的几种方式 – + 2.1 ExponentialLR-指数衰减方式 + 2.2 …

人工智能 2023年7月20日
0079
【推荐收藏】深度好文：带你全面了解《知识图谱》

一文带你了解《知识图谱》新技术自然语言处理 * 自然语言处理发展历程（1）自然语言处理发展历程（2）自然语言处理发展历程（3）知识图谱典型的知识图谱 * WordNet …

人工智能 2023年6月1日
0079
激活函数Swish和Hardswish简介

前言 Swish激活函数和Hardswish激活函数学习笔记。 Swish论文 Searching for Activation Functions，Google出品。论文摘要翻…

人工智能 2023年6月17日
0070
在tensorflow2.0环境下使用RandLA-Net训练Semantic3D数据集

最近在做点云语义分割，RandLA-Net是比较新的针对大规模点云的语义分割网络，之前一直使用的是torch版本的代码在训练自己的数据集，训练结果一直很差，同时我在Semantic…

人工智能 2023年5月25日
00112
Competence-based Multimodal Curriculum Learning for Medical Report Generation (ACL 2021) 解读+总结

论文：https://web.pkusz.edu.cn/adsp/files/2021/07/ACL2021_CMCL1.pdf 摘要：针对两个问题：【1】严重的数据偏差：视…

人工智能 2023年5月28日
00105
PyTorch中的自动微分是什么？为什么它在深度学习中很重要

什么是PyTorch中的自动微分？在深度学习中，自动微分是一种计算机技术，用于计算复杂函数的导数。在PyTorch中，自动微分是一个重要的功能，它可以根据输入和参数自动计算神经网…

人工智能 2024年1月3日
0051

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch实现手写数字识别【基于全连接神经网络】

MNIST数据集

案例说明

训练结果如下：

输出结果如下：

大家都在看