Pytorch笔记4：多层感知机实现MNIST数据集分类

2023年7月24日上午5:16 • 人工智能 • 阅读 71

文章目录

前言
一、Torch相关包介绍
二、搭建多层感知机
*
1.MNIST介绍
2.下载MNIST数据集
3.搭建神经网络层
1.权重和偏置
2.定义前向计算网络
3.定义梯度优化器及损失函数设置
4.完成程序设计
三、完整代码程序
总结

前言

复杂的神经网络也是由许多神经元组成，在深度学习领域，神经元即感知机。深度学习通过许多感知机，尽可能的学习一个任务的复杂数学表示。神经网络在模拟生物神经元时，创造性的引入非线性的函数，通过判断是否达到阈值，来觉得信号是否输出，完成信息传递。因此，在阶跃函数的基础上，进一步优化，拓展，得到sigmoid激活函数、Relu、leak ReLu等，细细品味，你将发现这构思的巧妙性、合理性。
本节主要MNIST的代码实现，关于感知机，激活函数等介绍，大家可以参考入手这本书，通俗易懂，内容详实，极具阅读价值。

pdf 地址如下，仅供学习参考：
链接: https://wwe.lanzous.com/ieOE2noazwj.

; 一、Torch相关包介绍

torch.nn ：完成神经网络一些相关操作，包含了在计算机视觉任务中常用到的卷积，池化等一些列API接口实现。
torch.nn.fubctional ：可以比nn更进一步接触实现底层代码的修改。
torch.nn.optim：优化器，提供了学习率设置，及更好的梯度下降方式的选择。
torchvision：计算机视觉任务的工具，提供了常用的数据集，模型，转换函数等。实现视觉类任务如分类、目标检测、分割必不可少的。

导入所需包（示例）：

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets,transforms

若提示出错，可使用命令行窗口，进行 conda install 安装。或者在pycharm中进行安装，以pycharm为例：输入要安装的包，点击安装即可。

二、搭建多层感知机

1.MNIST介绍

MNIST简介: 包含0-9 共10个手写数字，每个数字由7000张（高度28*宽度28）的图像，将70k数据，分为了训练集60K，测试集10大小。本节，通过感知机实现对MNIST手写数字的分类。

代码如下（示例）：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')
import  ssl
ssl._create_default_https_context = ssl._create_unverified_context

2.下载MNIST数据集

如果下载失败，也可使用下载好的数据集，还在目录下：
链接: https://wwe.lanzous.com/b01c9d0sj.

密码:3dii

代码如下：

‘./data’：设置要保存的下载目录。
train=True：设置要下载的是60k的训练数据集。
download=True：如果当前文件夹没有数据集，则从网上下载。
transforms.ToTensor()：下载的数据集为numpy格式，需要转换为张量格式。
transforms.Normalize((0.1307,), (0.3081,)：（此项非必要设置项）为了更好的训练结果，因为图像的数据值是0-1之间，将数据值正则花在0左右，对模型梯度下降效果更好。
batch_size=batch_size, shuffle=True：设置批次大小，随机打算数据。
测试集设置类似

#MNIST 数据集
#设置训练的批次大小、学习率、及训练代数
batch_size=200
learning_rate=0.001
epochs=20

#下载数据集
train_loader = torch.utils.data.DataLoader(
    datasets.MNIST('./data', train=True, download=True,
                   transform=transforms.Compose([
                       transforms.ToTensor(),
                       transforms.Normalize((0.1307,), (0.3081,))
                   ])),
    batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(
    datasets.MNIST('./data', train=False, download=True, transform=transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
    ])),
    batch_size=batch_size, shuffle=True)

3.搭建神经网络层

1.权重和偏置

代码如下：

w1,b1：第一层网络感知机。输入图像大小是28*28=784，因此输入为784，输出设置为100（这个参数随意设置，可以尝试不同的数目查看效果）因为W要转置所以输入放后面，输出放前面。b1为第一层网络对应的偏置项。
w2, b2：与上叙述类似。
==w3, b3 ==：注意输出要与分类的10个数字类别数一致，其他与上述类似。
requires_grad=True：此项设置为 True，表示要对w，b求梯度。

#生成 三个神经网络成，对应感知节分别为第一层100，第二成200，第三层10，即要分类的数目
w1, b1 = torch.randn(100, 784, requires_grad=True),\
         torch.zeros(100, requires_grad=True)
w2, b2 = torch.randn(200, 100, requires_grad=True),\
         torch.zeros(200, requires_grad=True)
w3, b3 = torch.randn(10, 200, requires_grad=True),\
         torch.zeros(10, requires_grad=True)

2.定义前向计算网络

代码如下：

relu激活函数：确保网络的非线性，实现更好的分类效果。

#定义前向网络计算，每层神经网络输出后增加relu激活函数，确保网络的非线性，实现更好的分类效果
def forward(x):
    x = x@w1.t() + b1
    x = F.relu(x)
    x = x@w2.t() + b2
    x = F.relu(x)
    x = x@w3.t() + b3
    x = F.relu(x)
    return x

3.定义梯度优化器及损失函数设置

代码如下：

.CrossEntropyLoss()：损失采用交叉熵损失函数。
.SGD：采用随机梯度下降，并设置学习率。

#定义优化器，采用SGD随机梯度下降的方式对w1, b1, w2, b2, w3, b3进行优化
optimizer = optim.SGD([w1, b1, w2, b2, w3, b3], lr=learning_rate)
#定义采用交叉熵作为损失函数
criteon = nn.CrossEntropyLoss()

4.完成程序设计

代码如下：

#设置迭代次数
for epoch in range(epochs):

    for batch_idx, (data, target) in enumerate(train_loader):
        #将数据打平为（批次，高度*宽度），-1代表所有
        data = data.view(-1, 28*28)

        #将数据输入到网络中
        cal_data = forward(data)
        #将计算的数据与目标数据求误差损失
        loss = criteon(cal_data, target)

        #将梯度值初始化为0
        optimizer.zero_grad()
        #pytorch计算梯度值
        loss.backward()
        #更新梯度值
        optimizer.step()
        #每隔25*batcsize(200) = 5000 打印输出结果
        if batch_idx % 25 == 0:
            print('训练代数: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                       100. * batch_idx / len(train_loader), loss.item()))

    #将测试误差及正确率清0
    test_loss = 0
    correct = 0
    #取测试集数据及目标数据
    for data, target in test_loader:
        data = data.view(-1, 28 * 28)
        logits = forward(data)
        #误差累加
        test_loss += criteon(logits, target).item()
        #取出预测最大值的索引编号，即预测值
        pred = logits.data.argmax(dim=1)
        #统计正确预测的个数
        correct += pred.eq(target.data).sum()

    test_loss /= len(test_loader.dataset)
    #打印输出测试误差及准确率
    print('\n测试集: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
        test_loss, correct, len(test_loader.dataset),
        100. * correct / len(test_loader.dataset)))

三、完整代码程序

因为我们自己随机生成的初始化 w1,w2,w3，达到的性能并不好。所以我们可以采用大神何凯明的初始化权重对 w1，w2，w3 进行初始化赋值,准确率可以达到90%。小伙伴们可以尝试下，将初始化赋值代码屏蔽，对比查看效果。

代码如下：

import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torchvision import datasets,transforms

#MNIST 数据集
#设置训练的批次大小、学习率、及训练代数
batch_size=200
learning_rate=0.001
epochs=20

#下载数据集
train_loader = torch.utils.data.DataLoader(
    datasets.MNIST('./data', train=True, download=True,
                   transform=transforms.Compose([
                       transforms.ToTensor(),
                       transforms.Normalize((0.1307,), (0.3081,))
                   ])),
    batch_size=batch_size, shuffle=True)
test_loader = torch.utils.data.DataLoader(
    datasets.MNIST('./data', train=False, download=True, transform=transforms.Compose([
        transforms.ToTensor(),
        transforms.Normalize((0.1307,), (0.3081,))
    ])),
    batch_size=batch_size, shuffle=True)

#生成三层神经网络成，对应感知机分别为第一层100，第二成200，第三层10，即要分类的数目
w1, b1 = torch.randn(100, 784, requires_grad=True),\
         torch.zeros(100, requires_grad=True)
w2, b2 = torch.randn(200, 100, requires_grad=True),\
         torch.zeros(200, requires_grad=True)
w3, b3 = torch.randn(10, 200, requires_grad=True),\
         torch.zeros(10, requires_grad=True)

#采用何凯明大神的初始化权重，准确率更高，权重的合理初始化很重要
torch.nn.init.kaiming_normal_(w1)
torch.nn.init.kaiming_normal_(w2)
torch.nn.init.kaiming_normal_(w3)

#定义前向网络计算，每层神经网络输出后增加relu激活函数，确保网络的非线性，实现更好的分类效果
def forward(x):
    x = x@w1.t() + b1
    x = F.relu(x)
    x = x@w2.t() + b2
    x = F.relu(x)
    x = x@w3.t() + b3
    x = F.relu(x)
    return x

#定义优化器，采用SGD随机梯度下降的方式对w1, b1, w2, b2, w3, b3进行优化
optimizer = optim.SGD([w1, b1, w2, b2, w3, b3], lr=learning_rate)
#定义采用交叉熵作为损失函数
criteon = nn.CrossEntropyLoss()

设置迭代次数
for epoch in range(epochs):

    for batch_idx, (data, target) in enumerate(train_loader):
        # 将数据打平为（批次，高度*宽度），-1代表所有
        data = data.view(-1, 28 * 28)

        # 将数据输入到网络中
        cal_data = forward(data)
        # 将计算的数据与目标数据求误差损失
        loss = criteon(cal_data, target)

        # 将梯度值初始化为0
        optimizer.zero_grad()
        # pytorch计算梯度值
        loss.backward()
        # 更新梯度值
        optimizer.step()
        # 每隔25*batcsize(200) = 5000 打印输出结果
        if batch_idx % 25 == 0:
            print('训练代数: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx * len(data), len(train_loader.dataset),
                       100. * batch_idx / len(train_loader), loss.item()))

    # 将测试误差及正确率清0
    test_loss = 0
    correct = 0
    # 取测试集数据及目标数据
    for data, target in test_loader:
        data = data.view(-1, 28 * 28)
        logits = forward(data)
        # 误差累加
        test_loss += criteon(logits, target).item()
        # 取出预测最大值的索引编号，即预测值
        pred = logits.data.argmax(dim=1)
        # 统计正确预测的个数
        correct += pred.eq(target.data).sum()

    test_loss /= len(test_loader.dataset)
    # 打印输出测试误差及准确率
    print('\n测试集: Average loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)\n'.format(
        test_loss, correct, len(test_loader.dataset),
        100. * correct / len(test_loader.dataset)))

输出结果：

总结

这一节，我们从底层搭建了一个三层的感知机神经网络，对手写数字数据集MNIST进行训练和测试，达到了92%的正确率。权重的随机初始化，对结果是很重要的，但在torch更高层的API使用中提供了很好的初始化，会在下一节中进行讲解。最后劳烦小伙伴，动手点个赞吧，给予我爆发小宇宙的能量。

Original: https://blog.csdn.net/dxf1017524157/article/details/115433373
Author: 尘世俗人zZ
Title: Pytorch笔记4：多层感知机实现MNIST数据集分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/712022/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytorch accuracy和Loss 的计算

最近学习代码时发现当自己去实现代码的时候对于样本的Loss和accuracy的计算很不理解，看别人的代码也是靠猜测，所以自己去官方文档学习加上自己做了个小实验以及搜索了别人的博客，…

人工智能 2023年6月16日
0075
使用tensorflow搭建分类神经网络以及迁移学习（训练过程）

码字不易，收藏之余，别忘了给我点个赞吧！ ———Start 本文不涉及tensorflow环境配置过程，只讲解整个项目代码大致内容。至于每个函数…

人工智能 2023年5月23日
0087
web前端期末大作业【足球网页】学生网页设计作业源码

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年7月29日
0059
【oracle】解析ORACLE21C新增的4个峰度和偏度函数的计算过程并使用excel及sql进行公式计算

一、前言在oracle21c版本中，添加了4个有关峰度和偏度的聚合函数，分别是 SKEWNESS_POP-总体偏度 SKEWNESS_SAMP-样本偏度 KURTOSIS_POP…

人工智能 2023年7月17日
0058
世界杯太精彩了，带大家用Python做个足球游戏，边玩游戏边看比赛

文章目录 Python零基础快速制作足球游戏（附源代码）前言一、Python环境说明二、游戏程序说明 1、游戏开始界面 2、人物移动规则说明，可支持两位玩家 3、足球规则 4…

人工智能 2023年7月29日
0074
误差反向传播算法中的权重和偏差是如何更新的

问题介绍误差反向传播算法（Backpropagation）是一种常用的用于训练深度神经网络的算法。该算法通过将训练样本输入到神经网络中，并计算输出结果与真实结果之间的误差，然后根…

人工智能 2024年1月4日
0051
空间地理加权回归stata_地理加权回归模型（GWR, Geographically Weighted Regression）

GWR是局部模型，公式如下所示。回归系数随位置发生变化，针对每个给定的位置分别进行求解。求解时确定以下三件事：确定带宽(即以任意一点为中心，邻域的范围)；邻域对该点影响的大小即权重…

人工智能 2023年6月18日
00191
＜人生重开模拟器＞——《Python项目实战》

目录 1.模拟实现 “人生重开模拟器” 1.1 问题导引： 1.2 问题分析： 2. 模拟实现分析及步骤： 3.完整源码： 4.写在最后的话：后记：●由于…

人工智能 2023年7月6日
0055
避免繁琐步骤，在Ubuntu22.04安装cuda、cudnn及pytorch

1. 换源国内用户建议改为国内源，比如为清华源、阿里源等。更改后在终端运行： $: sudo apt update 2. 终端运行命令直接安装显卡驱动运行： $: ubuntu-d…

人工智能 2023年6月16日
0074
蒙特卡罗（Monte Carlo) 模拟

蒙特卡罗模拟（方法），也称为计算机随机模拟方法、统计模拟法、统计试验法，是基于”随机数”的计算方法，或者是说把概率现象作为研究对象的数值模拟方法。其数学基…

人工智能 2023年7月29日
00103
神经网络是不是分类算法,人工神经网络分类算法

1、人工神经网络分类方法从20世纪80年代末期，人工神经网络方法开始应用于遥感图像的自动分类。目前，在遥感图像的自动分类方面，应用和研究比较多的人工神经网络方法主要有以下几种：…

人工智能 2023年7月13日
0055
R语言：多因素Cox回归森林图 (基于forestplot包) 森林图 cox可视化

本期开始介绍Cox回归模型可视化。之前学习过的的临床回归模型可视化方法主要是森林图和列线图 (Nomogram)。计划是介绍一下单因素、多因素、亚组分析、其他类型森林图绘制；列线图…

人工智能 2023年6月16日
0084
指纹图谱相似度评价软件_不同年份吴茱萸UPLC指纹图谱及多成分化学模式识别研究…

摘要：目的采用UPLC法建立不同年份吴茱萸指纹图谱，结合化学模式识别技术对其进行分析，并测定其中4种质量差异性标志物的含量，为吴茱萸”陈久者良”的研究提…

人工智能 2023年6月1日
0069
opencv控制鼠标事件

1.基础知识和API OpenCV允许我们对窗口上的鼠标动作做出响应.回调函数，就是执行以后会执行这个函数 *cv2.setMouseCallback(winname, callb…

人工智能 2023年7月19日
0055
论文：Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection通过划块的方式进行小目标检测

Slicing Aided Hyper Inference and Fine-tuning for Small Object Detection通过划块的方式进行小目标检测 1、看…

人工智能 2023年7月9日
0083
基于python的微博舆情分析与研究—以《北京冬奥会》为关键词

创作不易，如果以下内容对你有帮助，记得三连呀，让更多的小伙伴能看到吧~~ 1. 研究内容本课题研究的是基于Python的微博舆情热点分析与研究。在PyCharm、Jupiter …

人工智能 2023年7月14日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch笔记4：多层感知机实现MNIST数据集分类

文章目录

1.MNIST介绍

2.下载MNIST数据集

3.搭建神经网络层

1.权重和偏置

2.定义前向计算网络

3.定义梯度优化器及损失函数设置

4.完成程序设计

大家都在看