小熊飞桨练习册-01手写数字识别

2023年7月23日下午4:10 • 技术杂谈 • 阅读 89

文件说明

文件说明 train.py 训练程序 test.py 测试程序 report.py 报表程序 onekey.sh 一键获取数据到 dataset 目录下 get-data.sh 获取数据到 dataset 目录下 check-data.sh 检查 dataset 目录下的数据是否存在 mod/lenet.py LeNet 网络模型 mod/dataset.py MNIST 手写数据集解析 mod/utils.py 杂项 mod/config.py 配置 mod/report.py 结果报表 dataset 数据集目录 params 模型参数保存目录 log VisualDL 日志保存目录

数据集

运行脚本，包含以下步骤：获取数据，检查数据。

如果运行在本地计算机，下载完数据，文件放到 dataset 目录下，在项目目录下运行下面脚本。
如果运行在百度 AI Studio 环境，查看 data 目录是否有数据，在项目目录下运行下面脚本。

bash onekey.sh

bash get-data.sh

获取数据完毕后，在项目目录下运行下面脚本，检查 dataset 目录下的数据是否存在。

bash check-data.sh

网络模型

import paddle
import paddle.nn as nn
import paddle.nn.functional as F

LeNet 网络模型
class LeNet(nn.Layer):
    def __init__(self, num_classes=10):
        super(LeNet, self).__init__()
        if num_classes < 1:
            raise Exception("分类数量 num_classes 必须大于 0: {}".format(num_classes))
        self.num_classes = num_classes
        self.conv1 = nn.Conv2D(
            in_channels=1, out_channels=6, kernel_size=5, stride=1)
        self.avg_pool1 = nn.AvgPool2D(kernel_size=2, stride=2)
        self.conv2 = nn.Conv2D(
            in_channels=6, out_channels=16, kernel_size=5, stride=1)
        self.avg_pool2 = nn.AvgPool2D(kernel_size=2, stride=2)
        self.conv3 = nn.Conv2D(
            in_channels=16, out_channels=120, kernel_size=4, stride=1)
        self.fc1 = nn.Linear(in_features=120, out_features=64)
        self.fc2 = nn.Linear(in_features=64, out_features=num_classes)

    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(x)
        x = self.avg_pool1(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = self.avg_pool2(x)
        x = self.conv3(x)
        x = F.relu(x)
        x = paddle.flatten(x, start_axis=1, stop_axis=-1)
        x = self.fc1(x)
        x = F.relu(x)
        x = self.fc2(x)
        return x

数据集解析

数据集解析方法来源百度飞桨教程和网络，和百度飞桨 MNIST 数据集稍有不同

import paddle
import os
import struct
import numpy as np

class MNIST(paddle.io.Dataset):
"""
    MNIST 手写数据集解析, 继承 paddle.io.Dataset 类
"""

    def __init__(self,
                 images_path: str,
                 labels_path: str,
                 transform=None,
                 ):
"""
        构造函数，定义数据集大小

        Args:
            images_path (str): 图像集路径
            labels_path (str): 标签集路径
            transform (Compose, optional): 转换数据的操作组合, 默认 None
"""
        super(MNIST, self).__init__()
        self.images_path = images_path
        self.labels_path = labels_path
        self._check_path(images_path, "数据路径错误")
        self._check_path(labels_path, "标签路径错误")
        self.transform = transform
        self.images, self.labels = self.parse_dataset(images_path, labels_path)

    def __getitem__(self, idx):
"""
        获取单个数据和标签

        Args:
            idx (Any): 索引

        Returns:
            image (float32): 图像
            label (int64): 标签
"""
        image, label = self.images[idx], self.labels[idx]
        # 这里 reshape 是2维 [28 ,28]
        image = np.reshape(image, [28, 28])
        if self.transform is not None:
            image = self.transform(image)
        # label.astype 如果是整型，只能是 int64
        return image.astype('float32'), label.astype('int64')

    def __len__(self):
"""
        数据数量

        Returns:
            int: 数据数量
"""
        return len(self.labels)

    def _check_path(self, path: str, msg: str):
"""
        检查路径是否存在

        Args:
            path (str): 路径
            msg (str, optional): 异常消息

        Raises:
            Exception: 路径错误, 异常
"""
        if not os.path.exists(path):
            raise Exception("{}: {}".format(msg, path))

    @staticmethod
    def parse_dataset(images_path: str, labels_path: str):
"""
        数据集解析

        Args:
            images_path (str): 图像集路径
            labels_path (str): 标签集路径

        Returns:
            images: 图像集
            labels: 标签集
"""
        with open(images_path, 'rb') as imgpath:
            # 解析图像集
            magic, num, rows, cols = struct.unpack('>IIII', imgpath.read(16))
            # 这里 reshape 是1维 [786]
            images = np.fromfile(
                imgpath, dtype=np.uint8).reshape(num, rows * cols)
        with open(labels_path, 'rb') as lbpath:
            # 解析标签集
            magic, n = struct.unpack('>II', lbpath.read(8))
            labels = np.fromfile(lbpath, dtype=np.uint8)
        return images, labels

配置模块

可以查看修改 mod/config.py 文件，有详细的说明

开始训练

运行 train.py 文件，查看命令行参数加 -h

python3 train.py

  --cpu             是否使用 cpu 计算，默认使用 CUDA
  --learning-rate   学习率，默认 0.001
  --epochs          训练几轮，默认 2 轮
  --batch-size      一批次数量，默认 128
  --num-workers     线程数量，默认 2
  --no-save         是否保存模型参数，默认保存, 选择后不保存模型参数
  --load-dir        读取模型参数，读取 params 目录下的子文件夹, 默认不读取
  --log             是否输出 VisualDL 日志，默认不输出
  --summary         输出网络模型信息，默认不输出，选择后只输出信息，不会开启训练

测试模型

运行 test.py 文件，查看命令行参数加 -h

python3 test.py

  --cpu           是否使用 cpu 计算，默认使用 CUDA
  --batch-size    一批次数量，默认 128
  --num-workers   线程数量，默认 2
  --load-dir      读取模型参数，读取 params 目录下的子文件夹, 默认 best 目录

查看结果报表

运行 report.py 文件，可以显示 params 目录下所有子目录的 report.json。
加参数 –best 根据 loss 最小的模型参数保存在 best 子目录下。

python3 report.py

report.json 说明

键名说明 id 根据时间生成的字符串 ID loss 本次训练的 loss 值 acc 本次训练的 acc 值 epochs 本次训练的 epochs 值 batch_size 本次训练的 batch_size 值 learning_rate 本次训练的 learning_rate 值

VisualDL 可视化分析工具

安装和使用说明参考：VisualDL
训练的时候加上参数 –log
如果是 AI Studio 环境训练的把 log 目录下载下来，解压缩后放到本地项目目录下 log 目录
在项目目录下运行下面命令
然后根据提示的网址，打开浏览器访问提示的网址即可

visualdl --logdir ./log

Original: https://www.cnblogs.com/cnhemiya/p/16137055.html
Author: 小熊宝宝啊
Title: 小熊飞桨练习册-01手写数字识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/710878/

转载文章受原作者版权保护。转载请注明原作者出处！

技术杂谈

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一篇文章剖析设计模式中的简单工厂、工厂方法和抽象工厂

前言大部分的面试者在IT行业面试中，提及设计模式，可以列举一大堆，但是面试官要求细说的时候，往往部分基础不够牢固的同学只能提及简单工厂。今天我们来对面试过程中最常见的简单工厂、工…

技术杂谈 2023年7月11日
0095
Golang可重入锁的实现

项目中遇到了可重入锁的需求和实现，具体记录下。什么是可重入锁我们平时说的分布式锁，一般指的是在不同服务器上的多个线程中，只有一个线程能抢到一个锁，从而执行一个任务。而我们使用锁…

技术杂谈 2023年6月1日
0084
ensp学习-1 ensp无法运行启动问题解决

1、40错误管理员：bcdedit /set hypervisorlaunchtype off2、41错误2.1，先备份ensp vboxserver目录，打开vbox中右上角全局…

技术杂谈 2023年6月1日
00104
vue系列—snabbdom.js使用及源码分析(九)

一：什么是snabbdom? 在学习Vue或React中，我们了解最多的就是虚拟DOM，虚拟DOM可以看作是一颗模拟了DOM的Javascript树，主要是通过vnode实现一个无…

技术杂谈 2023年6月1日
0081
JetBrains新产品Aqua——自动化测试开发工具（抢鲜体验）

转载请注明出处❤️ 作者：测试蔡坨坨原文链接：caituotuo.top/9a093c88.html 你好，我是测试蔡坨坨。随着行业内卷越来越严重，自动化测试已成为测试工程师的…

技术杂谈 2023年7月11日
00100
【软考】信息系统安全技术

《信息安全等级保护管理办法》中5个等级的区别对于公民、法人和其他组织的合法权益没有特别严重损害的说法作者：奔跑的金鱼出处：https://www.cnblogs.com/O…

技术杂谈 2023年5月31日
0093
项目管理中的关键路径法-时窗图解法cpm

完成单个活动所需的时间称为活动时间，可以形象地以一个矩形窗格来表示，这个窗格称为时间窗口，简称时窗。 1.1 分类单位时窗：基本时窗，时窗的不可分割的最小单元，活动时窗：…

技术杂谈 2023年7月11日
0072
如何理解python中的cmp_to_key()函数

在functools包里的函数，将老式的比较函数（ cmp function）转化为关键字函数（ key function）。与接受key function的工具一同使用（如 s…

技术杂谈 2023年7月25日
0067
银河麒麟操作系统root用户登录图形化界面

第一步、为root用户设置密码 sudo passwd 设置root用户密码第二步、开启root登录权限 vim /usr/share/lightdm/lightdm.conf….

技术杂谈 2023年7月11日
00152
常见爬虫/BOT 对抗技术简介（二）

上一篇文章分别从网络协议，Robots文件，JS渲染，行为分析等多方面讲了些”反爬虫”，”反-反爬虫”技术。点击查看：《常见爬虫/…

技术杂谈 2023年5月31日
00113
利用 JS 脚本实现网页全自动秒杀抢购

利用 JS 脚本实现网页全自动秒杀抢购倒计时页面：倒计时未结束时，购买按钮还不能点击。结束时，可以点击购买，点击后出现提示”付款成功” 展示效果 GI…

技术杂谈 2023年7月25日
0075
对《GGX》shader的分析-卡通渲染-罪恶装备

转自：https://www.element3ds.com/thread-151972-1-1.html Guilty Gear Xrd的日漫风shader一直被看作是业内这方面的…

技术杂谈 2023年6月1日
00116
RedisSCAN命令

获取指定前缀的key 需求描述： Redis中有大量以xxx开头的key，在不使用keys命令的情况下，如何快速获取这些前缀的key 解决方案： redis自带的scan命令可以解…

技术杂谈 2023年7月24日
0064
2个函数宏技巧

1.用宏调用对象函数 #define FOR_EACH_OBSERVER(ObserverType, observer_list, func) \ do{ \ CObserverL…

技术杂谈 2023年5月31日
0082
Redis概念

概念：redis是一款高性能的NOSQL系列的非关系型数据库 Original: https://www.cnblogs.com/ailhy/p/16610114.htmlAuth…

技术杂谈 2023年6月21日
0083
正投影与斜投影

正投影设物体上任一点的三维坐标为(p(x,y,z))，投影后的三维坐标为(p^,(x^,,y^,,z^,))，则正交投影方程为： [ \left{\begin{array}{rc…

技术杂谈 2023年7月11日
00127

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31