小熊飞桨练习册-03石头剪刀布

2023年10月26日上午3:49 • Python • 阅读 41

文件说明

文件说明 train.py 训练程序 test.py 测试程序 test-gtk.py 测试程序 GTK 界面 report.py 报表程序 onekey.sh 一键获取数据到 dataset 目录下 get-data.sh 获取数据到 dataset 目录下 make-images-labels.py 生成训练集和测试集图像路径和标签的文本文件 check-data.sh 检查 dataset 目录下的数据是否存在 mod/vgg.py VGG 网络模型 mod/dataset.py ImageClass 图像分类数据集解析 mod/utils.py 杂项 mod/config.py 配置 mod/report.py 结果报表 dataset 数据集目录 params 模型参数保存目录 log VisualDL 日志保存目录

数据集

运行脚本，包含以下步骤：获取数据，生成图像路径和标签的文本文件，检查数据。

如果运行在本地计算机，下载完数据，文件放到 dataset 目录下，在项目目录下运行下面脚本。
如果运行在百度 AI Studio 环境，查看 data 目录是否有数据，在项目目录下运行下面脚本。

bash onekey.sh

bash get-data.sh

获取数据后，在项目目录下运行下面脚本，生成图像路径和标签的文本文件，包含：

训练集 train-images-labels.txt
测试集 test-images-labels.txt

python3 make-images-labels.py all ./dataset rps-cv-images/rock 0 rps-cv-images/scissors 1 rps-cv-images/paper 2

石头 0
剪子 1
布 2

获取数据完毕后，在项目目录下运行下面脚本，检查 dataset 目录下的数据是否存在。

bash check-data.sh

网络模型

import paddle
import paddle.nn as nn
import paddle.nn.functional as F

VGG 网络模型
class VGG(nn.Layer):
"""
    VGG 网络模型

    输入图像大小为 224 x 224
"""

    def __init__(self, num_classes=10, fc1_in_features=25088):
"""
        VGG 网络模型

        Args:
            num_classes (int, optional): 分类数量, 默认 10
            fc1_in_features (int, optional): 第一层全连接层输入特征数量, 默认 25088,
                根据 max_pool5 输出结果, 计算得出 512*7*7 = 25088

        Raises:
            Exception: 分类数量 num_classes 必须大于等于 2
"""
        super(VGG, self).__init__()
        if num_classes < 2:
            raise Exception(
                "分类数量 num_classes 必须大于等于 2: {}".format(num_classes))
        self.num_classes = num_classes
        self.fc1_in_features = fc1_in_features

        # 处理块 1
        self.conv1_1 = nn.Conv2D(
            in_channels=3, out_channels=64, kernel_size=3, stride=1, padding=1)
        self.conv1_2 = nn.Conv2D(
            in_channels=64, out_channels=64, kernel_size=3, stride=1, padding=1)
        self.max_pool1 = nn.MaxPool2D(kernel_size=2, stride=2)

        # 处理块 2
        self.conv2_1 = nn.Conv2D(
            in_channels=64, out_channels=128, kernel_size=3, stride=1, padding=1)
        self.conv2_2 = nn.Conv2D(
            in_channels=128, out_channels=128, kernel_size=3, stride=1, padding=1)
        self.max_pool2 = nn.MaxPool2D(kernel_size=2, stride=2)

        # 处理块 3
        self.conv3_1 = nn.Conv2D(
            in_channels=128, out_channels=256, kernel_size=3, stride=1, padding=1)
        self.conv3_2 = nn.Conv2D(
            in_channels=256, out_channels=256, kernel_size=3, stride=1, padding=1)
        self.conv3_3 = nn.Conv2D(
            in_channels=256, out_channels=256, kernel_size=3, stride=1, padding=1)
        self.max_pool3 = nn.MaxPool2D(kernel_size=2, stride=2)

        # 处理块 4
        self.conv4_1 = nn.Conv2D(
            in_channels=256, out_channels=512, kernel_size=3, stride=1, padding=1)
        self.conv4_2 = nn.Conv2D(
            in_channels=512, out_channels=512, kernel_size=3, stride=1, padding=1)
        self.conv4_3 = nn.Conv2D(
            in_channels=512, out_channels=512, kernel_size=3, stride=1, padding=1)
        self.max_pool4 = nn.MaxPool2D(kernel_size=2, stride=2)

        # 处理块 5
        self.conv5_1 = nn.Conv2D(
            in_channels=512, out_channels=512, kernel_size=3, stride=1, padding=1)
        self.conv5_2 = nn.Conv2D(
            in_channels=512, out_channels=512, kernel_size=3, stride=1, padding=1)
        self.conv5_3 = nn.Conv2D(
            in_channels=512, out_channels=512, kernel_size=3, stride=1, padding=1)
        self.max_pool5 = nn.MaxPool2D(kernel_size=2, stride=2)

        # 全连接层 in_features 25088 = max_pool5 输出 512*7*7
        self.fc1 = nn.Linear(in_features=fc1_in_features, out_features=4096)
        self.drop_ratio1 = 0.5
        self.drop1 = nn.Dropout(self.drop_ratio1)
        self.fc2 = nn.Linear(in_features=4096, out_features=4096)
        self.drop_ratio2 = 0.5
        self.drop2 = nn.Dropout(self.drop_ratio2)
        self.fc3 = nn.Linear(in_features=4096, out_features=num_classes)

    def forward(self, x):
        # 处理块 1
        x = self.conv1_1(x)
        x = F.relu(x)
        x = self.conv1_2(x)
        x = F.relu(x)
        x = self.max_pool1(x)

        # 处理块 2
        x = self.conv2_1(x)
        x = F.relu(x)
        x = self.conv2_2(x)
        x = F.relu(x)
        x = self.max_pool2(x)

        # 处理块 3
        x = self.conv3_1(x)
        x = F.relu(x)
        x = self.conv3_2(x)
        x = F.relu(x)
        x = self.conv3_3(x)
        x = F.relu(x)
        x = self.max_pool3(x)

        # 处理块 4
        x = self.conv4_1(x)
        x = F.relu(x)
        x = self.conv4_2(x)
        x = F.relu(x)
        x = self.conv4_3(x)
        x = F.relu(x)
        x = self.max_pool4(x)

        # 处理块 5
        x = self.conv5_1(x)
        x = F.relu(x)
        x = self.conv5_2(x)
        x = F.relu(x)
        x = self.conv5_3(x)
        x = F.relu(x)
        x = self.max_pool5(x)

        # 全连接层
        # flatten 根据给定的 start_axis 和 stop_axis 将连续的维度展平
        x = paddle.flatten(x, start_axis=1, stop_axis=-1)
        x = self.fc1(x)
        x = F.relu(x)
        # 在全连接之后使用 dropout 抑制过拟合
        x = self.drop1(x)
        x = self.fc2(x)
        x = F.relu(x)
        # 在全连接之后使用 dropout 抑制过拟合
        x = self.drop2(x)
        x = self.fc3(x)

        return x

数据集解析

数据集解析，主要是解析 图像路径和标签的文本 ，然后根据图像路径读取图像和标签。

import paddle
import os
import random
import numpy as np
from PIL import Image
import paddle.vision as ppvs

class ImageClass(paddle.io.Dataset):
"""
    ImageClass 图像分类数据集解析, 继承 paddle.io.Dataset 类
"""

    def __init__(self,
                 dataset_path: str,
                 images_labels_txt_path: str,
                 transform=None,
                 shuffle=True
                 ):
"""
        构造函数，定义数据集

        Args:
            dataset_path (str): 数据集路径
            images_labels_txt_path (str): 图像和标签的文本路径
            transform (Compose, optional): 转换数据的操作组合, 默认 None
            shuffle (bool, True): 随机打乱数据, 默认 True
"""

        super(ImageClass, self).__init__()
        self.dataset_path = dataset_path
        self.images_labels_txt_path = images_labels_txt_path
        self._check_path(dataset_path, "数据集路径错误")
        self._check_path(images_labels_txt_path, "图像和标签的文本路径错误")
        self.transform = transform
        self.image_paths, self.labels = self.parse_dataset(
            dataset_path, images_labels_txt_path, shuffle)

    def __getitem__(self, idx):
"""
        获取单个数据和标签

        Args:
            idx (Any): 索引

        Returns:
            image (float32): 图像
            label (int): 标签
"""
        image_path, label = self.image_paths[idx], self.labels[idx]
        return self.get_item(image_path, label, self.transform)

    @staticmethod
    def get_item(image_path: str, label: int, transform=None):
"""
        获取单个数据和标签

        Args:
            image_path (str): 图像路径
            label (int): 标签
            transform (Compose, optional): 转换数据的操作组合, 默认 None

        Returns:
            image (float32): 图像
            label (int): 标签
"""
        if not os.path.exists(image_path):
            raise Exception("{}: {}".format("图像路径错误", image_path))
        ppvs.set_image_backend("pil")
        # 统一转为 3 通道, png 是 4通道
        image = Image.open(image_path).convert("RGB")
        if transform is not None:
            image = transform(image)
        # 转换图像 HWC 转为 CHW
        # image = np.transpose(image, (2, 0, 1))
        return image.astype("float32"), label

    def __len__(self):
"""
        数据数量

        Returns:
            int: 数据数量
"""
        return len(self.labels)

    def _check_path(self, path: str, msg: str):
"""
        检查路径是否存在

        Args:
            path (str): 路径
            msg (str, optional): 异常消息

        Raises:
            Exception: 路径错误, 异常
"""
        if not os.path.exists(path):
            raise Exception("{}: {}".format(msg, path))

    @staticmethod
    def parse_dataset(dataset_path: str, images_labels_txt_path: str, shuffle: bool):
"""
        数据集解析

        Args:
            dataset_path (str): 数据集路径
            images_labels_txt_path (str): 图像和标签的文本路径

        Returns:
            image_paths: 图像路径集
            labels: 分类标签集
"""
        lines = []
        image_paths = []
        labels = []
        with open(images_labels_txt_path, "r") as f:
            lines = f.readlines()
        # 随机打乱数据
        if (shuffle):
            random.shuffle(lines)
        for i in lines:
            data = i.split(" ")
            if (len(data) < 2):
                raise Exception("数据集解析错误，数据少于 2")
            image_paths.append(os.path.join(dataset_path, data[0]))
            labels.append(int(data[1]))
        return image_paths, labels

配置模块

可以查看修改 mod/config.py 文件，有详细的说明

开始训练

运行 train.py 文件，查看命令行参数加 -h

python3 train.py

  --cpu             是否使用 cpu 计算，默认使用 CUDA
  --learning-rate   学习率，默认 0.001
  --epochs          训练几轮，默认 2 轮
  --batch-size      一批次数量，默认 2
  --num-workers     线程数量，默认 2
  --no-save         是否保存模型参数，默认保存, 选择后不保存模型参数
  --load-dir        读取模型参数，读取 params 目录下的子文件夹, 默认不读取
  --log             是否输出 VisualDL 日志，默认不输出
  --summary         输出网络模型信息，默认不输出，选择后只输出信息，不会开启训练

测试模型

运行 test.py 文件，查看命令行参数加 -h

python3 test.py

  --cpu           是否使用 cpu 计算，默认使用 CUDA
  --batch-size    一批次数量，默认 2
  --num-workers   线程数量，默认 2
  --load-dir      读取模型参数，读取 params 目录下的子文件夹, 默认 best 目录

测试模型 GTK 界面

运行 test-gtk.py 文件，此程序依赖 GTK 库，只能运行在本地计算机。

python3 test-gtk.py

python3 -m pip install pygobject

1、点击 选择模型 按钮。
2、弹出的文件对话框选择模型，模型在 params 目录下的子目录的 model.pdparams 文件。
3、点击 随机测试 按钮，就可以看到测试的图像，预测结果和实际结果。

查看结果报表

运行 report.py 文件，可以显示 params 目录下所有子目录的 report.json。
加参数 –best 根据 loss 最小的模型参数保存在 best 子目录下。

python3 report.py

report.json 说明

键名说明 id 根据时间生成的字符串 ID loss 本次训练的 loss 值 acc 本次训练的 acc 值 epochs 本次训练的 epochs 值 batch_size 本次训练的 batch_size 值 learning_rate 本次训练的 learning_rate 值

VisualDL 可视化分析工具

安装和使用说明参考：VisualDL
训练的时候加上参数 –log
如果是 AI Studio 环境训练的把 log 目录下载下来，解压缩后放到本地项目目录下 log 目录
在项目目录下运行下面命令
然后根据提示的网址，打开浏览器访问提示的网址即可

visualdl --logdir ./log

Original: https://www.cnblogs.com/cnhemiya/p/16167520.html
Author: 小熊宝宝啊
Title: 小熊飞桨练习册-03石头剪刀布

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/805261/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Carla在Windows上的安装与运行

Carla是自动驾驶领域常用的仿真软件，前一段一直在弄，记录一下安装和运行过程。前期准备：1）安装Anaconda. （略）2）安装python 3.7 (注：必须是3.7)co…

Python 2023年9月24日
0038
Python游戏开发入门课程(pygame)学习笔记（01）

import sys,pygame pygame.init() size=w,h=800,400 speed=[1,1] color=0,0,0 fps=100 fclock=py…

Python 2023年9月18日
0040
Re:从零开始教你使用 Sublime Text

Re:从零开始教你使用 Sublime Text 0.前言 0-0.关于我为什么要写这篇文章 0-1.关于这篇文章会讲什么 0-2.适用人群 0-4.其他 0-5.无用的统计 1….

Python 2023年10月15日
0030
基于FFmpeg的Java视频Mp4转GIF初探

背景在一些业务场景中，会有如下的一些要求：比如有用户需要将Mp4视频转为Gif动图。当然有一些小伙伴说可以使用系统截图，然后使用之前提到过的技术：GIF图像动态生成-JAVA后台…

Python 2023年10月7日
0049
外包四年太差劲，幡然醒悟要跳槽

前几天有个读者过来说，”二哥，外包干了四年，感觉和外界差距有点大，现在被动醒悟，希望你能帮我制定一下学习路线。” 那二哥这么负责任，必须得承担起这份职责啊…

Python 2023年9月26日
0051
一文搞懂SSL/TLS

SSL/TLS 1. 概述 2. 协议组成 * 2.1 握手协议（Handshake protocol） 2.2 记录协议（Record Protocol） 3. 密码套件与密钥生…

Python 2023年10月11日
0057
pandas中DataFrame数据合并及分组

划分之后可使用count计数： df_1 = df.groupby(‘key1’) print(df_1.count()) 输出结果为： key2 data1 data2 key1…

Python 2023年8月6日
0037
python解最强大脑：黑白迭代

文章目录黑白迭代规则解法分析 * 重要性质简化问题公式法 – 合并多个公式推导公式高斯消元法可视化代码实现 * 项目结构 solve.py gui.py…

Python 2023年9月20日
0050
Python制作炫酷的个人足迹地图

用Python来绘制自己的个人足迹地图，精确到市级别。首先我们需要安装以下Python的第三方模块: echarts-china-cities-pypkg==0.0.9 ech…

Python 2023年5月23日
0056
安装MMdetection3D和MinkowskiEngine

MMdetection3D更新了,只好再次安装,由于CUDA,cuDNN,PyTorch以前已经安装了,这次就不需要安装了,只需要安装MMdetection3D就行了. 安装MMC…

Python 2023年10月25日
0046
pandas中DataFrame的修改元素值、缺失值处理、合并操作的方法

实验目的熟练掌握pandas中DataFrame的修改元素值、缺失值处理、合并操作的方法实验原理 concat合并： pd.concat(objs, axis=0, join=…

Python 2023年8月8日
0057
React报错之Rendered more hooks than during the previous render

正文从这开始~ 总览当我们有条件地调用一个钩子或在所有钩子运行之前提前返回时，会产生”Rendered more hooks than during the prev…

Python 2023年10月23日
0025
用Python制作一个动态爱心效果！

大家好，我是小F～最近「点燃我，温暖你」这部剧非常火，讲述的是程序员的爱情故事。其中陈飞宇饰演的男主李峋，在剧中用程序做出的爱心跳动效果，非常炫。网上各个大佬也是纷纷给出看…

Python 2023年8月2日
0063
python读取MongoDB数据之数据处理（时间处理+列表嵌套字典转数据框）

MongoDB数据库存储着非结构化数据，给数据读取之后带来很多需要数据预处理的过程，下面我们来一起总结一下： 1.MongoDB数据库连接，数据表相关数据的读取，包含对相关内容的筛…

Python 2023年8月21日
0074
airtest/poco+pytest+allure+jenkins框架来了

如果这些内容对你有帮助，也可以打开微信扫一扫，加关注: 好多朋友在问前几篇文章的poco+pytest+allure框架源码在哪可以Get到，接下来将分几篇文章来让你看看此框架的全…

Python 2023年9月10日
00219
pygame库pgu使用介绍

现在用pygame制作小游戏的人越来越多，但是pygame它是没有弹窗机制的一般解决这个问题我们会使用tkinter库或者pgu库两种方式其中pgu库还没有很适合新手的一个手册介绍…

Python 2023年9月19日
0034

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31