小熊飞桨练习册-02眼疾识别

2023年10月26日上午4:24 • Python • 阅读 30

文件说明

文件说明 train.py 训练程序 test.py 测试程序 test-gtk.py 测试程序 GTK 界面 report.py 报表程序 onekey.sh 一键获取数据到 dataset 目录下 get-data.sh 获取数据到 dataset 目录下 check-data.sh 检查 dataset 目录下的数据是否存在 mod/alexnet.py AlexNet 网络模型 mod/dataset.py ImageClass 图像分类数据集解析 mod/utils.py 杂项 mod/config.py 配置 mod/report.py 结果报表 dataset 数据集目录 params 模型参数保存目录 log VisualDL 日志保存目录

数据集

运行脚本，包含以下步骤：获取数据，检查数据。

如果运行在本地计算机，下载完数据，文件放到 dataset 目录下，在项目目录下运行下面脚本。
如果运行在百度 AI Studio 环境，查看 data 目录是否有数据，在项目目录下运行下面脚本。

bash onekey.sh

bash get-data.sh

非眼疾 0
眼疾 1

获取数据完毕后，在项目目录下运行下面脚本，检查 dataset 目录下的数据是否存在。

bash check-data.sh

网络模型

import paddle
import paddle.nn as nn
import paddle.nn.functional as F

AlexNet 网络模型
class AlexNet(nn.Layer):
"""
    AlexNet 网络模型

    输入图像大小为 224 x 224
    池化层 kernel_size = 2, 第一层卷积层填充 paddling = 2
"""
    def __init__(self, num_classes=10, pool_kernel_size=2, conv1_paddling=2, fc1_in_features=9216):
"""
        AlexNet 网络模型

        Args:
            num_classes (int, optional): 分类数量, 默认 10
            pool_kernel_size (int, optional): 池化层核大小, 默认 2
            conv1_paddling (int, optional): 第一层卷积层填充, 默认 2,
                输入图像大小为 224 x 224 填充 2
            fc1_in_features (int, optional): 第一层全连接层输入特征数量, 默认 9216,
                根据 max_pool3 输出结果, 计算得出 256*6*6 = 9216

        Raises:
            Exception: 分类数量 num_classes 必须大于等于 2
"""
        super(AlexNet, self).__init__()
        if num_classes < 2:
            raise Exception("分类数量 num_classes 必须大于等于 2: {}".format(num_classes))
        self.num_classes = num_classes
        self.pool_kernel_size = pool_kernel_size
        self.fc1_in_features = fc1_in_features
        self.conv1 = nn.Conv2D(
            in_channels=3, out_channels=96, kernel_size=11, stride=4, padding=conv1_paddling)
        self.max_pool1 = nn.MaxPool2D(kernel_size=pool_kernel_size, stride=2)
        self.conv2 = nn.Conv2D(
            in_channels=96, out_channels=256, kernel_size=5, stride=1, padding=2)
        self.max_pool2 = nn.MaxPool2D(kernel_size=pool_kernel_size, stride=2)
        self.conv3 = nn.Conv2D(
            in_channels=256, out_channels=384, kernel_size=3, stride=1, padding=1)
        self.conv4 = nn.Conv2D(
            in_channels=384, out_channels=384, kernel_size=3, stride=1, padding=1)
        self.conv5 = nn.Conv2D(
            in_channels=384, out_channels=256, kernel_size=3, stride=1, padding=1)
        self.max_pool3 = nn.MaxPool2D(kernel_size=pool_kernel_size, stride=2)
        # in_features 9216 = max_pool3 输出 256*6*6
        self.fc1 = nn.Linear(in_features=fc1_in_features, out_features=4096)
        self.drop_ratio1 = 0.5
        self.drop1 = nn.Dropout(self.drop_ratio1)
        self.fc2 = nn.Linear(in_features=4096, out_features=4096)
        self.drop_ratio2 = 0.5
        self.drop2 = nn.Dropout(self.drop_ratio2)
        self.fc3 = nn.Linear(in_features=4096, out_features=num_classes)

    def forward(self, x):
        x = self.conv1(x)
        x = F.relu(x)
        x = self.max_pool1(x)
        x = self.conv2(x)
        x = F.relu(x)
        x = self.max_pool2(x)
        x = self.conv3(x)
        x = F.relu(x)
        x = self.conv4(x)
        x = F.relu(x)
        x = self.conv5(x)
        x = F.relu(x)
        x = self.max_pool3(x)
        # flatten 根据给定的 start_axis 和 stop_axis 将连续的维度展平
        x = paddle.flatten(x, start_axis=1, stop_axis=-1)
        x = self.fc1(x)
        x = F.relu(x)
        # 在全连接之后使用 dropout 抑制过拟合
        x = self.drop1(x)
        x = self.fc2(x)
        x = F.relu(x)
        # 在全连接之后使用 dropout 抑制过拟合
        x = self.drop2(x)
        x = self.fc3(x)
        return x

数据集解析

数据集解析，主要是解析 图像路径和标签的文本 ，然后根据图像路径读取图像和标签。

import paddle
import os
import random
import numpy as np
from PIL import Image
import paddle.vision as ppvs

class ImageClass(paddle.io.Dataset):
"""
    ImageClass 图像分类数据集解析, 继承 paddle.io.Dataset 类
"""

    def __init__(self,
                 dataset_path: str,
                 images_labels_txt_path: str,
                 transform=None,
                 shuffle=True
                 ):
"""
        构造函数，定义数据集

        Args:
            dataset_path (str): 数据集路径
            images_labels_txt_path (str): 图像和标签的文本路径
            transform (Compose, optional): 转换数据的操作组合, 默认 None
            shuffle (bool, True): 随机打乱数据, 默认 True
"""

        super(ImageClass, self).__init__()
        self.dataset_path = dataset_path
        self.images_labels_txt_path = images_labels_txt_path
        self._check_path(dataset_path, "数据集路径错误")
        self._check_path(images_labels_txt_path, "图像和标签的文本路径错误")
        self.transform = transform
        self.image_paths, self.labels = self.parse_dataset(
            dataset_path, images_labels_txt_path, shuffle)

    def __getitem__(self, idx):
"""
        获取单个数据和标签

        Args:
            idx (Any): 索引

        Returns:
            image (float32): 图像
            label (int): 标签
"""
        image_path, label = self.image_paths[idx], self.labels[idx]
        return self.get_item(image_path, label, self.transform)

    @staticmethod
    def get_item(image_path: str, label: int, transform=None):
"""
        获取单个数据和标签

        Args:
            image_path (str): 图像路径
            label (int): 标签
            transform (Compose, optional): 转换数据的操作组合, 默认 None

        Returns:
            image (float32): 图像
            label (int): 标签
"""
        if not os.path.exists(image_path):
            raise Exception("{}: {}".format("图像路径错误", image_path))
        ppvs.set_image_backend("pil")
        # 统一转为 3 通道, png 是 4通道
        image = Image.open(image_path).convert("RGB")
        if transform is not None:
            image = transform(image)
        # 转换图像 HWC 转为 CHW
        # image = np.transpose(image, (2, 0, 1))
        return image.astype("float32"), label

    def __len__(self):
"""
        数据数量

        Returns:
            int: 数据数量
"""
        return len(self.labels)

    def _check_path(self, path: str, msg: str):
"""
        检查路径是否存在

        Args:
            path (str): 路径
            msg (str, optional): 异常消息

        Raises:
            Exception: 路径错误, 异常
"""
        if not os.path.exists(path):
            raise Exception("{}: {}".format(msg, path))

    @staticmethod
    def parse_dataset(dataset_path: str, images_labels_txt_path: str, shuffle: bool):
"""
        数据集解析

        Args:
            dataset_path (str): 数据集路径
            images_labels_txt_path (str): 图像和标签的文本路径

        Returns:
            image_paths: 图像路径集
            labels: 分类标签集
"""
        lines = []
        image_paths = []
        labels = []
        with open(images_labels_txt_path, "r") as f:
            lines = f.readlines()
        # 随机打乱数据
        if (shuffle):
            random.shuffle(lines)
        for i in lines:
            data = i.split(" ")
            if (len(data) < 2):
                raise Exception("数据集解析错误，数据少于 2")
            image_paths.append(os.path.join(dataset_path, data[0]))
            labels.append(int(data[1]))
        return image_paths, labels

配置模块

可以查看修改 mod/config.py 文件，有详细的说明

开始训练

运行 train.py 文件，查看命令行参数加 -h

python3 train.py

  --cpu             是否使用 cpu 计算，默认使用 CUDA
  --learning-rate   学习率，默认 0.001
  --epochs          训练几轮，默认 2 轮
  --batch-size      一批次数量，默认 2
  --num-workers     线程数量，默认 2
  --no-save         是否保存模型参数，默认保存, 选择后不保存模型参数
  --load-dir        读取模型参数，读取 params 目录下的子文件夹, 默认不读取
  --log             是否输出 VisualDL 日志，默认不输出
  --summary         输出网络模型信息，默认不输出，选择后只输出信息，不会开启训练

测试模型

运行 test.py 文件，查看命令行参数加 -h

python3 test.py

  --cpu           是否使用 cpu 计算，默认使用 CUDA
  --batch-size    一批次数量，默认 2
  --num-workers   线程数量，默认 2
  --load-dir      读取模型参数，读取 params 目录下的子文件夹, 默认 best 目录

测试模型 GTK 界面

运行 test-gtk.py 文件，此程序依赖 GTK 库，只能运行在本地计算机。

python3 test-gtk.py

python3 -m pip install pygobject

1、点击 选择模型 按钮。
2、弹出的文件对话框选择模型，模型在 params 目录下的子目录的 model.pdparams 文件。
3、点击 随机测试 按钮，就可以看到测试的图像，预测结果和实际结果。

查看结果报表

运行 report.py 文件，可以显示 params 目录下所有子目录的 report.json。
加参数 –best 根据 loss 最小的模型参数保存在 best 子目录下。

python3 report.py

report.json 说明

键名说明 id 根据时间生成的字符串 ID loss 本次训练的 loss 值 acc 本次训练的 acc 值 epochs 本次训练的 epochs 值 batch_size 本次训练的 batch_size 值 learning_rate 本次训练的 learning_rate 值

VisualDL 可视化分析工具

安装和使用说明参考：VisualDL
训练的时候加上参数 –log
如果是 AI Studio 环境训练的把 log 目录下载下来，解压缩后放到本地项目目录下 log 目录
在项目目录下运行下面命令
然后根据提示的网址，打开浏览器访问提示的网址即可

visualdl --logdir ./log

Original: https://www.cnblogs.com/cnhemiya/p/16158173.html
Author: 小熊宝宝啊
Title: 小熊飞桨练习册-02眼疾识别

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/805275/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[5道][新手向]Python新手小题

老总们！给个赞吧！创建列表number，向内赋值1,2,3,4,5,6，并在控制台打印number列表里的数字3 请选正确的答案（） A.number = [1,2,3,4,5,…

Python 2023年9月19日
0036
THREE.JS实现看房自由（VR看房）

VR看房 * – 一、前言 – 二、基础知识 – 三、场景 – + 3.1 网络模型 + 3.2 光照 + * 3.2.1 环境光 …

Python 2023年10月10日
0045
用Python写一个自动下载B站视频、弹幕、评论的软件

哈喽兄弟们，今天来实现一个Python采集视频、弹幕、评论与一体的小软件。平常咱们都是直接代码运行，不过今天我们做成软件，这样的话，咱们不仅能自己用，还能分享给小伙伴，女朋友一起…

Python 2023年11月1日
0073
千年荒漠变绿洲，看沙漠“卫士”携手昇腾AI植起绿色希望

摘要：风沙肆虐，沙漠侵蚀神州大地，华东师范大学基于昇腾AI基础软硬件平台研制的种树机器人成为沙漠”卫士”，穿越戈壁，跨越千里，为荒漠治理贡献力量！华师大携手…

Python 2023年10月24日
0047
Python使用ch-orm对ClickHouse简单查询及写入

前不久新项目中需要用到ClickHouse，作为一个合格的Python程序员，首先当然是找找有没有合适的轮子。翻了一圈，infi.clickhouse_orm在功能和易用性上没有…

Python 2023年11月2日
0040
通过python画矢量图（matplotlib，有代码）

python画矢量图（有代码） * – python的matplotlib可以保存的文件格式 – word可以插入哪些图片格式呢 – 代码 &#…

Python 2023年9月1日
0050
全球名校AI课程库（1）| 吴恩达·深度学习专项课程『Deep Learning Specialization』

🏆 课程学习中心; | 🚧 深度学习课程合辑 | 🌍 课程主页 | 📺 中英字幕视频 | 🚀 项目代码解析 | 📚 完整学习笔记课程介绍人工智能正在改变许多行业。本门课程可以帮…

Python 2023年10月24日
0043
机器学习-第一周梳理

吴恩达机器学习（一）一、什么是机器学习(what is Machine learning)？机器学习算法主要有两种机器学习的算法分类监督学习无监督学习两者的区别为是否需要…

Python 2023年10月28日
0034
Spring Boot 配置 jar 包外面的 Properties 配置文件

一、概述 Properties 文件是我们可以用来存储项目特定信息的常用方法。理想情况下，我们应该将其保留在 jar 包之外，以便能够根据需要对配置进行更改。二、使用默认位置按…

Python 2023年10月19日
0036
python pandas模块读取excel_python中pandas模块读取Excel的所有sheet表

Excel转CSV，一个sheet表存入一个CSV文件中，并以sheet名字命名 import pandas as pd def xlsx_to_csv_pd(): sheet_n…

Python 2023年8月8日
0081
【C语言】文件操作（1）

文件操作一、关于文件的基础知识 * 1.为什么要学习文件 2.什么是文件 3.文本文件与二进制文件二、文件的打开和关闭 * 1. 文件指针 2.文件的打开和关闭 3.文件结尾 …

Python 2023年11月6日
0040
Scrapy案例（一）

1. 创建项⽬ 2. 创建Spider 3. 创建Item 4. Spider 5.保存数据 1. 命令保存（⽂件：csv ，json …） 2.管道保存完整代码目…

Python 2023年10月2日
0055
pandas+plotly实现数据图表的绘制和多维度下多个子图的展示

记录使用plotly和pandas实现对数据的处理和绘制,如果要说的高级一点，那可以说是数据可视化plotly是一个图表绘制的三方库，而pandas 则是专业对数据进行处理的三方库…

Python 2023年8月7日
0078
pytest的介绍与使用

pytest介绍 pytest整合了unittest，包含了unittest中的方法，并且比其更轻便快捷，而且结合Allure报告能够清晰的生成测试报告。1、安装：pip inst…

Python 2023年9月13日
0042
2流高手速成记（之八）：基于Sentinel实现微服务体系下的限流与熔断

我们接上回上一篇中，我们进行了简要的微服务实现，也体会到了SpringCloudAlibaba的强大和神奇之处我们仅改动了两个注释，其他全篇代码不变，原来的独立服务就被我们分为…

Python 2023年10月15日
0048
ubuntu16中，利用conda虚拟环境安装pytorch

ubuntu16中，利用conda虚拟环境安装pytorch ubuntu16中，利用conda虚拟环境安装pytorch * 1、conda安装pytorch的GPU版本 2、c…

Python 2023年9月8日
0042

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30