小熊飞桨练习册-06Paddlex垃圾分类

2023年6月4日上午10:46 • 人工智能 • 阅读 91

文件说明

文件说明 train.py 训练程序 quant.py 量化程序 prune.py 裁剪程序 test.py 测试程序 infer.py 预测程序 onekey.sh 一键获取数据到 dataset 目录下 onetasks.sh 一键训练，量化脚本 get_data.sh 获取数据到 dataset 目录下 check_data.sh 检查 dataset 目录下的数据是否存在 mod/args.py 命令行参数解析 mod/pdxconfig.py PaddleX 配置 mod/config.py 配置 mod/utils.py 杂项 mod/report.py 结果报表 dataset 数据集目录 output 训练参数保存目录 result 预测结果保存目录

环境依赖

数据集

一键获取数据

运行脚本，包含以下步骤：获取数据，生成图像路径和标签的文本文件，检查数据。
详情查看 *onekey.sh

如果运行在本地计算机，下载完数据，文件放到 dataset 目录下，在项目目录下运行下面脚本。

如果运行在百度 AI Studio 环境，查看 data 目录是否有数据，在项目目录下运行下面脚本。

bash onekey.sh

配置模块

可以查看修改 mod/pdxconfig.py 文件，有详细的说明

开始训练

运行 train.py 文件，查看命令行参数加 -h

python3 run/train.py \
    --dataset ./dataset/train \
    --epochs 32 \
    --batch_size 16 \
    --learning_rate 0.01 \
    --lr_decay_epochs "16"\
    --lr_decay_gamma 0.25 \
    --model MobileNetV3_large_ssld \
    --pretrain_weights "IMAGENET"

  -h, --help            show this help message and exit
  --cpu                 是否使用 cpu 计算，默认使用 CUDA
  --num_workers         线程数量，默认 auto，为CPU核数的一半
  --epochs              训练几轮，默认 4 轮
  --batch_size          一批次数量，默认 16
  --learning_rate       学习率，默认 0.025
  --early_stop          是否使用提前终止训练策略。默认为 False
  --early_stop_patience
                        当使用提前终止训练策略时，如果验证集精度在early_stop_patience 个 epoch
                        内连续下降或持平，则终止训练。默认为 5
  --save_interval_epochs
                        模型保存间隔(单位: 迭代轮数)。默认为 1
  --log_interval_steps
                        训练日志输出间隔（单位：迭代次数）。默认为 10
  --resume_checkpoint   恢复训练时指定上次训练保存的模型路径, 默认不会恢复训练
  --save_dir            模型保存路径。默认为 ./output/
  --dataset             数据集目录，默认 ./dataset/
  --train_list          训练集列表，默认 '--dataset' 参数目录下的 train_list.txt
  --eval_list           评估集列表，默认 '--dataset' 参数目录下的 val_list.txt
  --label_list          分类标签列表，默认 '--dataset' 参数目录下的 labels.txt
  --warmup_steps        默认优化器的 warmup 步数，学习率将在设定的步数内，从 warmup_start_lr
                        线性增长至设定的 learning_rate，默认为 0
  --warmup_start_lr     默认优化器的 warmup 起始学习率，默认为 0.0
  --lr_decay_epochs     默认优化器的学习率衰减轮数。默认为 30 60 90
  --lr_decay_gamma      默认优化器的学习率衰减率。默认为 0.1
  --use_ema             是否使用指数衰减计算参数的滑动平均值。默认为 False
  --opti_scheduler      优化器的调度器，默认 auto，可选 auto，cosine，piecewise
  --opti_reg_coeff      优化器衰减系数，如果 opti_scheduler 是 Cosine，默认是 4e-05，如果
                        opti_scheduler 是 Piecewise，默认是 1e-04
  --pretrain_weights    若指定为'.pdparams'文件时，从文件加载模型权重；若为字符串'IMAGENET'，则自动下载在Ima
                        geNet图片数据上预训练的模型权重；若为字符串'COCO'，则自动下载在COCO数据集上预训练的模型权重；
                        若为None，则不使用预训练模型。默认为'IMAGENET'
  --model               PaddleX 模型名称
  --model_list          输出 PaddleX 模型名称，默认不输出，选择后只输出信息，不会开启训练
  --backbone            目标检测模型的 backbone 网络

查看支持的模型

运行命令

python3 run/train.py --model_list

'PPLCNet', 'PPLCNet_ssld', 'ResNet18', 'ResNet18_vd', 'ResNet34', 'ResNet34_vd', 'ResNet50', 'ResNet50_vd', 'ResNet50_vd_ssld', 'ResNet101', 'ResNet101_vd', 'ResNet101_vd_ssld', 'ResNet152', 'ResNet152_vd', 'ResNet200_vd', 'DarkNet53', 'MobileNetV1', 'MobileNetV2', 'MobileNetV3_small', 'MobileNetV3_small_ssld', 'MobileNetV3_large', 'MobileNetV3_large_ssld', 'Xception41', 'Xception65', 'Xception71', 'ShuffleNetV2', 'ShuffleNetV2_swish', 'DenseNet121', 'DenseNet161', 'DenseNet169', 'DenseNet201', 'DenseNet264', 'HRNet_W18_C', 'HRNet_W30_C', 'HRNet_W32_C', 'HRNet_W40_C', 'HRNet_W44_C', 'HRNet_W48_C', 'HRNet_W64_C', 'AlexNet'

测试模型

运行 test.py 文件，查看命令行参数加 -h

python3 run/test.py --model_dir ./output/best_model \
    --epochs 4 \
    --dataset ./dataset/train \
    --test_list ./dataset/train/test_list.txt

  -h, --help    show this help message and exit
  --cpu         是否使用 cpu 计算，默认使用 CUDA
  --epochs      测试几轮，默认 4 轮
  --dataset     数据集目录，默认 ./dataset/
  --test_list   训练集列表，默认 '--dataset' 参数目录下的 test_list.txt
  --model_dir   读取训练后的模型目录，默认 ./output/best_model

预测模型

运行 infer.py 文件，查看命令行参数加 -h

python3 run/infer.py --dataset ./dataset/train --model_dir ./output/best_model

  -h, --help      show this help message and exit
  --cpu           是否使用 cpu 计算，默认使用 CUDA
  --dataset       数据集目录，默认 ./dataset/
  --infer_list    预测集列表，默认 '--dataset' 参数目录下的 infer_list.txt
  --model_dir     读取训练后的模型目录，默认 ./output/best_model
  --result_info   显示预测结果详细信息，默认 不显示
  --result_path   预测结果文件路径，默认 ./result/result.csv
  --split         数据分隔符，默认 ','

VisualDL 可视化分析工具

安装和使用说明参考：VisualDL
如果是 AI Studio 环境训练的把 output/vdl_log 目录下载下来，解压缩后放到本地项目目录下 output/vdl_log 目录
在项目目录下运行下面命令
然后根据提示的网址，打开浏览器访问提示的网址即可

visualdl --logdir ./output/vdl_log

Original: https://www.cnblogs.com/cnhemiya/p/16280476.html
Author: 小熊宝宝啊
Title: 小熊飞桨练习册-06Paddlex垃圾分类

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/567257/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

毕业论文第一步–如何快速写出让人眼前一亮的文献综述论文（citspace）

一、文献综述是什么？文献综述简称综述，是对某一领域，某一专业或某一方面的课题、问题或研究专题搜集大量相关资料，然后通过阅读、分析、提炼、整理当前课题、问题或研究专题的最新进展、学…

人工智能 2023年6月1日
0090
Pandas读取数据

目录一、pandas读取csv文件这里我们可以指定name参数，来给我们的列表的不同列命名指定我们的行索引将指定的数据置空保存我们的CSV数据二、Python读取JSO…

人工智能 2023年6月19日
00113
船舶轨迹预测

经济全球化程度日益增大，各国经济贸易往来频繁带动航运行业欣欣向荣，海域航道以及港口水域的负载增加，造成船舶交通阻塞、船舶碰撞事件事故频发等问题。因此，准确获取船舶航行实时动态信息，…

人工智能 2023年6月15日
00130
数据预处理（提取数据，合并csv，建立词典，引入外部词典的分词，删除csv文件特定行）

数据处理 1、提取数据 * 第一步：创建一个DataFrame 第二步：提取相应列存入DataFrame 2、从多文件中提取数据 * 3、合并csv文件 4、用正则表达式抠出所需内…

人工智能 2023年7月8日
0076
Python建立线性回归模型进行房价预测

Python建立线性回归模型进行房价预测前期准备多因子房价预测 * 实战流程 – 1.数据加载 2.数据可视化 3.数据预处理 4.模型建立与训练 5.模型预测 6…

人工智能 2023年6月15日
00117
DTM动态主题模型实战案例

DTM动态主题模型实战案例针对三个月份某期刊论文的摘要进行时间片上的动态模型主题分析文章目录 DTM动态主题模型实战案例 * 代码实现所参考博客一、数据处理二、使用步骤 *…

人工智能 2023年6月24日
0095
【skLearn 回归模型】岭回归 —- 选择最佳正则化参数＜带交叉验证的岭回归RidgeCV()＞

文章目录一、岭迹图 * 介绍简单使用二、交叉验证岭回归 —- klearn.linear_model.RidgeCV * 加利福尼亚房屋价值测试一、岭迹图介绍…

人工智能 2023年6月18日
0081
优化器(Optimizer)（SGD、Momentum、AdaGrad、RMSProp、Adam）

文章目录 * – 3.1、传统梯度优化的不足(BGD,SGD,MBGD) – + 3.1.1 一维梯度下降 + 3.1.2 多维梯度下降 – 3…

人工智能 2023年6月24日
0099
Halcon之Blob分析

文章目录 Blob Analysis * 1、基本概念 – 1.1 获取图像 1.2 分割图像 1.3 提取特征 1.4 A First Example 2、扩展概念 …

人工智能 2023年7月23日
0096
自动驾驶轨迹预测论文阅读（二）TPNet: Trajectory Proposal Network for Motion Prediction

论文链接：https://openaccess.thecvf.com/content_CVPR_2020/papers/Fang_TPNet_Trajectory_Proposal…

人工智能 2023年6月24日
00109
OpenCV实战（1）——OpenCV与图像处理基础

OpenCV实战（1）——OpenCV与图像处理基础 * – 0. 前言 – 1. OpenCV 基础 – + 1.1 安装 OpenCV + …

人工智能 2023年7月20日
0061
深度学习-nlp系列（2）文本分类（Bert）pytorch

对于 Bert 来说，用于文本分类是最常见的，并且准确率也很高。本文将会对 bert 用于文本分类来做详细的介绍。预训练模型对于不同的数据，需要导入不同的预训练模型。预训练模…

人工智能 2023年7月21日
0063
算法面试之RNN激活函数、权重共享

概述模拟人的阅读顺序N-Gram模型：认为一个词只和前面N-1个词有关循环神经网络RNN理论上可以往前(后)看任意多个词梯度消失或者梯度爆炸会导致梯度为0或NaN，进而无法继续训…

人工智能 2023年5月30日
0095
芯片产业“冰火两重天”：谁在降价？谁在缺货？

自2021年开始，芯片的供不应求严重扰乱了市场，智能手机、汽车电子等生产受影响较大。全球各大芯片制造厂商也在加速扩大投资，增设新厂，预计投产也需要一定的时间。但从近两月趋势来看，…

人工智能 2023年6月4日
0076
激活函数意义，什么样的函数可以作为激活函数，设计激活函数时需要考虑什么，常见激活函数及其优缺点和应用场景——从感知机到神经网络

文章目录感知机是什么感知机的局限性 * 线性空间和非线性空间感知机的局限性克服局限性激活函数的意义：从感知机到神经网络——差别在于激活函数激活函数 * 什么样的函数可以…

人工智能 2023年7月1日
0086
2021-09-09

title: 浙商银行数字化转型实践author: [‘王鑫’]date: 2021-09-09tags: [‘金融’] 浙商银行的…

人工智能 2023年6月1日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31