手把手教你玩转YOLOX–（下）数据集标注及训练

2023年6月16日上午2:27 • 人工智能 • 阅读 213

数据集的标注是做训练的重要一环，本次数据集标注以口罩检测为例，介绍使用labelimg的数据标注，并且使用YOLOX进行训练。我们从百度网上搜了一些图片，我们就拿这些图片进行标注并训练，标注对象主要有两个”persion”和”mask”，就是普通行人和戴口罩的人两类。首先给大家使用数据集标注软件labelimg。

一：labelimg的安装

labelimg的安装

首先我们进入到我们在上一节创建的python环境

conda activate yolox_train

然后我们执行：

pip install labelimg

如果镜像源不够快也可以指定清华的镜像源

pip install labelimg -i https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/

然后安装pyqt5如下操作：

pip install pyqt5

二：labelimg的使用

在yolox环境下执行：labelimg，打开界面，如图：

Open：打开一个图片。

Open Dir：打开一个目录下所有图片。

Change Save Dir：标注后的图片保存目录。

Next Image：下一副图片。

Prev Image：上一副图片。

Create RectBox：标注图片。

YOLO：指标注成yolo格式，点击还可以改为：Pascal VOC、CreatML格式。

三：Pascal VOC数据集格式

（1）准备你的数据集

第一步：筛选图片：一般我们从网上爬下来的图片文件名各异，我们首先要把这些文件进行第一资的筛选，把打不开的，动画图片，卡通等不符合要求的图片删除掉。

第二步：文件重命名：将你认为合格的文件进行重新命名，从000001.jpg,000002,jpg……00000n.jpy进行命名，因为需要训练的文件比较多，你可以编写一个小程序，自动命名这些文件。

（2）PASCAL VOC数据集由三个部分构成，JPEGImages，Annotations，ImageSets。

JPEGImages：存放的是训练与测试的所有图片。
Annotations：里面存放的是每张图片打完标签所对应的XML文件
ImageSets：里面有个Main文件夹，其中包含存储着图片名称的txt文件，分为训练与测试。VOC2007的文件目录如下：

–VOC2007
–Annotations
–ImageSets
–Main
–Layout
–Segmentation
–JPEGImages
–SegmentationClass
–SegmentationObject

（3）在这次标注中我们使用Pascal VOC格式保存标注。

先按照VOC2007的数据集格式创建相应的文件夹。然后将我们找到的图片放到JPEGImages文件病人，打开labelimg设置好：

Open Dir：指向”JPEGImages”文件夹，将你的原始图片全都考贝到这个文件夹里去。

Change Save Dir：指向”Annotations”文件夹。labelimg保存标注后会自动存到这个文件夹里。

四：labelimg数据标注

如下进行标注

多人时进行标注，如下图。

Next Image时会提示你进行保存。

五：训练数据集的划分

训练数据集的划分：训练集、测试集和验证集，我们可以按比例进行划分，有需要完整数据数据集的标注和划分的小伙伴，可以下载这些数据集，下载地址：https://download.csdn.net/download/chengxuquan/85038183

python split_voc.py

六：开始训练

（1）训练

我们这里主要是跟大家演示，所以训练模我们选用一个最小的预训练模型yolox_s.pth，你可以去上一章节们的项目地址去下载这些模型。数据集的处理这里我们使用yolox项目提供的一个例程就可以了路径在：exps/example/yolox_voc/yolox_voc_s.py。这个文件要修改一下：

修改类别：

self.num_classes = 20改为2，因为我们只有两个类别，persion和mask，就是行人和戴口罩的人两类。

self.num_classes = 2

修改数据集图片列表

image_sets = [(‘2007’, ‘trainval’), (‘2012’, ‘trainval’)],改为：

image_sets = [('2007', 'trainval')],

修改类别

在YOLOX/yolox/data/datasets文件夹下面有两个文件，voc_classes.py和coco_classes.py

删除原有的类别，然后把我们两个类别加上，voc_classes.py修改如下：

VOC_CLASSES = (
"face",
"mask",
)

coco_classes.py修改如下：

COCO_CLASSES = (
"face",
"mask",
)

开始训练：

python tools/train.py -f exps/example/yolox_voc/yolox_voc_s.py -d 1 -b 16 --fp16 -o -c weights/yolox_s.pth

（2）可视化

tensorboard --logdir ./YOLOX_outputs/yolox_voc_s

(3)查看训练结果

查看YOLOX_outputs/yolox_voc_s_bm目录下的文件。这里面有训练过程中所生成的全部pth。一般我们会使用best_ckpt.pth这个文件，这个文件是训练过程中效果最好的一个。

(4）测试训练出来的模型

将best_ckpt.pth文件考贝到weights下，把需要测试的图片考贝到指定目录，比如我们可放在assets下面放一张000206.jpg的图片。然后执行：

python tools/demo.py image -f exps/example/yolox_voc/yolox_voc_s.py -c weights/best_ckpt.pth --path assets/000206.jpg --conf 0.3 --nms 0.65 --tsize 640 --save_result --device gpu

七：提供一套已经标注好的付费口罩数据集，有需要的小伙伴可点击下载。

口罩检测训练数据集，用于训练自己的深度学习模型。内含1613张图片用于训练，1610张图片标注，并提供已经训练好的yolox的模型，本例提供了数据集整理代码，用于数据集前期处理，包括将中文名转为英文，包括将数据整理为VOC训练格式的文件结构，包括将数据集进行训练集和测试集的自动划分。本数据集以训练yolox为例，同时提供训练的方法及异常处理。训练集也可以用于yolox_v5架构等的训练。

下载地址如下：

深度学习，口罩检测训练数据集，用于训练自己的深度学习模型，提供数据前期处理代码及yolox训练方法。-深度学习文档类资源-CSDN下载

Original: https://blog.csdn.net/chengxuquan/article/details/123130279
Author: BBM的开源HUB
Title: 手把手教你玩转YOLOX–（下）数据集标注及训练

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/619107/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

章节1 计算机体系结构

1.2.1-计算机硬件组成-CPU 计算机组成 ; 台式机硬件-内部台式机硬件-外部结构 ; CPU Center Processing Unit（中央处理器/处理器）常见的电…

人工智能 2023年6月30日
0091
005-数码管的使用

实现数码管的控制及使用方式数码管的使用功能：实现数码管的控制及使用方式方案一：控制数码管1显示数字5 #include<reg52.h> sbit Ls1 = P…

人工智能 2023年6月6日
0086
图像分类（二）CBAM —— Spatial Attention空间注意力及Resnet_cbam实现

Spatial Attention空间注意力及Resnet_cbam实现前言一、Attention表达改进二、Spatial Attention空间注意力三、Resnet_…

人工智能 2023年7月5日
00132
类别激活热力图grad-cam(pytorch)实战跑图

写在前面类激活热力图：用于检查图像哪一部分对模型的最终输出有更大的贡献。具体某个类别对应到图片的那个区域响应最大，也就是对该类别的识别贡献最大 pytorch-grad-cam库…

人工智能 2023年7月20日
0096
PyTorch有哪些用于构建神经网络的高级功能

1. 问题背景 PyTorch是一个使用动态计算图的开源机器学习库，它提供了丰富的功能来构建神经网络。本文将介绍PyTorch中用于构建神经网络的高级功能，并详细解释其原理、公式推…

人工智能 2024年1月3日
0049
知识图谱初识-知识图谱与语义技术简介

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月5日
00100
OpenCV基础操作_视频读取

1.1 cv2. VideoCapture () 在OpenCV中，可以使用 VideoCapture来读取视频文件，或是摄像头数据。 Python: cv2. VideoCapt…

人工智能 2023年7月27日
0068
全网首发！马士兵内部共享—1658页《Java面试突击核心讲》

今年金九银十真得是凉到低了，为助力广大程序员朋友 “面试造火箭”，小编今天给大家分享的便是这份马士兵内部的面试神技——1658页《Java面试突击核心讲》！…

人工智能 2023年6月28日
00124
2000字精华总结，安利一个超好用的 Python 数据分析神器

大家好，今天我来给大家介绍一款用于做EDA(探索性数据分析)的利器，并且可以自动生成代码，帮助大家极大节省工作时间与提升工作效率的利器。这款神器就是 Bamboolib，可以将其…

人工智能 2023年7月17日
0073
低照度图像数据集

包含 500 个低光/正常光图像对。原始图像被调整为 400×600 并转换为便携式网络图形格式。使用三步法来消除数据集中图像对之间的错位。 Exclusive Dark数据集…

人工智能 2023年6月16日
00116
线性回归模型之波士顿房价预测

波士顿房价数据集统计的是20世纪70年代中期波士顿郊区房价的中位数，统计了城镇人均犯罪率、不动产税等共计13个指标，506条房价数据，通过统计出的房价，试图能找到那些指标与房价的关…

人工智能 2023年6月16日
00266
pandas 下一行减去上一行

diff()函数 df[‘1].diff() 结果第一个结果为NAN。 2.shift()函数： df[‘1’].shift(-1) – df[‘1’] 代&…

人工智能 2023年7月6日
0095
【机器学习】python实现非线性回归（以中国1960-2014GDP为例）

非线性回归目标区分线性回归和非线性回归用py实现非线性回归如果数据表现出一个曲线的趋势，那么相比于非线性回归，线性回归就不会产生一个非常精确的结果，因为线性回归假设数据是线…

人工智能 2023年7月6日
0066
分类预测 | MATLAB实现CNN卷积神经网络数据分类预测

分类预测 | MATLAB实现CNN卷积神经网络数据分类预测目录 * – 分类预测 | MATLAB实现CNN卷积神经网络数据分类预测 – + 基本介绍 …

人工智能 2023年6月30日
0079
【深度学习笔记1】-pytorch的dataloader参数shuffle设置true或false

作为一名深度学习的小白，最近在做LSTM预测股票问题，发现训练集的shuffle必须为true而测试集的shuffle必须为false。如果训练集的shuffle不设置为true的…

人工智能 2023年6月16日
00129
特征工程Embedding技术

文章目录 * – Embedding概念 – 经典Embedding方法Word2Vec – + Word2Vec介绍 + Word2Vec如何…

人工智能 2023年5月27日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

手把手教你玩转YOLOX–（下）数据集标注及训练

大家都在看