【零基础玩转yolov5】yolov5训练自己的数据集（最新最全版）

2023年7月23日上午5:32 • 人工智能 • 阅读 170

文章目录

*
– 一、写在前面
– 二、使用labelimg标记图片
–
+ 1.准备工作
+ 2.标记图片
– 三、划分数据集以及配置文件修改
–
+ 1. 划分训练集、验证集、测试集
+ 2.XML格式转yolo_txt格式
+ 3.配置文件
+ 4.聚类获得先验框
– 四、使用CPU训练
– 五、使用GPU训练
–
+ 1.开始训练
+ 2.重新下载pytorch
– 六、训练结果可视化

一、写在前面

博主也是最近开始玩yolov5的，甚至也是最近开始使用python的，很多东西都没有接触过，因此训练自己的数据集花了不少时间，所以想写篇博客记录一下，希望同样是零基础的小伙伴们可以更加轻松的上手。同时大家如果发现了错误和理解偏差，欢迎指正。

参考资料：

本教程所安装版本：

pycahrm：2021.3.3
Anconda：2022.05
python：3.9
yolov5：v6.2
pytorch：CUDA 11.6

踩坑经历：

路径中就不要有 短横杠-以及 空格等等特殊字符， 中文更不能要有❗。否则在之后训练时会出现各种路径找不到的问题😭
使用pip等下载指令时最好不要挂VPN，否则可能会下载失败

在上一篇博客里博客链接，我们完成了yolov5的安装和相关环境的配置，在这篇博客里，我们继续yolov5的学习，尝试训练自己的数据集

二、使用labelimg标记图片

1.准备工作

在yolov5目录下新建一个名为 VOCData的文件夹
在VOCData文件夹下创建 Annotations 和 images 文件夹（【🎯 易错】：images的文件名不建议修改，否则之后训练时容易出现 No labels found的错误，原因见下）

[说明]：

Annotations 文件夹用于存放使用labelimg标记后的图片（XML格式）
images 文件夹用于存放用于标记的图片
（【🎯 易错】： images 文件夹下直接放图片，内部不要嵌套有文件夹，否则之后训练可能会出现 No label found 的错误，具体原因见下文中 xml_to_yolo.py文件的第67行）

[为什么]：

在 yolov5 的 utils 文件夹打开 dataloaders.py文件后，搜索define，便可以找到这样的一段代码：

该段代码的作用是 由images文件夹的地址直接推出labels文件夹的位置，所以我们存储图片的文件必须叫做 images，同时labels文件必须和images文件必须在同一目录下（先不管labels具体是什么，有个基本的概念即可，接下来会细说）

; 2.标记图片

在cmd窗口下输入 labelimg 或者运行 labelimg.py 文件进入labelimg的可执行程序（注：如果是在虚拟环境下安装的labelimg，记得先激活虚拟环境）
分别设置需要标注图片的文件夹和存放标记结果的文件夹的地址
推荐设置自动保存
标记图片快捷键： w：标记 a：上一张图片 d：下一张图片

标注的时候尽可能贴近物体轮廓

不知道有没有和我一样开始只能标记 方形框的，按住 ctrl+shift+R就可以恢复创建 矩形框
在Annotations文件夹下可以看到我们标记好的XML文件

三、划分数据集以及配置文件修改

1. 划分训练集、验证集、测试集

在VOCData目录下创建程序 split_train_val.py 并运行以下代码。代码可以不做任何修改


import os
import random
import argparse

parser = argparse.ArgumentParser()

parser.add_argument('--xml_path', default='Annotations', type=str, help='input xml label path')

parser.add_argument('--txt_path', default='ImageSets/Main', type=str, help='output txt label path')
opt = parser.parse_args()

trainval_percent = 1.0
train_percent = 0.9
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
    os.makedirs(txtsavepath)

num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)

file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')

for i in list_index:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        file_trainval.write(name)
        if i in train:
            file_train.write(name)
        else:
            file_val.write(name)
    else:
        file_test.write(name)

file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

运行结束后会在生成一个名为 ImageSets 的文件夹：

测试集里的内容为空，因为在划分数据的时候，将 90%的数据划分到训练集，将 10%的数据划分到训练集。如果要分配，则调整上面14，15行代码中trainval和train的所占的比例

[说明]：

训练集是用来训练模型的，通过尝试不同的方法和思路使用训练集来训练不同的模型
验证集使用交叉验证来挑选最优的模型，通过不断的迭代来改善模型在验证集上的性能
测试集用来评估模型的性能

2.XML格式转yolo_txt格式

在VOCData目录下创建程序 xml_to_yolo.py 并运行以下代码，注意：

将classes改为自己标注时设置的类名（我这里叫”DM”）
将各个绝对路径修改为自己的
\ 是 python中的转义字符，所以表示地址时要使用 \\取消转义，或者 /


import xml.etree.ElementTree as ET
import os
from os import getcwd

sets = ['train', 'val', 'test']
classes = ["DM"]
abs_path = os.getcwd()
print(abs_path)

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return x, y, w, h

def convert_annotation(image_id):
    in_file = open('D:/yolov5/VOCData/Annotations/%s.xml' % (image_id), encoding='UTF-8')
    out_file = open('D:/yolov5/VOCData/labels/%s.txt' % (image_id), 'w')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):
        difficult = obj.find('difficult').text

        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        b1, b2, b3, b4 = b

        if b2 > w:
            b2 = w
        if b4 > h:
            b4 = h
        b = (b1, b2, b3, b4)
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()
for image_set in sets:
    if not os.path.exists('D:/yolov5/VOCData/labels/'):
        os.makedirs('D:/yolov5/VOCData/labels/')
    image_ids = open('D:/yolov5/VOCData/ImageSets/Main/%s.txt' % (image_set)).read().strip().split()

    if not os.path.exists('D:/yolov5/VOCData/dataSet_path/'):
        os.makedirs('D:/yolov5/VOCData/dataSet_path/')

    list_file = open('dataSet_path/%s.txt' % image_set, 'w')

    for image_id in image_ids:
        list_file.write('D:/yolov5/VOCData/images/%s.jpg\n' % image_id)
        convert_annotation(image_id)
    list_file.close()

【🎯 易错】：第59行代码中的 split() 函数是以空格作为分隔符的，因此如果你的 xml文件名中带有空格，就会将文件名错误划分。回应开头说的话，为了避免各种路径找不到的问题，文件路径中 不要有空格，不要有特殊符号，不要有中文！！

运行后会生成如下图所示的 dataSet_path 和 labels 文件夹。dataSet_path下会有三个数据集的txt文件，labels下存放各个图像的标注文件

3.配置文件

在 yolov5 的 data 文件夹下创建一个名为 myvoc.yaml，模板如下，根据自己实际情况填写：
【🎯 易错】：注意冒号后面是有空格的

train: D:/yolov5/VOCData/dataSet_path/train.txt
val: D:/yolov5/VOCData/dataSet_path/val.txt

nc: 1

names: ["DM"]

4.聚类获得先验框

获取anchors
较高版本的yolov5都可以在 utils文件夹下找到 autoanchor.py文件，它的作用是自动获取anchors，因此我们不需要额外的操作。
在 models 文件夹下找到 yolov5s.yaml（如果使用这个权重模型训练的话），将其中的 nc 改为实际上标注类的数量，和 myvoc.yaml 一样（ 记得保存）。

; 四、使用CPU训练

在cmd窗口下激活相应 虚拟环境后 cd 到 yolov5 文件夹后，输入下列指令即可开始训练

python train.py --weights yolov5s.pt  --cfg models/yolov5s.yaml  --data data/myvoc.yaml --epoch 200 --batch-size 8 --img 640   --device cpu

[参数说明]：

--weights ：权重文件所在的相对路径
--cfg：存储模型结构配置文件的相对路径
--data：存储训练、测试数据的文件的相对路径
--epoch：训练过程中整个数据集将被迭代（训练）了多少次
--batch-size：训练完多少张图片才进行权重更新
--img：自适应缩放输入图片的尺寸为指定大小。在YOLOv5中，输入图像的大小需要是正方形，并且是 32 的倍数
--device：选择用CPU或者GPU训练

【🎯 易错】：在指定路径的时候需要注意，在python中， \是转移字符，如果我们想要表示路径，则需要使用 /或者 \\取消转义
(开始训练)

五、使用GPU训练

1.开始训练

CPU适合处理少量复杂运算， GPU适合处理大量简单运算。相较于 CPU， GPU 在具备大量重复数据集运算和频繁内存访问等特点的应用场景中具有无可比拟的优势，在运行分析、深度学习和机器学习算法尤其有用。
GPU 能够让某些计算比传统 CPU 上运行相同的计算速度快 10 倍至 100 倍。所以更加推荐使用GPU进行训练。

使用GPU训练，只需将代码中的 --device cpu改为 --device 0/1…… 即可，显卡编号可以使用 nvidia-smi指令来查看。如下图所示，我的电脑中只安装了一块GPU，在训练中只能使用 --device 0.

python train.py --weights yolov5s.pt  --cfg models/yolov5s.yaml  --data data/myvoc.yaml --epoch 200 --batch-size 8 --img 640   --device 0

而在下面例子中，则有两块GPU

🎯 易错①：如果训练时出现 CUDA out of memory的错误，将 batch_size 改到4基本能解决问题，再不行就改成1

🎯 易错： yolov5 是基于 pytorch 实现的，而使用 pip 默认安装的 pytorch 是以CPU作为计算平台，因此CUDA是不可用的，需要重新下载基于 CUDA 计算的pytorch

2.重新下载pytorch

pytorch文件比较大，建议下载的时候首先给 pip 换源

Pytorch官方下载链接：https://pytorch.org/get-started/locally/

首先在相应虚拟环境下删除原先版本的pytorch。注意！仅仅使用 pip uninstall torch指令是不够的，因为重新下载的 torch 可能与其他软件之间存在 版本不兼容问题。正确的做法是：找到自己Anconda中对应虚拟环境的位置，将下面这些文件全部删除。
使用 nvidia-smi 查看最高能下载的 pytorch CUDA版本，我这里是11.6
强烈推荐使用 pip 安装而不要使用 conda安装， conda 安装太慢了，换源还是很慢，而且还很容易失败 pip install 与 conda install 的使用区别
检测cuda是否可用：首先包含头文件 import torch，在输入指令 torch.cuda.is_available()，返回true说明可以使用。接下来我们就可以使用GPU进行训练

; 六、训练结果可视化

训练结果将保存在 \runs\train 文件夹下，部分文件意义如下：

weights：训练生成权重。包含 best.pt (最好的权重，detect时用到它)，和 last.pt(最近生成的权重模型)
confusion：混淆矩阵。混淆矩阵让我们了解分类模型所犯的错误，更重要的是可以了解哪些错误类型正在发生。
F1_curve：置信度和F1分数的关系图
P_curve：准确率和置信度的关系图
R_curve：召回率和置信度之间的关系
PR_curve：PR曲线中的P代表的是precision（精准率），R代表的是recall（召回率），其代表的是精准率与召回率的关系
labels：左上图表示个类别的数据量；右上图表示标签；左下图表示 center 的 xy 坐标；右下图表示各个标签的长和宽

TensorBoard 是 TensorFlow 提供的一个可视化工具，用于帮助用户通过交互式的数据可视化方式监控、调试、优化深度学习模型。使用指令 tensorboard --logdir=xxx 启动TensorBoard 服务，并递归式的读取指定路径下的所有事件数据。

训练后的事件数据存储在 runs/train 路径中，我们想查看exp13的训练结果，可以执行下面的指令： tensorboard --logdir= runs/train/exp13

访问网页 http://localhost:6006/即可看到各种训练结果（注：localhost指的是你所在的计算机本身）

使用刚刚训练好的 best.pt模型来检测：

 python detect.py --weights runs/train/exp/weights/best.pt --source ../source/test.png

[说明]：

--weights：表示我们选择的权重模型
--source：表示待检测的图片的路径 (…/表示上级路径)

成功实现了恶劣环境下的DM码的定位

Original: https://blog.csdn.net/whc18858/article/details/127164010
Author: 罅隙`
Title: 【零基础玩转yolov5】yolov5训练自己的数据集（最新最全版）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/710151/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PyTorch环境搭建、安装过程以及卸载(anaconda+清华镜像+安装pyTorch）

本文介绍基于Anaconda环境以及PyCharm软件结合，安装PyTorch深度学习框架。一. 安装anaconda 此处默认已经安装好了anaconda.(也可以去anaco…

人工智能 2023年6月15日
0075
wandb不可缺少的机器学习分析工具

wandb wandb全称 Weights & Biases，用来帮助我们跟踪机器学习的项目，通过 wandb可以记录模型训练过程中指标的变化情况以及超参的设置，还能够将输…

人工智能 2023年6月24日
00123
手把手教python发送邮件

使用python内置模块– smtplib和 email进行邮件发送。其中 smtplib模块负责发送邮件，而email模块负责构造邮件内容。一、基本用法介绍： 1、smtpli…

人工智能 2023年7月29日
0071
seurat 与geo geo单细胞导入seurat实战数据下载数据分析 scrna-seq

前面jimmy老师分享了两个祖传的单细胞转录组数据分析代码，非常给力，是标准流程：祖传的单个10x样本的seurat标准代码祖传的单个10x样本的seurat标准代码（人和鼠需要…

人工智能 2023年6月19日
0091
【计算机视觉】图像增强——图像的形态学操作

个人简介： 📦个人主页：赵四司机🏆学习方向：JAVA后端开发⏰往期文章：SpringBoot项目整合微信支付🔔博主推荐网站：牛客网刷题|面试|找工作神器📣种一棵树最好的时间是十年…

人工智能 2023年7月29日
0096
STM32移植神经网络（5）– STM32部分（模型移植）

1 简介上次写到将OV56640采集的JPEG数据存入SD可存储，后续就需要使用STM32的硬件JPEG解码将图片从SD取出，并将其转换为RGB888格式。具体的可以参考正点的硬…

人工智能 2023年7月13日
00123
《数字图像处理》：直方图处理的几种方式

目录前言一、直方图均衡化 1、直方图均衡化的介绍 2、直方图均衡化的数学原理 3、直方图均衡化的matlab代码实现二、直方图规定化 1、直方图规定化介绍 2、直方图规定化的…

人工智能 2023年6月22日
0082
Jetson Nano使用CSI摄像头以及USB摄像头（CSI摄像头打开失败,USB摄像头打不开）

目录一.Jestson Nano打开CSI摄像头二.Jestson Nano打开USB摄像头大功告成！编写不易，大家成功后点个关注or赞谢谢~ 注意：网上非常多的代码打不开…

人工智能 2023年6月18日
00126
基于循环神经网络lstm构建一个商品评论分类模型

一、项目背景及意义 AI人工智能一直是近年来热度一直热度不减的话题，我们常在各种科幻电影和小说都能看到它的身影，甚至在现实生活中看见它，对于AI的研究也一直源源不断。这个项目是基于…

人工智能 2023年7月3日
0071
机器学习中的数学——距离定义（六）：马氏距离（Mahalanobis Distance）

马氏距离（Mahalanobis Distance）是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的，表示数据的协方差距离。它是一种有效的计算两个未知样本集…

人工智能 2023年6月15日
0095
1. Pytorch的基本语法

学习目标了解什么是Pytorch. 掌握Pytorch的基本元素操作. 掌握Pytorch的基本运算操作. 什么是Pytorch Pytorch是一个基于Numpy的科学计算包,…

人工智能 2023年7月21日
0040
Scala系列-2、scala函数式编程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。传送门：大数据系列文章目录目录 * – foreach算子 …

人工智能 2023年6月28日
0061
R语言使用lm函数构建线性回归模型、应用回归模型预测新的预测变量对应的响应变量（predict函数返回预测值的向量）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月18日
00110
【单细胞分析】P2.5、聚类，筛选marker基因，可视化

#5.1 聚类 pc.num=1:20 #基于PCA数据 scRNA 这里构建pc.nmu这个数列，相当于选取20个元素进行后续的计算。 findneighbors和findclu…

人工智能 2023年5月31日
0087
基于梯度的黑盒迁移对抗攻击（附代码）

1 引言黑盒迁移攻击是对抗攻击中非常热门的一个研究方向，基于动量梯度的方法又是黑盒迁移攻击的一个主流方向。当前大部分研究主要通过在数据样本的尺寸，分布，规模，时序等方面来丰富梯度…

人工智能 2023年6月15日
0051
MySQL表的增删改查(进阶)

目录 1.数据库约束 * 1.1约束类型 1.2 NULL约束 1.3 UNIQUE：唯一约束 1.4 PRIMARY KEY: 主键约束 1.5 DEFAULT：默认值约束 1….

人工智能 2023年7月29日
0079

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【零基础玩转yolov5】yolov5训练自己的数据集（最新最全版）

文章目录

一、写在前面

二、使用labelimg标记图片

1.准备工作

; 2.标记图片

三、 划分数据集以及配置文件修改

1. 划分训练集、验证集、测试集

2.XML格式转yolo_txt格式

3.配置文件

4.聚类获得先验框

; 四、使用CPU训练

五、使用GPU训练

1.开始训练

2.重新下载pytorch

; 六、训练结果可视化

大家都在看

三、划分数据集以及配置文件修改