YOLOv5训练自己的数据集

2023年5月26日上午8:37 • 人工智能 • 阅读 71

版本：YOLOv5-5.0 权重文件：yolov5s.pt

将YOLOv5自带的images删去；

1.在data文件夹下新建Annotations、images、ImageSets、JPEGImages、labels五个目录；

Annotations存放标签xml文件（自己放进去）；

images和JPEGImages存在图片jpg（自己放进去）；

ImageSets存放如下四个txt文件（暂无）；

labels存放xml文件转换的txt文件（暂无）。

2.在YOLOv5目录下粘贴voc_label.py和makeTxt.py

（1）voc_label.py内容如下：

xml&#x89E3;&#x6790;&#x5305;
import xml.etree.ElementTree as ET
import pickle
import os
os.listdir() &#x65B9;&#x6CD5;&#x7528;&#x4E8E;&#x8FD4;&#x56DE;&#x6307;&#x5B9A;&#x7684;&#x6587;&#x4EF6;&#x5939;&#x5305;&#x542B;&#x7684;&#x6587;&#x4EF6;&#x6216;&#x6587;&#x4EF6;&#x5939;&#x7684;&#x540D;&#x5B57;&#x7684;&#x5217;&#x8868;
from os import listdir, getcwd
from os.path import join

sets = ['train', 'test', 'val']
classes=["phone"]

&#x8FDB;&#x884C;&#x5F52;&#x4E00;&#x5316;&#x64CD;&#x4F5C;
def convert(size, box): # size:(&#x539F;&#x56FE;w,&#x539F;&#x56FE;h) , box:(xmin,xmax,ymin,ymax)
    dw = 1./size[0]     # 1/w
    dh = 1./size[1]     # 1/h
    x = (box[0] + box[1])/2.0   # &#x7269;&#x4F53;&#x5728;&#x56FE;&#x4E2D;&#x7684;&#x4E2D;&#x5FC3;&#x70B9;x&#x5750;&#x6807;
    y = (box[2] + box[3])/2.0   # &#x7269;&#x4F53;&#x5728;&#x56FE;&#x4E2D;&#x7684;&#x4E2D;&#x5FC3;&#x70B9;y&#x5750;&#x6807;
    w = box[1] - box[0]         # &#x7269;&#x4F53;&#x5B9E;&#x9645;&#x50CF;&#x7D20;&#x5BBD;&#x5EA6;
    h = box[3] - box[2]         # &#x7269;&#x4F53;&#x5B9E;&#x9645;&#x50CF;&#x7D20;&#x9AD8;&#x5EA6;
    x = x*dw    # &#x7269;&#x4F53;&#x4E2D;&#x5FC3;&#x70B9;x&#x7684;&#x5750;&#x6807;&#x6BD4;(&#x76F8;&#x5F53;&#x4E8E; x/&#x539F;&#x56FE;w)
    w = w*dw    # &#x7269;&#x4F53;&#x5BBD;&#x5EA6;&#x7684;&#x5BBD;&#x5EA6;&#x6BD4;(&#x76F8;&#x5F53;&#x4E8E; w/&#x539F;&#x56FE;w)
    y = y*dh    # &#x7269;&#x4F53;&#x4E2D;&#x5FC3;&#x70B9;y&#x7684;&#x5750;&#x6807;&#x6BD4;(&#x76F8;&#x5F53;&#x4E8E; y/&#x539F;&#x56FE;h)
    h = h*dh    # &#x7269;&#x4F53;&#x5BBD;&#x5EA6;&#x7684;&#x5BBD;&#x5EA6;&#x6BD4;(&#x76F8;&#x5F53;&#x4E8E; h/&#x539F;&#x56FE;h)
    return (x, y, w, h)    # &#x8FD4;&#x56DE; &#x76F8;&#x5BF9;&#x4E8E;&#x539F;&#x56FE;&#x7684;&#x7269;&#x4F53;&#x4E2D;&#x5FC3;&#x70B9;&#x7684;x&#x5750;&#x6807;&#x6BD4;,y&#x5750;&#x6807;&#x6BD4;,&#x5BBD;&#x5EA6;&#x6BD4;,&#x9AD8;&#x5EA6;&#x6BD4;,&#x53D6;&#x503C;&#x8303;&#x56F4;[0-1]

year ='2012', &#x5BF9;&#x5E94;&#x56FE;&#x7247;&#x7684;id&#xFF08;&#x6587;&#x4EF6;&#x540D;&#xFF09;
def convert_annotation(image_id):
    '''
    &#x5C06;&#x5BF9;&#x5E94;&#x6587;&#x4EF6;&#x540D;&#x7684;xml&#x6587;&#x4EF6;&#x8F6C;&#x5316;&#x4E3A;label&#x6587;&#x4EF6;&#xFF0C;xml&#x6587;&#x4EF6;&#x5305;&#x542B;&#x4E86;&#x5BF9;&#x5E94;&#x7684;bunding&#x6846;&#x4EE5;&#x53CA;&#x56FE;&#x7247;&#x957F;&#x6B3E;&#x5927;&#x5C0F;&#x7B49;&#x4FE1;&#x606F;&#xFF0C;
    &#x901A;&#x8FC7;&#x5BF9;&#x5176;&#x89E3;&#x6790;&#xFF0C;&#x7136;&#x540E;&#x8FDB;&#x884C;&#x5F52;&#x4E00;&#x5316;&#x6700;&#x7EC8;&#x8BFB;&#x5230;label&#x6587;&#x4EF6;&#x4E2D;&#x53BB;&#xFF0C;&#x4E5F;&#x5C31;&#x662F;&#x8BF4;
    &#x4E00;&#x5F20;&#x56FE;&#x7247;&#x6587;&#x4EF6;&#x5BF9;&#x5E94;&#x4E00;&#x4E2A;xml&#x6587;&#x4EF6;&#xFF0C;&#x7136;&#x540E;&#x901A;&#x8FC7;&#x89E3;&#x6790;&#x548C;&#x5F52;&#x4E00;&#x5316;&#xFF0C;&#x80FD;&#x591F;&#x5C06;&#x5BF9;&#x5E94;&#x7684;&#x4FE1;&#x606F;&#x4FDD;&#x5B58;&#x5230;&#x552F;&#x4E00;&#x4E00;&#x4E2A;label&#x6587;&#x4EF6;&#x4E2D;&#x53BB;
    labal&#x6587;&#x4EF6;&#x4E2D;&#x7684;&#x683C;&#x5F0F;&#xFF1A;calss x y w h&#x3000;&#x3000;&#x540C;&#x65F6;&#xFF0C;&#x4E00;&#x5F20;&#x56FE;&#x7247;&#x5BF9;&#x5E94;&#x7684;&#x7C7B;&#x522B;&#x6709;&#x591A;&#x4E2A;&#xFF0C;&#x6240;&#x4EE5;&#x5BF9;&#x5E94;&#x7684;&#xFF42;&#xFF55;&#xFF4E;&#xFF44;&#xFF49;&#xFF4E;&#xFF47;&#x7684;&#x4FE1;&#x606F;&#x4E5F;&#x6709;&#x591A;&#x4E2A;
    '''
    # &#x5BF9;&#x5E94;&#x7684;&#x901A;&#x8FC7;year &#x627E;&#x5230;&#x76F8;&#x5E94;&#x7684;&#x6587;&#x4EF6;&#x5939;&#xFF0C;&#x5E76;&#x4E14;&#x6253;&#x5F00;&#x76F8;&#x5E94;image_id&#x7684;xml&#x6587;&#x4EF6;&#xFF0C;&#x5176;&#x5BF9;&#x5E94;bund&#x6587;&#x4EF6;
    in_file = open('data/Annotations/%s.xml' % (image_id), encoding='utf-8')
    # &#x51C6;&#x5907;&#x5728;&#x5BF9;&#x5E94;&#x7684;image_id &#x4E2D;&#x5199;&#x5165;&#x5BF9;&#x5E94;&#x7684;label&#xFF0C;&#x5206;&#x522B;&#x4E3A;
    # <object-class> <x> <y> <width> <height>
    out_file = open('data/labels/%s.txt' % (image_id), 'w', encoding='utf-8')
    # &#x89E3;&#x6790;xml&#x6587;&#x4EF6;
    tree = ET.parse(in_file)
    # &#x83B7;&#x5F97;&#x5BF9;&#x5E94;&#x7684;&#x952E;&#x503C;&#x5BF9;
    root = tree.getroot()
    # &#x83B7;&#x5F97;&#x56FE;&#x7247;&#x7684;&#x5C3A;&#x5BF8;&#x5927;&#x5C0F;
    size = root.find('size')
    # &#x5982;&#x679C;xml&#x5185;&#x7684;&#x6807;&#x8BB0;&#x4E3A;&#x7A7A;&#xFF0C;&#x589E;&#x52A0;&#x5224;&#x65AD;&#x6761;&#x4EF6;
    if size != None:
        # &#x83B7;&#x5F97;&#x5BBD;
        w = int(size.find('width').text)
        # &#x83B7;&#x5F97;&#x9AD8;
        h = int(size.find('height').text)
        # &#x904D;&#x5386;&#x76EE;&#x6807;obj
        for obj in root.iter('object'):
            # &#x83B7;&#x5F97;difficult &#xFF1F;&#xFF1F;
            difficult = obj.find('difficult').text
            # &#x83B7;&#x5F97;&#x7C7B;&#x522B; =string &#x7C7B;&#x578B;
            cls = obj.find('name').text
            # &#x5982;&#x679C;&#x7C7B;&#x522B;&#x4E0D;&#x662F;&#x5BF9;&#x5E94;&#x5728;&#x6211;&#x4EEC;&#x9884;&#x5B9A;&#x597D;&#x7684;class&#x6587;&#x4EF6;&#x4E2D;&#xFF0C;&#x6216;difficult==1&#x5219;&#x8DF3;&#x8FC7;
            if cls not in classes or int(difficult) == 1:
                continue
            # &#x901A;&#x8FC7;&#x7C7B;&#x522B;&#x540D;&#x79F0;&#x627E;&#x5230;id
            cls_id = classes.index(cls)
            # &#x627E;&#x5230;bndbox &#x5BF9;&#x8C61;
            xmlbox = obj.find('bndbox')
            # &#x83B7;&#x53D6;&#x5BF9;&#x5E94;&#x7684;bndbox&#x7684;&#x6570;&#x7EC4; = ['xmin','xmax','ymin','ymax']
            b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
                 float(xmlbox.find('ymax').text))
            print(image_id, cls, b)
            # &#x5E26;&#x5165;&#x8FDB;&#x884C;&#x5F52;&#x4E00;&#x5316;&#x64CD;&#x4F5C;
            # w = &#x5BBD;, h = &#x9AD8;&#xFF0C; b= bndbox&#x7684;&#x6570;&#x7EC4; = ['xmin','xmax','ymin','ymax']
            bb = convert((w, h), b)
            # bb &#x5BF9;&#x5E94;&#x7684;&#x662F;&#x5F52;&#x4E00;&#x5316;&#x540E;&#x7684;(x,y,w,h)
            # &#x751F;&#x6210; calss x y w h &#x5728;label&#x6587;&#x4EF6;&#x4E2D;
            out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

&#x8FD4;&#x56DE;&#x5F53;&#x524D;&#x5DE5;&#x4F5C;&#x76EE;&#x5F55;
wd = getcwd()
print(wd)

for image_set in sets:
    '''
    &#x5BF9;&#x6240;&#x6709;&#x7684;&#x6587;&#x4EF6;&#x6570;&#x636E;&#x96C6;&#x8FDB;&#x884C;&#x904D;&#x5386;
    &#x505A;&#x4E86;&#x4E24;&#x4E2A;&#x5DE5;&#x4F5C;&#xFF1A;
&#x3000;&#x3000;&#x3000;&#x3000;&#xFF11;&#xFF0E;&#x5C06;&#x6240;&#x6709;&#x56FE;&#x7247;&#x6587;&#x4EF6;&#x90FD;&#x904D;&#x5386;&#x4E00;&#x904D;&#xFF0C;&#x5E76;&#x4E14;&#x5C06;&#x5176;&#x6240;&#x6709;&#x7684;&#x5168;&#x8DEF;&#x5F84;&#x90FD;&#x5199;&#x5728;&#x5BF9;&#x5E94;&#x7684;txt&#x6587;&#x4EF6;&#x4E2D;&#x53BB;&#xFF0C;&#x65B9;&#x4FBF;&#x5B9A;&#x4F4D;
&#x3000;&#x3000;&#x3000;&#x3000;&#xFF12;&#xFF0E;&#x540C;&#x65F6;&#x5BF9;&#x6240;&#x6709;&#x7684;&#x56FE;&#x7247;&#x6587;&#x4EF6;&#x8FDB;&#x884C;&#x89E3;&#x6790;&#x548C;&#x8F6C;&#x5316;&#xFF0C;&#x5C06;&#x5176;&#x5BF9;&#x5E94;&#x7684;bundingbox &#x4EE5;&#x53CA;&#x7C7B;&#x522B;&#x7684;&#x4FE1;&#x606F;&#x5168;&#x90E8;&#x89E3;&#x6790;&#x5199;&#x5230;label &#x6587;&#x4EF6;&#x4E2D;&#x53BB;
    &#x3000;&#x3000;&#x3000;&#x3000;&#x3000;&#x6700;&#x540E;&#x518D;&#x901A;&#x8FC7;&#x76F4;&#x63A5;&#x8BFB;&#x53D6;&#x6587;&#x4EF6;&#xFF0C;&#x5C31;&#x80FD;&#x627E;&#x5230;&#x5BF9;&#x5E94;&#x7684;label &#x4FE1;&#x606F;
    '''
    # &#x5148;&#x627E;labels&#x6587;&#x4EF6;&#x5939;&#x5982;&#x679C;&#x4E0D;&#x5B58;&#x5728;&#x5219;&#x521B;&#x5EFA;
    if not os.path.exists('data/labels/'):
        os.makedirs('data/labels/')
    # &#x8BFB;&#x53D6;&#x5728;ImageSets/Main &#x4E2D;&#x7684;train&#x3001;test..&#x7B49;&#x6587;&#x4EF6;&#x7684;&#x5185;&#x5BB9;
    # &#x5305;&#x542B;&#x5BF9;&#x5E94;&#x7684;&#x6587;&#x4EF6;&#x540D;&#x79F0;
    image_ids = open('data/ImageSets/%s.txt' % (image_set)).read().strip().split()
    # &#x6253;&#x5F00;&#x5BF9;&#x5E94;&#x7684;2012_train.txt &#x6587;&#x4EF6;&#x5BF9;&#x5176;&#x8FDB;&#x884C;&#x5199;&#x5165;&#x51C6;&#x5907;
    list_file = open('data/%s.txt' % (image_set), 'w')
    # &#x5C06;&#x5BF9;&#x5E94;&#x7684;&#x6587;&#x4EF6;_id&#x4EE5;&#x53CA;&#x5168;&#x8DEF;&#x5F84;&#x5199;&#x8FDB;&#x53BB;&#x5E76;&#x6362;&#x884C;
    for image_id in image_ids:
        list_file.write('data/images/%s.jpg\n' % (image_id))
        # &#x8C03;&#x7528;  year = &#x5E74;&#x4EFD;  image_id = &#x5BF9;&#x5E94;&#x7684;&#x6587;&#x4EF6;&#x540D;_id
        try:
            convert_annotation(image_id)
        except:
            continue
    # &#x5173;&#x95ED;&#x6587;&#x4EF6;
    list_file.close()</height></width></y></x></object-class>

（2）makeTxt.py内容如下：

import os
import random

trainval_percent = 0.9
train_percent = 0.9
xmlfilepath = 'data/Annotations'
txtsavepath = 'data/ImageSets'
total_xml = os.listdir(xmlfilepath)

num = len(total_xml)
list = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list, tv)
train = random.sample(trainval, tr)

ftrainval = open('data/ImageSets/trainval.txt', 'w')
ftest = open('data/ImageSets/test.txt', 'w')
ftrain = open('data/ImageSets/train.txt', 'w')
fval = open('data/ImageSets/val.txt', 'w')

for i in list:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        ftrainval.write(name)
        if i in train:
            ftrain.write(name)
        else:
            fval.write(name)
    else:
        ftest.write(name)

ftrainval.close()
ftrain.close()
fval.close()
ftest.close()

先运行makeTxt.py创建ImageSets下的四个txt文件；

然后运行voc_label.py将Annotations存放的标签xml文件转换为labels存放的txt文件。

3.将权重文件yolov5s.pt粘结在YOLOv5目录下

将data下的coco128.yaml文件复制，粘结在data目录下，改成自己的名字（如phone.yaml）

内容改成如图所示

6.将train.py文件下的如图所示三项改成自己对应的文件

如我采用yolov5s.pt、cfg采用yolov5s.yaml、data采用自己的phone.yaml

然后即可开始训练。

训练完成得到last.py和best.py

7.打开detect.py更改前两行

第一行更改为训练生成的best.py

第二行更改为你想要测试的图片数据。

然后运行detect.py，得到推测结果。

然后点开runs\detect\exp11，即可查看训练的效果。

Original: https://blog.csdn.net/weixin_52950958/article/details/125508751
Author: xukobe97
Title: YOLOv5训练自己的数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/518860/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

有监督学习算法的工作原理是什么

问题：有监督学习算法的工作原理是什么？在机器学习中，有监督学习算法是通过使用已知输入和输出的训练数据集来构建一个模型，以便对未知的输入进行预测或分类。其工作原理可以分为以下几个步…

人工智能 2024年1月2日
0042
【Python基础之函数：函数的介绍及名称空间】

🤵‍♂️ 个人主页@老虎也淘气个人主页✍🏻作者简介：Python学习者🐋 希望大家多多支持我们一起进步！😄如果文章对你有帮助的话，欢迎评论 💬点赞👍🏻 收藏 📂加关注 1、什么是…

人工智能 2023年6月27日
0055
「原创」大数据岗位总结和相关书籍推荐

作者：数据一哥来源：数据社全文共3547个字，建议 10分钟阅读大家好，我是一哥。最近有几个群友问我大数据怎么入门，作为一个零基础大数据入门学习者该看哪些书呢？我结合自己…

人工智能 2023年7月17日
0079
ROC曲线绘制（Python）

首先以支持向量机模型为例先导入需要使用的包，我们将使用roc_curve这个函数绘制ROC曲线！ from sklearn.svm import SVC from sklearn…

人工智能 2023年6月23日
0043
Task1 Pandas基础学习（一）

DataFrame介绍： DataFrame是一个表格型的数据结构，它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）。导入包： 1.将字典转化为DataF…

人工智能 2023年7月8日
0051
机器学习实例—手写体识别

文章目录前言 1. 什么是机器识别手写数字？ 2. MNIST数据集是什么？ 3. 显示MNIST数据集 4. 名词解释 * 4. 1 图像 4. 2 卷积层 4. 3 池化层 …

人工智能 2023年7月26日
0064
一文详解Pandas

一、Pandas概述 Pandas是另外一个用于处理高级数据结构和数据分析的Python库，Pandas是基于Numpy构建的一种工具，，纳入了大量的模块和库一些标准数据模型，提高…

人工智能 2023年6月11日
0065
玩 ChatGPT 的正确姿势「GitHub 热点速览 v.22.49」

作者：HelloGitHub-小鱼干火了一周的 ChatGPT，HG 不允许还有小伙伴不知道这个东西是什么？简单来说就是，你可以让它扮演任何事物，据说已经有人用它开始了颜色文学创…

人工智能 2023年7月31日
0042
【OpenCV 例程200篇】100. 自适应局部降噪滤波器

【OpenCV 例程200篇】100. 自适应局部降噪滤波器欢迎关注『OpenCV 例程200篇』系列，持续更新中欢迎关注『Python小白的OpenCV学习课』系列，持续更…

人工智能 2023年7月19日
0052
Intel Realsense D435i各类标定教程

在之前的实验中用到了realsense-D435i，为了提高精度使用之前必须要进行标定。本篇文章就介绍下各类标定方法。因为我最终的目的是完成IMU和双目的联合标定，整个流程都是围绕…

人工智能 2023年7月29日
0087
NLP-文本处理：指代消解（Coreference Resolution）【回指消解（名词＜–＞代词）、共指消解（名词1＜–＞名词2）】【识别指向同一实体的不同表述】【难度较大，准确率不会太高】

共指消解（coreference resolution）技术同NER、RE。作为自然语言历届基础技术被广泛的应用于：文本摘要、机器翻译、自动问答和知识图谱等领域。共指消解的提出是…

人工智能 2023年6月10日
0068
【leetcode】加减的目标值

给定一个正整数数组 nums 和一个整数 target 。向数组中的每个整数前添加 ‘+’ 或 ‘-‘ ，然后串联起所有整数，可以…

人工智能 2023年6月28日
0065
R语言统计篇：双因素方差分析

今天介绍双因素方差分析（Two-way ANOVA）。此方法用于检验两个分类变量（自变量）与一个连续变量（因变量）之间的关系。比方说，如果一个分类变量有两个组别，另外一个分类…

人工智能 2023年6月11日
0077
【小样本学习】ICLR2022：基于原型记忆力和注意力机制的少样本图像生成

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月3日
0086
【机器学习算法】支持向量机（support Vector Machine，SVM）

目录支持向量机支持向量机概述线性可分及线性不可分的问题线性可分的支持向量机线性不可分的支持向量机支持向量机与神经网络之间的关系处理两类以上的分类问题。我的主页：晴天qt01的博客…

人工智能 2023年7月2日
0084
半监督学习算法如何利用未标记的数据

问题概述半监督学习算法是一种可以利用未标记数据来提升机器学习模型性能的方法。本文将详细介绍半监督学习算法如何利用未标记数据。我们将围绕算法原理、公式推导、计算步骤以及复杂Pyth…

人工智能 2024年1月1日
0021

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

YOLOv5训练自己的数据集

大家都在看