YOLOv5系列 1、制作自己的数据集

2023年6月15日下午2:57 • 人工智能 • 阅读 90

YOLOv5系列 1、制作自己的数据集
YOLOv5系列 2、使用yolov5识别自己的数据

文章目录

前言
一、下载Labelme
二、Labelme使用步骤
*
1.打开Labelme
2.Labelme标记数据集
3.保存为json格式
三、json格式转换为txt格式
四、建立自己的Yolov5数据集

前言

本文所使用的Yolov5为6.1版本，所用为GPU版（亲测CPU也一样能跑，只是速度会慢很多），使用的环境是torch1.7.1+cuda10.1。

一、下载Labelme

Labelme的安装很简单，如果想直接安装就直接在命令行中：

pip install labelme

如果是想把labelme安装在Anaconda的虚拟环境虚拟环境中，则需要先进入虚拟环境中，再安装：

activate 自己的想安装的环境名称
pip install labelme

如果想用Anaconda单独给Labelme装个虚拟环境则：

conda create -n labelme python=3.6
activate labelme
pip install labelme

二、Labelme使用步骤

1.打开Labelme

根据第一步中安装的位置，使用命令行在相应的位置中直接输入labelme，就可打开：

labelme

因为我是直接安装的，所以没有进虚拟环境。打开后就会自动跳出下面这个界面：

上面标注的是我们标记主要使用的功能，先使用Open dir打开我们图像数据所在文件夹：

2.Labelme标记数据集

这边是从kaggle上下载的一个检测口罩的数据集，然后点击Create Polygons，因为是使用Yolov5做的，所以在图像上点击右键，选择create Rectangle，再将口罩框起来。

然后点击ok，继续标记下一个口罩，全部标记好后，点击下一张或者点击保存：

; 3.保存为json格式

直接进行保存为.json格式即可（这个保存的名字名字是和照片的名字一样的），依照这样一直标记完。

三、json格式转换为txt格式

因为yolov5需要的是照片和txt格式，所以我们得到的json文件不能直接使用，需要先将json转换为txt格式，下面的代码就是将 json转为txt：

import json
import os

name2id = {'Mask': 0,}

def convert(img_size, box):
    dw = 1./(img_size[0])
    dh = 1./(img_size[1])
    x = (box[0] + box[2])/2.0 - 1
    y = (box[1] + box[3])/2.0 - 1
    w = box[2] - box[0]
    h = box[3] - box[1]
    x = x*dw
    w = w*dw
    y = y*dh
    h = h*dh
    return (x,y,w,h)

def decode_json(json_floder_path,json_name):

    txt_name = 'E:\\BaiduNetdiskDownload\\PyTorch-YOLOv3\\data\\custom\\labels\\' + json_name[0:-5] + '.txt'
    txt_file = open(txt_name, 'w')

    json_path = os.path.join(json_floder_path, json_name)
    data = json.load(open(json_path, 'r', encoding='gb2312'))

    img_w = data['imageWidth']
    img_h = data['imageHeight']

    for i in data['shapes']:

        label_name = i['label']
        if (i['shape_type'] == 'rectangle'):

            x1 = int(i['points'][0][0])
            y1 = int(i['points'][0][1])
            x2 = int(i['points'][1][0])
            y2 = int(i['points'][1][1])

            bb = (x1,y1,x2,y2)
            bbox = convert((img_w,img_h),bb)
            txt_file.write(str(name2id[label_name]) + " " + " ".join([str(a) for a in bbox]) + '\n')

if __name__ == "__main__":

    json_floder_path = 'E:\\BaiduNetdiskDownload\\PyTorch-YOLOv3\\data\\custom\\json\\'
    json_names = os.listdir(json_floder_path)
    for json_name in json_names:
        decode_json(json_floder_path,json_name)

这边我们就已经得到了yolov5所需要的txt格式的标签文件。

四、建立自己的Yolov5数据集

我这边建立的数据集文件夹的位置如下：

--MaskDataSet
    --train
        --images
        --labels
    --test
        --images
        --labels
    --valid
        --images
        --labels
    --data.yaml
--yolov5源码位置

其中images放入图片，labels则放入相应的txt标签文件；data.yaml文件内容如下所示：

train: ../MaskDataSet/train/images
test: ../MaskDataSet/test/images
val: ../MaskDataSet/valid/images

nc: 1
names: ['Mask',]

最后，数据集建立成功！下一步，可以开始训练我们标记的数据集啦~

Original: https://blog.csdn.net/fjlaym/article/details/123992962
Author: 冯璆鸣
Title: YOLOv5系列 1、制作自己的数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/615017/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

整理了27个Python人工智能库，建议收藏~

超级无敌干货，第一时间送达！！！为了大家能够对人工智能常用的 Python 库有一个初步的了解，以选择能够满足自己需求的库进行学习，对目前较为常见的人工智能库进行简要全面的介绍。…

人工智能 2023年7月16日
0063
水下图像处理评价手段（python-opencv代码可运行）

图像评价方法：图像评价方法分为主观评价和客观评价非参考指标来评估水下图像：图像评价方法分为主观评价和客观评价主观评价 FE：由于不正确的色彩校正算法，具有…

人工智能 2023年6月18日
0079
感知机实现与、或、与非门和异或门

机器学习-感知机【perceptron】 * – what is 感知机 – 单层感知机运用实例 – 多层感知机 what is 感知机感知机…

人工智能 2023年6月15日
0076
Non-Local Neural Networks

一.摘要卷积操作和循环神经元操作都是建立了一个处理一个局部范围信息的一个过程.本文呈现了一种非局部(non-local)操作,可以作为用于捕获长范围依赖的一类模块.本文提出的no…

人工智能 2023年7月14日
00106
Python之Pandas isnull检查是否有缺失值

1.df.isnull() 元素级别的判断，把对应的所有元素的位置都列出来，元素为空或者NA就显示True，否则就是False train.isnull() 2,df.isnull…

人工智能 2023年7月8日
0087
【ICPR 2021】遥感图中的密集小目标检测：Tiny Object Detection in Aerial Images

SSPNet: Scale Selection Pyramid Network for Tiny Person Detection from UAV Images 简介：数据集：…

人工智能 2023年7月28日
0053
Text to image论文精读SSA-GAN：基于语义空间感知的文本图像生成 Text to Image Generation with Semantic-Spatial Aware GAN

目录一、原文摘要二、为什么提出SSA-GAN 三、SSA-GAN * 3.1、文本编码器 3.2、SSACN 块 – 3.2.1、上采样块 3.2.2、掩码预测器 …

人工智能 2023年7月28日
0073
Boss直聘招聘数据分析岗位小分析

嗨喽! 大家好，我是”流水不争先，争得滔滔不绝”的翀，18双非本科生一枚，正在努力！欢迎大家来交流学习，一起学习数据分析，希望我们一起好好学习，天天向上，目…

人工智能 2023年6月11日
00165
回归算法–K近邻算法

文章目录前言一、K近邻算法的数学基础？二、分类算法-k近邻算法(KNN) * 1.定义 2.计算公式 3. K近邻API 三、代码实例化演示 * 1.==案例：== 2. 数…

人工智能 2023年6月17日
0091
python中聚类和分类的区别_python聚类后如何找到分类后的数据

获取聚类结果中每一类的数据,该数据类型是DataFrame 思路：获取clf_KMeans的标签，我这里是聚三类，标签就是0，1，2 将Label转成Series类型，再筛选出指定…

人工智能 2023年6月2日
0080
【华为OD机试真题23 JAVA】单词倒序

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。 Original: https://blo…

人工智能 2023年7月30日
0053
机器学习算法——贝叶斯分类器4（半朴素贝叶斯分类器）

为了降低贝叶斯公式中估计后验概率的困难，朴素贝叶斯分类器采用了属性条件独立性假设，但在现实任务中这个假设往往很难成立。于是，人们尝试对属性条件独立性假设进行一定程度的放松，由此产生…

人工智能 2023年7月2日
0092
图像检测：未有深度学习之前

图像分割所谓图像分割指的是根据灰度，颜色，纹理和形状等特征把图像划分成若干互不交迭的区域，并使这些特征在同一区域内呈现出相似性,而在不同区域间呈现出明显的差异性。经典的数字图像分…

人工智能 2023年6月20日
00110
语音信号特性分析

语音信号时域和频域分析本次实验通过语音信号在时域的短时平稳性和短时过零率以及在频域的傅里叶分析，对不同的语音信号——清音【s】、浊音【wo】、爆破音【b】——进行了语音信号的时域…

人工智能 2023年5月25日
00105
目标检测单阶段、双阶段检测框部分学习总结

一、单阶段目标检测（以yolov5为例） 1、anchor的引入及产生 2、anchor与gt的匹配机制 3、后处理NMS机制二、双阶段目标检测（以faster rcnn为例） …

人工智能 2023年6月25日
0065
感知损失（perceptual loss）详解

本文来自收费专栏：感知损失（perceptual loss）详解_南淮北安的博客-CSDN博客_感知损失目录一.感知损失二、Loss_feature 三、Loss_style…

人工智能 2023年7月13日
00101

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

YOLOv5系列 1、制作自己的数据集

文章目录

1.打开Labelme

2.Labelme标记数据集

; 3.保存为json格式

大家都在看