VOC数据集转YOLO数据集

2023年7月22日下午1:49 • 人工智能 • 阅读 66

文章目录

*
– 制作自己的VOC数据集
– 生成数据集名称文件
– .xml文件转.txt文件
– 完善自己的YOLO数据集

制作自己的VOC数据集

首先，把VOC数据集里的图片和.xml文件按照如下文件夹格式存放

我的数据集各级文件夹如图所示：

; 生成数据集名称文件

train.txt里面存的是所有数据集图片的名称（注意， 是不含后缀名的名称！！！）

如图，我的images文件夹里有这样几张.jpg文件，在这个images文件夹里建一个.txt文件，内容如图所示：

 DIR  *.*/B>train.txt

修改该.txt文件后缀为.bat，如图：

双击这个.bat文件，会看到生成了一个train.txt文件

打开train.txt，可以看到里面的内容是images这个文件夹里所有文件的名称。
VOC数据集转YOLO数据集

删除list.bat和train.txt这两行，只留下图片的名称
注意：由于最终 train.txt里只能保留图片名称，不含后缀，所以需要把train.txt文件里每一行的”.jpg”删掉，可以手动删除，但如果数据集过大，可使用如下python脚本删除：

import os
filename = r"train.txt"
new_filename = r"train1.txt"
with open(filename,encoding="utf-8") as f1, open(new_filename,"w",encoding="utf-8") as f2:
    for line in f1:
        new_line = line[:-5]
        f2.write(new_line)
        f2.write('\n')
f1.close()
f2.close()

运行效果如图所示：

打开新生成的train1.txt可以看到，后缀名都被删掉了
VOC数据集转YOLO数据集

这个时候把train1.txt里的内容复制到\data\ImageSets\Main\train.txt中去。

.xml文件转.txt文件

.xml转.txt文件yolo模型官方有提供转换代码，使用方法下文所示：

创建一个.py文件，内容如下：


import xml.etree.ElementTree as ET
import os
from os import getcwd

sets = ['train', 'val', 'test']
classes = ['red', 'yellow','green', 'turn_left',  'turn_right', 'stop']
abs_path = os.getcwd()
print(abs_path)

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return x, y, w, h

def convert_annotation(image_id):
    in_file = open('C:/Users/Lenovo/Desktop/data/Annotations/%s.xml' % (image_id),encoding='utf-8')
    out_file = open('C:/Users/Lenovo/Desktop/data/labels/%s.txt' % (image_id), 'w',encoding='utf-8')
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):

        difficult = obj.find('difficult').text
        cls = obj.find('name').text
        if cls not in classes or int(difficult) == 1:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        b1, b2, b3, b4 = b

        if b2 > w:
            b2 = w
        if b4 > h:
            b4 = h
        b = (b1, b2, b3, b4)
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

wd = getcwd()
for image_set in sets:
    if not os.path.exists('C:/Users/Lenovo/Desktop/data/labels/'):
        os.makedirs('C:/Users/Lenovo/Desktop/data/labels/')
    image_ids = open('C:/Users/Lenovo/Desktop/data/ImageSets/Main/%s.txt' % (image_set)).read().strip().split()
    list_file = open('%s.txt' % (image_set), mode='w', encoding='utf-8')
    for image_id in image_ids:
        list_file.write('C:/Users/Lenovo/Desktop/data/images/%s.jpg\n' % (image_id))
        convert_annotation(image_id)
    list_file.close()

转换代码使用注意事项：

把第六行改为’train’, ‘val’, ‘test’
第七行classes里的内容改为自己数据集里的类别名称
注意各个地址的写法，一定要使用反斜杠

之后运行这段脚本，会发现data里面生成了一个新的lables文件夹，这样便是数据转化成功了

完善自己的YOLO数据集

最后，将labels这个文件夹复制进yolo数据集里即可

Original: https://blog.csdn.net/qq_52109814/article/details/124864143
Author: L-M-Y
Title: VOC数据集转YOLO数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/709095/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像处理-图像滤波

文章目录 1、图像滤波 2、各滤波特点 * 2.1 均值滤波 2.2 高斯滤波 2.3中值滤波 3、案例分析 * 3.1 均值滤波 – 3.1.1 代码 3.1.2 b…

人工智能 2023年6月20日
00144
人工智能-10种机器学习常见算法

机器学习是目前行业的一个创新且重要的领域。今天，给大家介绍机器学习中的10种常见的算法，希望可以帮助大家适应机器学习的世界。 1、线性回归线性回归(Linear Regressi…

人工智能 2023年7月26日
0067
基于opencv的MTF算法开发

使用ctf-chart需要注意的一点是线对宽度需要结合摄像头测试的nyquist频率，视场，增距镜来确定，不然起不到有效管控模组解像力的要求。这个我有这套系统的计算方法，适合8M以…

人工智能 2023年7月19日
0063
MATLAB算法实战应用案例精讲-【回归算法】逐步式回归（Stepwise Regression）（附MATLAB、Java、Python和R语言代码）

回归分析是一种预测建模技术的方法，研究因变量（目标）和自变量（预测器）之前的关系。这一技术被用在预测、时间序列模型和寻找变量之间因果关系。例如研究驾驶员鲁莽驾驶与交通事故发生频率之…

人工智能 2023年6月18日
0087
从零开始学数据分析之——《微积分》第五章定积分

5.1 定积分的概念与性质 5.1.1 定积分问题举例 1.曲边梯形的面积 2.变速直线运动的路程 5.1.2 定积分的概念定积分的定义设函数f(x)在区间[a,b]上有定义，…

人工智能 2023年7月16日
0055
阿里云天池大赛赛题（机器学习）——工业蒸汽量预测（完整代码）

目录赛题背景全代码 * 导入包导入数据合并数据删除相关特征数据最大最小归一化画图：探查特征和标签相关信息对特征进行Box-Cox变换，使其满足正态性 –…

人工智能 2023年7月5日
00132
中文生成模型T5-Pegasus详解与实践

我们在前一篇文章《生成式摘要的四篇经典论文》中介绍了Seq2seq在生成式研究中的早期应用，以及针对摘要任务本质的讨论。如今，以T5为首的预训练模型在生成任务上表现出超出前人的效…

人工智能 2023年7月21日
00220
指纹图谱相似度评价软件_知识图谱总结

引自HTLiu：推荐系统结合知识图谱简单总结推荐系统简介一句话来介绍的话，就是通过分析历史数据，来给用户推荐可能会喜欢/购买的商品，这里面的核心就是用户 (User) 和…

人工智能 2023年6月1日
0061
YOLO Air：小白YOLO系列Trick改进论文推荐 | 改进组合上千种搭配，包括Backbone,Neck,Head,注意力机制,适用于YOLOv5、YOLOv7、YOLOX等算法

🔥🔥🔥YOLOAir开源算法库！！！ 💡统一使用 YOLOv5、YOLOv7 代码框架，结合不同模块来构建不同的YOLO目标检测模型。 🌟本项目包含大量的改进方式,降低改进难度,…

人工智能 2023年5月26日
0074
PIL.image保存图片

1.原图 1.首先PIL保存图片的时候,图片类型一定要是ndarray类型,不能是tensor类型,否则报错 img=cv2.imread("./epoch034_ite…

人工智能 2023年7月4日
0056
基于K-means的图像分割（python代码详解）

img = plt.imread(‘path’) 7.1.2 三维数组(图片高，图片宽，3) → 二维数组(图片宽*高，3) img =…

人工智能 2023年7月4日
0060
【数据可视化应用】数据统计分析的显著性标注（附Python和R语言代码）

Python版本 Python-Seaborn 自定义函数绘制我们可以通过自定义绘图函数的方式在统计图表中添加显著性标注，这里我们直接使用Seaborn自带的iris数据集进行绘…

人工智能 2023年7月16日
0056
Pixologic ZBrush Mac/Win(三维数字雕刻软件)中文

Original: https://www.cnblogs.com/aurora-123/p/16741435.htmlAuthor: 佛系女孩Title: Pixologic Z…

人工智能 2023年6月3日
0071
ModuleNotFoundError: No module named ‘transformers‘，已经安装了transformers库

明明已经安装了transformers库了，运行代码时却说找不到。先说明我的环境。系统：windowsIDE：pycharm框架：PyTorch包管理：Anaconda 我用的w…

人工智能 2023年7月5日
0075
javaWeb期末作业——蛋糕订购系统

目录标题视频展示 1 实验的目的及要求 2 需求分析 * – + * – 2.1 问题陈述 – 2.2 功能需求分析 3 总体设计 * &#8…

人工智能 2023年7月29日
0070
cαr怎么发音_法语学习法语入门史上最全法语发音规则（值得收藏）

法语有35个音素(phonème)，其中有15个元音(voyelle),17个辅音(consonne)和3个半元音(semi-voyelle)，也称半辅音(semi-consonn…

人工智能 2023年5月27日
00106

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30