【最全教程】VOC格式转YOLO格式数据

2023年6月13日上午2:22 • 人工智能 • 阅读 85

在做目标检测时候，都会通过一些方法获得大量的数据集，或是网上下载，或是自己用软件一个一个的打标签。

不会打标签的可以看下这个文章

Win10下安装LabelImg及使用技巧–全网最快最简单Win10下安装LabelImg及使用–全网最快最简单【最全教程】VOC格式转YOLO格式数据 https://blog.csdn.net/Thebest_jack/article/details/124260693?spm=1001.2014.3001.5501 ; 综合来说，网上的数据集绝大部分也是VOC数据文件

这是为了标签数据的最大化。在日常生活中，我们也通常会打VOC格式的标签（xml文件），因为它所包含的数据最多。例如下图：

那么接下来，就跟我一起来做这些那个伟大的工作吧！

代码已经放在了GitHub上，可以去这个【GitHub网址】下载，使用办法看ReadMe.md~

接下来说下大体怎么使用

在所有事情之前，你需要将XML数据的标签和图片放置到对应文件下

首先，需要给XML文件按照一定的比例分成train、val、test三个数据集。trainval_percent和train_percent 代表trainval和train的占比率，trainval_percent表示的是train+val之和。若不需要test集则改为1。train_percent 代表拿来训练的比例。这里我设置了trainval_percent = 0.9，
train_percent = 0.7。
修改的话只需要修改这三部分的占比率。运行【images_tag.py】，代码如下：

&#x8BE5;&#x811A;&#x672C;&#x6587;&#x4EF6;&#x9700;&#x8981;&#x4FEE;&#x6539;&#x7B2C;11-12&#x884C;&#xFF0C;&#x8BBE;&#x7F6E;train&#x3001;val&#x3001;test&#x7684;&#x5207;&#x5206;&#x7684;&#x6BD4;&#x7387;
import os
import random
import argparse

parser = argparse.ArgumentParser()
parser.add_argument('--xml_path', default='F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/Annotations', type=str, help='input xml label path')
parser.add_argument('--txt_path', default='F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/Imagesets', type=str, help='output txt label path')
opt = parser.parse_args()

trainval_percent = 0.9
train_percent = 0.7  #&#x8FD9;&#x91CC;&#x7684;train_percent &#x662F;&#x6307;&#x5360;trainval_percent&#x4E2D;&#x7684;
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
    os.makedirs(txtsavepath)

num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)

file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')

for i in list_index:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        file_trainval.write(name)
        if i in train:
            file_train.write(name)
        else:
            file_val.write(name)
    else:
        file_test.write(name)

file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

运行成功之后，会出现这个效果：红圈的就是生成的分类txt

然后，将xml格式标签转换为txt格式标签。运行【voc_to_yolo.py】，代码如下：

#&#x8BE5;&#x811A;&#x672C;&#x6587;&#x4EF6;&#x9700;&#x8981;&#x4FEE;&#x6539;&#x7B2C;10&#x884C;&#xFF08;classes&#xFF09;&#x5373;&#x53EF;
-*- coding: utf-8 -*-
import xml.etree.ElementTree as ET
from tqdm import tqdm
import os
from os import getcwd

sets = ['train', 'test','val']
#&#x8FD9;&#x91CC;&#x4F7F;&#x7528;&#x8981;&#x6539;&#x6210;&#x81EA;&#x5DF1;&#x7684;&#x7C7B;&#x522B;
classes = ['glass', 'metal', 'paper','plastic']

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    x = round(x,6)
    w = round(w,6)
    y = round(y,6)
    h = round(h,6)
    return x, y, w, h

#&#x540E;&#x9762;&#x53EA;&#x7528;&#x4FEE;&#x6539;&#x5404;&#x4E2A;&#x6587;&#x4EF6;&#x5939;&#x7684;&#x4F4D;&#x7F6E;
def convert_annotation(image_id):
     #try:
        in_file = open('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/Annotations/%s.xml' % (image_id), encoding='utf-8')
        out_file = open('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/labels/%s.txt' % (image_id), 'w', encoding='utf-8')
        tree = ET.parse(in_file)
        root = tree.getroot()
        size = root.find('size')
        w = int(size.find('width').text)
        h = int(size.find('height').text)
        for obj in root.iter('object'):
            difficult = obj.find('difficult').text
            cls = obj.find('name').text
            if cls not in classes or int(difficult) == 1:
                continue
            cls_id = classes.index(cls)
            xmlbox = obj.find('bndbox')
            b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
                 float(xmlbox.find('ymax').text))
            b1, b2, b3, b4 = b
            # &#x6807;&#x6CE8;&#x8D8A;&#x754C;&#x4FEE;&#x6B63;
            if b2 > w:
                b2 = w
            if b4 > h:
                b4 = h
            b = (b1, b2, b3, b4)
            bb = convert((w, h), b)
            out_file.write(str(cls_id) + " " +
                           " ".join([str(a) for a in bb]) + '\n')
     #except Exception as e:
         #print(e, image_id)

#&#x8FD9;&#x4E00;&#x6B65;&#x751F;&#x6210;&#x7684;txt&#x6587;&#x4EF6;&#x5199;&#x5728;data.yaml&#x6587;&#x4EF6;&#x91CC;
wd = getcwd()
for image_set in sets:
    if not os.path.exists('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/labels/'):
        os.makedirs('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/labels/')
    image_ids = open('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/Imagesets/%s.txt' %
                     (image_set)).read().strip().split()
    list_file = open('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/%s.txt' % (image_set), 'w')
    for image_id in tqdm(image_ids):
        list_file.write('F:/Pycharm_Projects/Data_Trans/VOC_To_YOLO/JPEGImages/%s.jpg\n' % (image_id))
        convert_annotation(image_id)
    list_file.close()

是不是该很简单？不会的留言评论加关注吧~~~

Original: https://blog.csdn.net/Thebest_jack/article/details/125637099
Author: 蓝胖胖▸
Title: 【最全教程】VOC格式转YOLO格式数据

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/606094/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【python基础】reverse和reversed函数及使用

一、reverse reverse()是python中列表的一个内置方法(在字典、字符串和元组中没有这个内置方法)，用于列表中数据的反转例子： lista = [1, 2, 3,…

人工智能 2023年7月29日
0060
【笔记】文献阅读[YOLOV2]-YOLO9000: Better, Faster, Stronger

YOLOv2:YOLO9000: Better, Faster, Stronger 引言 1 介绍 2 更准确 3 更快 4 类别更多 5 总结引言论文精度可以看B站大佬的视频…

人工智能 2023年7月12日
0073
c# 浅拷贝vs深拷贝

浅拷贝（Shallow Copy）定义创建一个新对象，然后将当前对象的值类型字段复制到新对象中。但是当数据是引用类型时，复制唯一的引用而不是引用的对象本身。因此 origi…

人工智能 2023年6月29日
00116
NLP-预训练模型-GPT系列：GPT-1(2018-06)、GPT-2(2019-02)、GPT-3(2020-05)、InstuctGPT(2022-01)、chatGPT(2022-11)

GPT1：Imporoving Language Understanding By Generative Pre-training GPT2：Lanuage Models Are …

人工智能 2023年7月31日
0061
图像质量评价论文阅读2022.8

1.Image Quality Assessment with Gradient Siamese Network Source: CVPR2022 Link: https://ar…

人工智能 2023年6月21日
0061
基于聚类算法的城市餐饮数据分析与店铺选址

温馨提示：文末有 CSDN 平台官方提供的学长 Wechat / QQ 名片 :) 项目简介餐饮业生意好坏的影响因素通常有很多，包括店铺菜系、口味、服务态度、周边环境、人口密度、…

人工智能 2023年7月15日
0082
【科研分享】如何切换GPU以及如何在Tensorflow实验中节约GPU资源

大家跑深度学习进行科研的时候，单机的算力往往无法支持我们进行例如图神经网络、强化学习网络等复杂模型的训练任务。所以常常需要使用服务器的GPU来训练模型，但是多人共用的服务器该如何避…

人工智能 2023年5月25日
0088
超像素学习笔记（1）——概念及判别条件

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、超像素的概念二、超像素判别条件：一般参考三个指标 * 1.Undersegmentation…

人工智能 2023年6月17日
0097
Python opencv之实现简单的图像处理

大家好，本文将会进行简单地介绍如何用 _开源且强大的第三方opencv库_来实现对图片进行分割处理。所需要安装的库有：pip install opencv-pythonpip in…

人工智能 2023年6月18日
0068
用st-gcn训练自己的数据集

使用自己的数据集训练st-gcn的流程 ; 1.数据集数据集要求将相同类别的视频放到同一文件夹 2.脚本运行demo_old 将文件夹下所有视频转为json格式 import o…

人工智能 2023年5月26日
0074
基于LSTM的ECG分类用于个人可穿戴设备的连续监测

LSTM-Based ECG Classification for Continuous Monitoring on Personal Wearable Devices原文地址：h…

人工智能 2023年7月13日
0053
Windows平台下，YOLOX目标检测环境部署教程

1、克隆YOLOX源码可转到gitee仓库再克隆到本地 2、安装requirements依赖文件注释requirements.txt文件中的torch>=1.7，使用#号…

人工智能 2023年7月9日
0052
OpenCV-Python实战（16）——人脸追踪详解

OpenCV-Python实战（16）——人脸追踪详解 * – 0. 前言 – 1. 人脸追踪技术简介 – 2. 使用基于 dlib DCF 的…

人工智能 2023年5月26日
0057
机器学习中的数学——常用概率分布（十一）：狄利克雷分布（Dirichlet分布）

分类目录：《机器学习中的数学》总目录相关文章：· 常用概率分布（一）：伯努利分布（Bernoulli分布）· 常用概率分布（二）：范畴分布（Multinoulli分布）· 常用概率…

人工智能 2023年6月16日
0079
AI 第五阶段深度学习基于TensorFlow的CNN框架搭建

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月26日
0063
OpenCV-Python实战（14）——人脸检测详解（仅需6行代码学会4种人脸检测方法）

OpenCV-Python实战（14）——人脸检测详解（仅需6行代码学会4种人脸检测方法） * – 0. 前言 – 1. 人脸处理简介 – 2….

人工智能 2023年7月26日
0047

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【最全教程】VOC格式转YOLO格式数据

大家都在看