目标检测标注文件yolov5(txt)格式转coco(json)格式详解及代码实现

2023年6月16日下午1:06 • 人工智能 • 阅读 639

目标检测标注文件yolov5(txt)格式转coco(json)格式详解及代码实现

Reference：https://blog.csdn.net/qq_39686950/article/details/119153685

前言
正好自己做目标检测任务更换模型需要使用不同格式的标注文件，所以在网上找了半天类似博文，发现大多都只有代码或者解释不全，对新手不够友好，我在转换的过程中就debug了半天才转换成功，所以写下这篇博文以求尽可能的全面的解释转换过程，让其他同学少走弯路。
1.yolo v5格式（txt）
yolo v5的标注文件格式比较简单，如下图所示：

目标检测标注文件yolov5(txt)格式转coco(json)格式详解及代码实现

每一张图片对应一个.txt文件，每一行表示该图片的一个标注框，该图片有多少标注框就有多少行数据，每一行有五列，分别表示：类别代号、标注框横向的相对中心坐标x_center、标注框纵向的相对中心坐标y_center、标注框相对宽度w、标注框相对高度h。注意x_center、y_center、w、h为真实像素值除以图片的高和宽之后的值。
2.coco格式（json）
本文所描述的coco格式为标准coco数据集里的object instances格式，coco的坐标信息为(xmin,ymin,w,h)，(xmin,ymin)表示标注框的左上角坐标，这四个值都是绝对值，coco格式的基本信息描述如下：

{
    "info": info,
    "licenses": [license],
    "images": [image],
    "annotations": [annotation],
     "categories": [category]
}

和yolo v5标注文件不同的是，coco标注文件的格式为.json文件，且所有图片的标注信息在一个.json文件里，该json文件由上面描述的字典组成，该字典有五个key，下面将描述每个key对应value的详细信息：

info{
    "year": int,
    "version": str,
    "description": str,
    "contributor": str,
    "url": str,
    "date_created": datetime,
}
license{
    "id": int,
    "name": str,
    "url": str,
}
image{
    "id": int,
    "width": int,
    "height": int,
    "file_name": str,
    "license": int,
    "flickr_url": str,
    "coco_url": str,
    "date_captured": datetime,
}
annotation{
    "id": int,
    "image_id": int,
    "category_id": int,
    "segmentation": RLE or [polygon],
    "area": float,
    "bbox": [x,y,width,height],
    "iscrowd": 0 or 1,
}
category{
    "id": int,
    "name": str,
    "supercategory": str,
}

上述就是coco数据集的详细解析。
二、代码
这一部分是重点，我将尽可能全面讲解需要更改的地方
由第一节分析可知，yolo v5格式只有图片名称、类别、bounding box坐标信息，而coco格式的信息更丰富，而开源代码基本也只关注yolo v5格式里所提供的信息，因此我们不必过于纠结coco格式的多余信息。
详细代码及注释信息如下：

import os
import json
import cv2
import random
import time
from PIL import Image

coco_format_save_path='D:\\yolov5\\CCTSDB-2021\\train\\'
yolo_format_classes_path='D:\\yolov5\\CCTSDB-2021\\names.txt'
yolo_format_annotation_path='D:\\yolov5\\CCTSDB-2021\\labels\\train\\'
img_pathDir='D:\\yolov5\\CCTSDB-2021\\images\\train\\'

with open(yolo_format_classes_path,'r') as fr:
    lines1=fr.readlines()

categories=[]
for j,label in enumerate(lines1):
    label=label.strip()
    categories.append({'id':j+1,'name':label,'supercategory':'None'})

write_json_context=dict()
write_json_context['info']= {'description': '', 'url': '', 'version': '', 'year': 2022, 'contributor': '纯粹ss', 'date_created': '2022-07-8'}
write_json_context['licenses']=[{'id':1,'name':None,'url':None}]
write_json_context['categories']=categories
write_json_context['images']=[]
write_json_context['annotations']=[]

imageFileList=os.listdir(img_pathDir)
for i,imageFile in enumerate(imageFileList):
    imagePath = os.path.join(img_pathDir,imageFile)
    image = Image.open(imagePath)
    W, H = image.size

    img_context={}

    img_context['file_name']=imageFile
    img_context['height']=H
    img_context['width']=W
    img_context['date_captured']='2022-07-8'
    img_context['id']=i
    img_context['license']=1
    img_context['color_url']=''
    img_context['flickr_url']=''
    write_json_context['images'].append(img_context)

    txtFile=imageFile[:5]+'.txt'
    with open(os.path.join(yolo_format_annotation_path,txtFile),'r') as fr:
        lines=fr.readlines()
    for j,line in enumerate(lines):

        bbox_dict = {}

        class_id,x,y,w,h=line.strip().split(' ')
        class_id,x, y, w, h = int(class_id), float(x), float(y), float(w), float(h)

        xmin=(x-w/2)*W
        ymin=(y-h/2)*H
        xmax=(x+w/2)*W
        ymax=(y+h/2)*H
        w=w*W
        h=h*H

        bbox_dict['id']=i*10000+j
        bbox_dict['image_id']=i
        bbox_dict['category_id']=class_id+1
        bbox_dict['iscrowd']=0
        height,width=abs(ymax-ymin),abs(xmax-xmin)
        bbox_dict['area']=height*width
        bbox_dict['bbox']=[xmin,ymin,w,h]
        bbox_dict['segmentation']=[[xmin,ymin,xmax,ymin,xmax,ymax,xmin,ymax]]
        write_json_context['annotations'].append(bbox_dict)

name = os.path.join(coco_format_save_path,"train"+ '.json')
with open(name,'w') as fw:
    json.dump(write_json_context,fw,indent=2)

重点
重点
重点
代码中你可能存在疑问的地方
①

coco_format_save_path='D:\\yolov5\\CCTSDB-2021\\train\\'
yolo_format_classes_path='D:\\yolov5\\CCTSDB-2021\\names.txt'
yolo_format_annotation_path='D:\\yolov5\\CCTSDB-2021\\labels\\train\\'
img_pathDir='D:\\yolov5\CCTSDB-2021\\images\\train\\'

1#coco_format_save_path 这里是你自己设置的一个路径，像我在存放yolo数据集和标签的路径下新建了两个文件夹train和val来存放新生成的coco（json）格式文件，因为我的images和labels文件夹下有两个文件分别是存放训练集和验证集的图片，第一轮运行代码的时候coco_format_save_path，yolo_format_classes_path，img_pathDir路径最后都写train，这样生成的训练集的json文件就存放在新建文件夹train里，第二轮运行之前路径最后都改成val，这样生成的验证集的json文件就存放在新建文件夹val里了。

2#yolo_format_classes_path这里用txt文件写就行， 这里是要你自己新建一个txt写的，因为之前没有，形式要写成一行一类，不知道的可以看着图片与对应的labels对照一下，要按照顺序写。我下面放个图看起来就会明白了。

txtFile=imageFile[:5]+'.txt'

这里 txtFile读取的是你的图片名字，像我的图片名字使用数字表示如图

我标签名字也是用对应的数字表示如图

我读的时候单独打印了一下， imageFile打印出来是图片名字加图片格式比如 15454.jpg，而这一行代码是要将图片名与标签对应上，所以需要去掉 .jpg加上标签的格式 .txt所以 imageFile[:5]这里的索引要你自己设置，你只需要要取你图片的名字而不能加上格式，像我的数据集就是 [:5]正好取到 15454.

好了大概需要注意的地方就是这些了，都是一些可能会有疑问以及容易出错的地方，希望能给与需要的人一些帮助。
对你有帮助的话还请点赞收藏哦嘻嘻

总结
以上就是我对目标检测中yolo v5格式和coco格式的理解和代码实现，大家如果有更深层的理解和更好的代码实现可以留言或私信讨论哦。

Original: https://blog.csdn.net/qq_45294476/article/details/125685035
Author: 纯粹ss
Title: 目标检测标注文件yolov5(txt)格式转coco(json)格式详解及代码实现

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624248/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

matlab 实现同态滤波算法并于直方均衡化相比较看看谁的效果更好

一、灰度图同态滤波与直方均衡化的比较 1、灰度图同态滤波 Figure [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-U2OVYl29-164188…

人工智能 2023年6月22日
0076
安装Pytorch指定版本1.3 python=3.6 CPU版本教程

1、安装Anaconda 官网下载地址，滑到最底部，安装电脑相应的版本。注意：安装的路径尽量选在C盘以外的其他盘。 2.安装Pytorch 2.1在电脑导航栏搜索anacond…

人工智能 2023年7月23日
00146
Topic 13. 临床预测模型之一致性指数 (C-index)

前言 C-index，C指数即一致性指数（concordance index），用来评价模型的预测能力。C指数是指所有病人对子中预测结果与实际结果一致的对子所占的比例。它估计了预测…

人工智能 2023年6月15日
0070
理解DALL·E 2， Stable Diffusion和 Midjourney工作原理

编者按：随着AIGC的兴起，各位小伙伴们对文生图工具DALL-E 2、Stable Diffusion和Midjourney一定并不陌生。本期IDP Inspiration，小白将…

人工智能 2023年7月30日
0068
③⭐全网首发☀️数据有道之数据库技术❤️干货大全【持续更新】❗❗❗

3.1 数据库概念设计考点1 概念设计的任务考点2 概念设计的依据及过程考点3 数据建模方法考点4 概念设计实例 3.2 数据库逻辑设计考点1 任务考点2 目标 3…

人工智能 2023年6月1日
0081
Pytorch 搭建自己的Unet语义分割平台

文章目录 * – 前言 – Unet实现思路 – + 一、预测部分 + * 1、主干网络介绍 * 2、加强特征提取结构 * 3、利用特征获得预测…

人工智能 2023年7月23日
0067
经典CNN网络：Resnet18网络结构输入和输出

前言 Q1:每当看到一个新的网络，总会思考，这个网络提出来有什么意义，解决了什么问题？ Resnet18中的resnet就时网络结构呗，18应该是权重层的数量(参照VGG16的命名…

人工智能 2023年5月26日
0086
FileChannel 文件流的简单使用

FileChannel 注意: FileChannel 只能工&amp…

人工智能 2023年6月27日
0083
百度Apollo控制模块基础及控制算法介绍。

文章目录一、控制理论基础 * 1、概述 2、控制基础二、PID控制器 * 1、基本知识三、进阶控制器设计 * 1、LQR控制器 2、 MPC 四、MATLAB控制工具箱 ; …

人工智能 2023年6月2日
0086
python中dtypes_Dataframe创建及index,columns,values,dtypes等属性介绍

DataFrame概念(可以通俗理解为excel中一片数据) 表格型数据结构，带有标签的二维数组，有行标签(index)和列标签(columns)，其值可以是数值、字符串、布尔值等…

人工智能 2023年7月7日
0075
算法是什么，为什么需要算法

算法是什么其实算法的概念并不复杂，我们简单理解，就是一组通过机器学习方法找到的最佳公式的集合。它和数据的关系可以理解为工具和原料的关系，它能够把纷繁复杂的数据转化为特定的，符合…

人工智能 2023年6月24日
0067
目标检测Part2+Leetcode(733)

目标检测Part2 目标检测Part2(R-FCN,Yolo) * 1.R-FCN – 1.1 检测网络的变换敏感性和分类网络的变换不变性 1.2 设计动机（模型优…

人工智能 2023年7月10日
0097
浅入决策树的分类和回归

系列文章目录浅入决策树的分类和回归深入决策树的分类和回归sklearn中的决策树前言在学习重要的基础算法的时候，我往往会偷懒忽视掉很多问题，就会陷入到，我觉得我会了，我知道是…

人工智能 2023年6月18日
0056
让 AI 为我创作的诗歌配画 #wombo.art #Disco Diffusion

Mixlab 仅仅用一段文字，可以实现哪些应用与创作？知识库文字转语音；文字驱动数字人；文字生成图像； …… vonage 专业文本转语…

人工智能 2023年7月14日
0072
Debian系列操作系统安装CUDA+CUDNN+TensorFlow+Pytorch深度学习环境

Debian系列操作系统安装CUDA+CUDNN+TensorFlow+Pytorch深度学习环境 1. 简介 2. 安装显卡驱动 3. 安装CUDA+CUDNN 环境 4. 安装…

人工智能 2023年5月23日
0059
使用Python，Opencv检测AprilTag

这篇博客将介绍AprilTags，这是一组基准标记，通常用于机器人技术、校准和3D计算机视觉项目。通常在执行实时检测时使用AprilTags（以及密切相关的ArUco标记）。 Ap…

人工智能 2023年7月19日
0041

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测标注文件yolov5(txt)格式转coco(json)格式详解及代码实现

目标检测标注文件yolov5(txt)格式转coco(json)格式详解及代码实现

大家都在看