目标检测数据集格式介绍（voc和coco）

2023年7月12日上午4:36 • 人工智能 • 阅读 72

VOC数据格式的目标检测数据，是指每个图像文件对应一个同名的xml文件，xml文件中标记物体框的坐标和类别等信息。
Pascal VOC比赛对目标检测任务，对目标物体是否遮挡、是否被截断、是否是难检测物体进行了标注。对于用户自定义数据可根据实际情况对这些字段进行标注。

xml文件中包含以下字段：

我们对Markdown编辑器进行了一些功能拓展与语法支持，除了标准的Markdown编辑器功能，我们增加了如下几点新功能，帮助你用它写博客：

 <filename>road650.pngfilename>

<size>
    <width>300width>
    <height>400height>
    <depth>3depth>
size>

包括字段含义是否必需name目标物体类别名称必需字段pose关于目标物体姿态描述非必需字段truncated目标物体目标因为各种原因被截断非必需字段occluded目标物体是否被遮挡非必需字段difficult目标物体是否是很难识别非必需字段bndbox物体位置坐标，用左上角坐标和右下角坐标表示： xmin、ymin、xmax、ymax必需字段

coco数据格式，是指将所有训练图像的标注都存放到一个json文件中。数据以字典嵌套的形式存放。

json文件中存放5个信息：

json文件中存放了

info licenses images annotations categories

的信息:

info中存放标注文件标注时间、版本等信息。
licenses中存放数据许可信息。
images中存放一个list，存放所有图像的图像名，下载地址，图像宽度，图像高度，图像在数据集中的id等信息。
annotations中存放一个list，存放所有图像的所有物体区域的标注信息，每个目标物体标注以下信息：

    {
        'area': 899,
        'iscrowd': 0,
        'image_id': 839,
        'bbox': [114, 126, 31, 29],
        'category_id': 0, 'id': 1,
        'ignore': 0,
        'segmentation': []
    }

Original: https://blog.csdn.net/windmyself/article/details/115998125
Author: windmyself
Title: 目标检测数据集格式介绍（voc和coco）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/686942/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PyTorch 实现CycleGAN 风格迁移

目录一、前言二、数据集三、网络结构四、代码（一）net （二）train （三）test 五、结果（一）loss （二）训练可视化（三）测试结果六、完整代码一、前…

人工智能 2023年6月16日
0096
20 行代码！带你快速构建基础文本搜索引擎 ⛵

💡 作者：韩信子@ShowMeAI📘 机器学习实战系列：https://www.showmeai.tech/tutorials/41📘 深度学习实战系列：https://www.s…

人工智能 2023年5月27日
0081
2022.09.29更新 c++下面使用opencv部署yolov5和yolov7实例分割模型（六）

零、写在最前面： 2023.01.11 更新：新增加onnxruntime的1.13.x版本支持。由于onnxruntime从1.12升级到1.13之后，GetOutputNa…

人工智能 2023年7月25日
0064
自主导航与路径规划无人机研究现状

目录 1.SLAM算法的研究现状 2. 无人机定位研究现状 3 路径规划的研究现状参考文献 1.SLAM算法的研究现状移动机器人根据传感器获取的自身状态信息和环境信息构建环境地…

人工智能 2023年7月27日
0045
FPN网络详解

1 特征金字塔特征金字塔(Feature Pyramid Networks， FPN)的基本思想是通过构造一系列不同尺度的图像或特征图进行模型训练和测试，目的是提升检测算法对…

人工智能 2023年7月25日
0062
JVM（十八）—— 垃圾回收（四）

JVM（十八）—— 垃圾回收（四） System.gc() 内存溢出内存泄漏 System.gc() 在默认情况下，通过System.gc()或者Runtime.getRunti…

人工智能 2023年6月28日
0079
基于Python的人脸互换系统设计与实现

全套资源下载地址：https://download.csdn.net/download/sheziqiong/86770095全套资源下载地址：https://download.c…

人工智能 2023年7月19日
0082
云组机命名

由于 kubernetes node 命名限制，手动命名主机名时仅支持小写字母，例如 cvm{R:13}-big{R:2}-test 大规模集群（混合云） IDC-云厂商-可用区-…

人工智能 2023年6月29日
0053
手写ROS程序控制ur5机械臂运动（Python）

最近想用ros来搭建ur机械臂的双臂平台，想先在gazebo中测试一下如何用自己手写的程序来控制ur机械臂运动，但网上的教程都局限在用moveit控制gazebo仿真环境下的ur运…

人工智能 2023年7月9日
0070
手写数字识别及python实现

目录 1、总体流程 2、代码实现下载数据集确定激活函数、损失函数、计算梯度函数等神经网络的搭建模型的训练与验证测试模型的泛化能力 1、总体流程 step1：下载数据集、读…

人工智能 2023年7月4日
0077
数据挖掘的概念和步骤

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月19日
0091
ARM64开发板运行Tensorflow lite图片分类demo

TensorFlow Lite C++ image classification demo 编译环境：docker 编译参考：https://tensorflow.google.c…

人工智能 2023年7月2日
0087
python基于PocketSphinx实现简单语音识别

一、实现环境系统环境：win 10 编译环境：Pycharm 2020.1.4 x64 编程语言：python 3.8.3 依赖库的版本： SpeechRecognition 3…

人工智能 2023年5月25日
0091
【图像分割】基于直觉模糊C均值聚类实现图像分割IFCMmatlab代码

1 简介模糊C均值聚类(FCM)图像分割法是一种典型且常用的模糊聚类图像分割算法，该方法原理简单，迭代过程能够自适应，但是该方法也存在一些明显的缺陷：对噪声敏感且对重叠部分图像…

人工智能 2023年6月2日
0068
Python数据分析案例07——二手车估价（机器学习全流程，数据清洗、特征工程、模型选择、交叉验证、网格搜参、预测储存）

案例背景本次案例来自2021年matchcop大数据竞赛A题数据集。要预测二手车的价格。训练集3万条数据，测试集5千条。官方给了二手车的很多特征，有的是已知的，有的是匿名的。要求…

人工智能 2023年6月15日
0099
opencv,numpy,tensor格式转换

深度学习中，涉及的图片格式有诸多转换方式，写此篇用于区别记录。目前接触到的读取图片的方式主要是两种，一是使用opencv的 cv2 模块，二是PIL. Image 模块，两者的使…

人工智能 2023年6月19日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测数据集格式介绍（voc和coco）

xml文件中包含以下字段：

json文件中存放5个信息：

大家都在看