VOC数据集解析–python实现分离图片训练分类网络

2023年7月3日上午8:57 • 人工智能 • 阅读 52

以voc2007数据为例，下载后的数据格式如下：

Annotations文件夹里保存的是目标检测用到的 .xml文件，文件名是图像名称

ImageSets文件夹里面是图像划分的集合，打开之后有3个文件夹： Layout 、 Main、 Segmentation，这3个文件夹对应的是 VOC challenge 3类不同的任务。

VOC challenge的Main task，其实是classification和detection，所以在 Main文件夹中，包含的就是这两个任务要用到的图像集合，如下图所示。共有84个 .txt文件，其中4个文件为训练集 train.txt、验证集 val.txt、训练集和验证集汇总 trainval.txt、测试集 test.txt，这4个文件里面保存的是图像的ID号；还有20类目标，每个类别有该类的 类别名_train.txt、 类别名_val.txt、 类别名_trainval.txt、 类别名_test.txt这4个文本，共80个文件。这80个文件中每一行的图像ID后面还跟了一个数字，要么是-1，要么是1，有时候也可能会出现0，意义为：-1表示当前图像中，没有该类物体；1表示当前图像中有该类物体；0表示当前图像中，该类物体只露出了一部分。

此外还有两个taster tasks ：Layout和Segmentation，这两个任务也有各自需要用到的图像，就分别存于 Layout和 Segmentation两个文件夹中，如下图所示，分别有4个文件：训练集 train.txt、验证集 val.txt、训练集和验证集汇总 trainval.txt、测试集 test.txt。

通过Main中txt文件，根据类别名称从ImageSets中讲对应类别的图片提取存放，用于训练分类网络：

&#x4ECE;VOC&#x6570;&#x636E;&#x96C6;&#x4E2D;&#x628A;&#x5206;&#x7C7B;&#x7528;&#x7684;&#x56FE;&#x7247;&#x63D0;&#x53D6;&#x51FA;&#x6765;
import os
import shutil
from tqdm import tqdm

classes = ['aeroplane', 'bicycle', 'bird', 'boat', 'bottle', 'bus',
           'car', 'cat', 'chair', 'cow', 'diningtable', 'dog', 'horse',
            'motorbike', 'person', 'pottedplant', 'sheep', 'sofa', 'train', 'tvmonitor']

img_path = 'D:\\Maserati_Projects\\Open_Dataset\\VOC&#x6570;&#x636E;\\VOCdevkit\\VOC2007\\JPEGImages\\'
class_path = 'D:\\Maserati_Projects\\Open_Dataset\\VOC&#x6570;&#x636E;\\VOCdevkit\\VOC2007\\ImageSets\\Main\\'
save_path = 'D:\\Maserati_Projects\\Open_Dataset\\VOC&#x6570;&#x636E;\\VOCdevkit\\VOC2007\\val\\'

for c in tqdm(classes):
    txt_path = os.path.join(class_path, c+'_val.txt')

    move_image = os.path.join(save_path, c)
    if not os.path.exists(move_image):
        os.makedirs(move_image)

    with open(txt_path, 'r') as f:
        img_files = f.readlines()

    for name in img_files:
        img_name = name.split(' ')[0]

        src_img = os.path.join(img_path, img_name+'.jpg')
        target_img = os.path.join(move_image, img_name+'.jpg')
        shutil.copy(src_img, target_img)

Original: https://blog.csdn.net/hesongzefairy/article/details/124520573
Author: Forizon
Title: VOC数据集解析–python实现分离图片训练分类网络

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/667267/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

五分钟快速搭建一个实时人脸口罩检测系统(OpenCV+PaddleHub 含源码)

导读本文主要介绍如何使用OpenCV和PaddleHub实现一个实时人脸口罩检测系统。（公众号：OpenCV与AI深度学习）背景介绍从19年疫情爆发到现在，佩戴口罩对大家来说…

人工智能 2023年7月27日
0060
vue+neo4j +纯前端（neovis.js / neo4j-driver）实现知识图谱的集成大干货–踩坑无数！！！将经验分享给有需要的小伙伴

简单来说，这是一种比较热门的图数据库，图数据库以图形形式存储数据。它以节点，关系和属性的形式存储应用程序的数据。一个图由无数的节点和关系组成。安装图数据库在这里就不介绍了，本篇…

人工智能 2023年6月10日
0080
Visual Studio 2022下载及配置OpenCV4.5.5

写在前面：欢迎来到「湫歌」的博客。我是秋秋，一名普通的在校大学生。在学习之余，用博客来记录我学习过程中的点点滴滴，也希望我的博客能够更给同样热爱学习热爱技术的你们带来收获！希望大家…

人工智能 2023年7月19日
0058
合肥工业大学2021机器人技术作业四

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月15日
0057
电商零售交易数据分析

1、项目背景以英国的在线电子零售公司的跨国交易数据集作为分析样本，通过对该公司的运营指标统计分析以及构建RMF模型、K-Means机器学习算法从大量的电子零售交易数据中分析并找出…

人工智能 2023年7月17日
0068
预后建模绕不开的lasso cox回归

欢迎关注”生信修炼手册”! 回归我们并不陌生，线性回归和最小二乘法，逻辑回归和最大似然法，这些都是我们耳熟能详的事物，在生物信息学中的应用也比较广泛, 回归…

人工智能 2023年6月16日
0089
00后程序员摸爬滚打近一年，为学弟学妹们总结出了以下 7 条人生建议（建议收藏）

前言各位学弟学妹们大家好，我是一名出生于千禧年的00后程序员，因为个人极特殊原因，现已毕业并在职场中摸爬滚打一年。在社会近一年的不断探索中，让我明白了很多人生哲理，看透了很多人间…

人工智能 2023年7月29日
0068
项目3-食物图片分类

友情提示同学们可以前往课程作业区先行动手尝试！！！项目描述训练一个简单的卷积神经网络，实现食物图片的分类。数据集介绍本次使用的数据集为food-11数据集，共有11类 B…

人工智能 2023年7月3日
0071
常见硬盘分类介绍

目录一.介质 1.1 机械硬盘（HDD） 1.2 固态硬（SSD）二. 接口 2.1 SATA 2.2 NL SAS 2.3 SAS 三. 功能 3.1 桌面级 3.2 企业级…

人工智能 2023年7月17日
0060
一文读懂层次聚类（Python代码）

大家好，我是东哥。本篇想和大家介绍下层次聚类，先通过一个简单的例子介绍它的基本理论，然后再用一个实战案例 Python代码实现聚类效果。首先要说，聚类属于机器学习的无监督学习…

人工智能 2023年7月6日
0063
three.js之组对象

文章目录简介例子查看组对象组对象相关方法 * add remove 层级模型节点命名、查找、遍历 * 模型命名例子遍历查找本地坐标与世界坐标 * 例子本地坐标世…

人工智能 2023年7月30日
0045
聚类的评价指标

聚类的评价指标对于聚类结果的评价方法一般可以分为内部评估法（internal evaluation）与外部评估方法（external evaluation）。外部评估方法是指在…

人工智能 2023年5月31日
00146
单目相机空间定位文献阅读

单目相机：Monocular camera 单目相机空间定位：Monocular camera geolocation 大范围单目PTZ相机空间定位：Large-range Mon…

人工智能 2023年7月10日
0056
BERT、ALBERT、RoBerta、ERNIE模型对比和改进点总结

BERT总结 MLM (Masked language model) NSP (Next Sentence Prediction) MLM ：在一句话中随机选择 15% 的词汇用…

人工智能 2023年6月25日
0063
web网页设计与开发：基于HTML+CSS+JavaScript简单的个人博客网页制作期末作业

🎉精彩专栏推荐👇🏻👇🏻👇🏻✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战案例…

人工智能 2023年6月30日
0084
2.OpenCvSharp与Picturebox实现图片打开、读取、灰度转换与保存——c#OpenCvSharp学习笔记

2.OpenCvSharp与Picturebox实现图片打开、读取、灰度转换与保存 0.项目概述项目实现了图片的打开，并在picturebox上显示，使用了OpenCvSharp…

人工智能 2023年7月19日
0058

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

VOC数据集解析–python实现分离图片训练分类网络

大家都在看