深度学习图像分割——制作自己的VOC数据集

2023年5月26日下午12:04 • 人工智能 • 阅读 89

自己近期跑了FCN和maskR-CNN网络模型，原作者都是在coco或者是VOC数据集上训练的权重，然后进行识别。其中FCN是用来做语义分割任务的，maskR-CNN采用来双分支结构，同时用来做语义分割和目标检测。

COCO数据集有80个类别，VOC数据集有20个类别。当这些数据集类别中没有自己需要的时候，就需要自己动手做自己的数据集了。

我自己在做数据集的时候主要使用到了labelme和labelImg两个工具。labelme主要是制作语义分割数据集(ImageSets,JPEGImages,SegmentationClass,SegmentationObject几个文件夹)，labelImg主要是制作目标检测数据集(主要是Annoations中的xml文件)，最后把两个何在一起就可以使用maskR-CNN来训练了。文件结构如下图所示

建议在annoconda中安装。在conda环境中创建和安装labelme的命令如下：

conda create -n labelme python=3.7
activate labelme
pip install pyqt
pip install labelme

然后再环境中直接使用labelme命令打开工具：

点击OpenDir打开要制作数据集图片的文件夹。点击CreatePolygons标记图片就可以了，最后每张图片标记好之后，别忘记点击save保存。此时的会保存问json格式的文件，如图所示：

接下来就要转换这些json格式为轮廓图片。

在json文件的目录下启动cmd,命令conda activate labelme切换至labelme环境下。

输入命令

labelme_json_to_dataset K:\MyDataset\json_data 注：K:\MyDataset\json_data为自己存放json文件的文件夹，运行后在此文件中就会出现转换好的文件夹了。打开其中的某一个：

其中的label.png就是标记好的轮廓图片。最后讲原始图片和轮廓图片按照相对应的名字分别存放在 JPEGImages和SegmentationClass中(我这里Object中放的是和Class文件夹中同样的图片)。

使用如下代码生成ImageSets文件夹中Segmentation文件中的test.txt,train.txt和val.txt文件(分别是测试、训练和验证文件)


import os
import shutil
from sklearn.model_selection import train_test_split

从json中挑出mask文件

inputdir = r'K:\MyDataset\label'  # 存放json文件的文件夹
outputdir = r'K:\MyDataset\MyVOC2022\SegmentationClass'
c = 1
for dir in os.listdir(inputdir):
    # 设置旧文件名（就是路径+文件名）
    oldname = inputdir + os.sep + dir + os.sep + 'label.png'  # os.sep添加系统分隔符

    # 设置新文件名
    # c = outputdir + os.sep + dir.split('_')[1]

    a = "0" * (6 - len(str(c)))
    newname = outputdir + os.sep + a + str(c) + '.png'
    shutil.copyfile(oldname, newname)  # 用os模块中的rename方法对文件改名
    print(oldname, '======>', newname)
    c += 1

#原始数据转换
inputdir = r'K:\MyDataset\pig_image'    #存放初始数据的文件夹
outputdir = r'K:\MyDataset\MyVOC2022\JPEGImages'
c = 1
for dir in os.listdir(inputdir):
    # 设置旧文件名（就是路径+文件名）
    oldname = inputdir + os.sep + dir   # os.sep添加系统分隔符

    # 设置新文件名
    #c = outputdir + os.sep + dir.split('_')[1]

    a = "0" * (6 - len(str(c)))
    newname =outputdir + os.sep +a + str(c) + '.jpg'
    shutil.copyfile(oldname, newname)  # 用os模块中的rename方法对文件改名
    print(oldname, '======>', newname)
    c += 1

#生成txt文件
imagedir = 'K:\MyDataset\MyVOC2022\JPEGImages'
outdir = r'K:\MyDataset\MyVOC2022\ImageSets\Segmentation'

images = []
for file in os.listdir(imagedir):
    filename = file.split('.')[0]
    images.append(filename)
训练集测试集验证集比例为：4：2：2
train, test = train_test_split(images, train_size=0.5, random_state=0)
val, test = train_test_split(test, train_size=0.5, random_state=0)

with open(outdir + os.sep +"train.txt", 'w') as f:
    f.write('\n'.join(train))
with open(outdir + os.sep +"val.txt", 'w') as f:
    f.write('\n'.join(val))
with open(outdir + os.sep +"test.txt", 'w') as f:
    f.write('\n'.join(test))

按照以上操作，FCN语义分割数据集就制作好了。接下来制作目标检测的部分：

在conda环境中安装labelImg工具非常简单：

使用命令：pip install labelimg

labelimg打开工具：

点击Create RectBox就可以标记图片了，图片标记号后会生成xml文件：

这里的文件名要和之前的文件名一一对应。xml文件中存放的是图片中框起来的目标的信息：

把这些xml文件复制到Annotations文件夹下就可以了。随后就可以使用maskR-CNN来训练这些图片了，训练好之后就可以进行识别预测了。

Original: https://blog.csdn.net/LOLUN9/article/details/124863029
Author: 管牛牛
Title: 深度学习图像分割——制作自己的VOC数据集

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/519406/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Python进阶—Pandas

Pandas再来一次文章目录一、Series和DataFrame 二、选择数据三、赋值及操作(增、删、改) 四、处理丢失数据五、读取并写入文件六、concat拼接七、m…

人工智能 2023年7月7日
0070
transformer学习之Mask

transformer学习之Mask mask作用直译：面具在Transformer中mask的作用有两个：处理输入中序列长度不等的问题防止模型在预测时提前知道未来的信息 …

人工智能 2023年5月30日
0046
Conda虚拟环境创建

Conda虚拟环境创建 1. 为什么要创建虚拟环境 2. 开始搭建虚拟环境 * 第一步：创建虚拟环境第二步：切换进入虚拟环境 – 2.1 安装python的各种模块 …

人工智能 2023年5月26日
0082
深度学习之DCN-v2

这篇文章发表在2019的CVPR上，是Deformable Convolution Network的进阶版本——DCN-v2，通过对DCN的两处改进来增加卷积神经网络的适应性与灵活…

人工智能 2023年7月14日
0077
知识图谱问答的学习笔记

基于关系技术（主要思想是将大问题化成精心设计的能够解决的一个个小问题）：子图匹配：基于知识的问答分为两种：基于信息检索 (1) 生成候选答案 (2) 对候选答案排名基于语义…

人工智能 2023年6月1日
0088
算法设计与分析复习（一）

判断题：如果一个NP完全问题能在多项式时间内得到解决，那么NP中的每一个问题都能在多项式时间内求解。（T）可以用如下方法来证明某结论X成立：先假设X不成立，在此假设基础上推出X…

人工智能 2023年6月29日
0089
【自然语言处理】【知识图谱】知识图谱表示学习(一)：TransE、TransH、TransR、CTransR、TransD

知识图谱表示学习(一)TransE,TransH,TransR,CTransR,TransD 【自然语言处理】【知识图谱】知识图谱表示学习(一)：TransE、TransH、Tra…

人工智能 2023年5月28日
00117
PyTorch版本更新后无法调用GPU显卡的原因及解决办法

Index 目录索引问题剖析解决方法参考问题剖析使用 PyTorch在网络模型训练过程中，如果更新了 PyTorch的版本（例如由 1.7.0更新为 1.8.1），则可能…

人工智能 2023年7月21日
0053
“要卷就卷创新”，百度在走一条难而正确的路

“内卷”一词，最早由美国人类学家格尔茨提出，内卷即”向内演化”，当社会资源无法满足所有人的需求时，人们通过竞争来获取更多资源。众人对…

人工智能 2023年6月30日
0087
YOLOv5更换激活函数（FReLU+SE机制）

介绍本次我们在卷积层添加SE注意力模块来改进YOLOv5算法，同时用FReLU替换SILU激活函数，并通过添加跳转连接来改进PANet特征融合网络。为了本次实验的对比性，我使用…

人工智能 2023年7月28日
0085
opencv进行人脸识别并发送到stm32进行显示

一、项目基本介绍刷脸支付、刷脸乘车等以人脸识别为基础的应用在我们生活中使用的越来越多。基于此设计并制作一个人脸识别系统，可以实现以下功能：处理器通过摄像头采集图像，之后进行图像处…

人工智能 2023年6月18日
00110
SnowNLP 使用自定义语料进行模型训练

SnowNLP 是一个功能强大的中文文本处理库，它囊括了中文分词、词性标注、情感分析、文本分类、关键字/摘要提取、 TF/IDF、文本相似度等诸多功能，像隐马尔科夫模型、朴素贝…

人工智能 2023年5月31日
0073
机器学习分类算法之XGBoost（集成学习算法）

目录走进XGBoost 什么是XGBoost？ XGBoost树的定义 XGBoost核心算法正则项：树的复杂程度 XGBoost与GBDT有什么不同 XGBoost需要注意的…

人工智能 2023年7月3日
0091
DBSCAN算法

目录定义算法流程代码效果演示算法优势算法劣势算法待改进之处参数选择方式参数选择效果定义 DBSCAN（Density-Based Spatial Cluster…

人工智能 2023年6月3日
00142
Pandas缺失值处理

一、什么是稀疏数据？稀疏数据指的是在数据库或者数据集中存在大量缺失数据或者空值，我们把这样的数据集称为稀疏数据集。大致原因由于调查不当产生的稀疏数据；由于天然限制产生的稀疏数…

人工智能 2023年7月6日
0081
计算机视觉教程3-1：全面详解图像边缘检测算法(附Python实战)

目录 0 写在前面 1 一阶微分算子 * 1.1 Prewitt算子 1.2 Sobel算子 2 二阶微分算子 * 2.1 Laplace算子 2.2 LoG算子 3 Canny边…

人工智能 2023年6月18日
0056

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习图像分割——制作自己的VOC数据集

大家都在看