将Labelme标注的数据做成COCO格式的数据集（实例分割的数据集）

2023年5月26日上午10:08 • 人工智能 • 阅读 88

这里说明一下：

Labelme标注数据时候是用的多边形框，关于标注，可以看前面的博客文章

下面制作的COCO数据集是用于实例分割的数据集。

COCO格式数据集的制作

1、labelme标注的数据转coco数据集

Anaconda Prompt里 F:\rockdata 下的目录运行指令：

这里需要注意是在activate labelme后，

python labelme2coco.py NoObeject

NoObeject是放json文件和图像的文件夹名字。

下载： labelme2coco.py代码，运行，无需修改。

运行代码会生成一个文件，trainval.json

代码参考：

github.com/Tony607/labelme2coco

视频参考：

labelme转coco与多个coco文件的合并_哔哩哔哩_bilibili 将Labelme标注的数据做成COCO格式的数据集（实例分割的数据集） https://www.bilibili.com/video/BV1g44y147C9 ;

2 、labelme转coco数据集

源代码运行后， train和val文件夹下为空，原因是：写入图像的路径可能不对，修改源代码后正常：

代码如下：

import os
import json
import numpy as np
import glob
import shutil
import cv2
from sklearn.model_selection import train_test_split

np.random.seed(41)
#rock1
#rock2
#rock3
#rock4
#rock5
#rock6
#rock7
#rock8
#rock9
#rock10
#rock11
#sand_wave1
#sand_wave2
#sand_wave3
#sand_wave4
#sand_wave5
#sand_wave6
#sand_wave7
#sand_wave8
#sand_wave9
#sand_wave10
#sand_wave11

0&#x4E3A;&#x80CC;&#x666F;
classname_to_id = {
    "1": 1,
    "2": 2,
 }
#&#x6CE8;&#x610F;&#x8FD9;&#x91CC;&#xFF1A;yxf
#&#x9700;&#x8981;&#x4ECE;1&#x5F00;&#x59CB;&#x628A;&#x5BF9;&#x5E94;&#x7684;Label&#x540D;&#x5B57;&#x5199;&#x5165;&#xFF1A;&#x8FD9;&#x91CC;&#x6839;&#x636E;&#x81EA;&#x5DF1;&#x7684;Lable&#x540D;&#x5B57;&#x4FEE;&#x6539;

class Lableme2CoCo:

    def __init__(self):
        self.images = []
        self.annotations = []
        self.categories = []
        self.img_id = 0
        self.ann_id = 0

    def save_coco_json(self, instance, save_path):
        json.dump(instance, open(save_path, 'w', encoding='utf-8'), ensure_ascii=False, indent=1)  # indent=2 &#x66F4;&#x52A0;&#x7F8E;&#x89C2;&#x663E;&#x793A;

    # &#x7531;json&#x6587;&#x4EF6;&#x6784;&#x5EFA;COCO
    def to_coco(self, json_path_list):
        self._init_categories()
        for json_path in json_path_list:
            obj = self.read_jsonfile(json_path)
            self.images.append(self._image(obj, json_path))
            shapes = obj['shapes']
            for shape in shapes:
                annotation = self._annotation(shape)
                self.annotations.append(annotation)
                self.ann_id += 1
            self.img_id += 1
        instance = {}
        instance['info'] = 'spytensor created'
        instance['license'] = ['license']
        instance['images'] = self.images
        instance['annotations'] = self.annotations
        instance['categories'] = self.categories
        return instance

    # &#x6784;&#x5EFA;&#x7C7B;&#x522B;
    def _init_categories(self):
        for k, v in classname_to_id.items():
            category = {}
            category['id'] = v
            category['name'] = k
            self.categories.append(category)

    # &#x6784;&#x5EFA;COCO&#x7684;image&#x5B57;&#x6BB5;
    def _image(self, obj, path):
        image = {}
        from labelme import utils
        img_x = utils.img_b64_to_arr(obj['imageData'])
        h, w = img_x.shape[:-1]
        image['height'] = h
        image['width'] = w
        image['id'] = self.img_id
        image['file_name'] = os.path.basename(path).replace(".json", ".jpg")
        return image

    # &#x6784;&#x5EFA;COCO&#x7684;annotation&#x5B57;&#x6BB5;
    def _annotation(self, shape):
        # print('shape', shape)
        label = shape['label']
        points = shape['points']
        annotation = {}
        annotation['id'] = self.ann_id
        annotation['image_id'] = self.img_id
        annotation['category_id'] = int(classname_to_id[label])
        annotation['segmentation'] = [np.asarray(points).flatten().tolist()]
        annotation['bbox'] = self._get_box(points)
        annotation['iscrowd'] = 0
        annotation['area'] = 1.0
        return annotation

    # &#x8BFB;&#x53D6;json&#x6587;&#x4EF6;&#xFF0C;&#x8FD4;&#x56DE;&#x4E00;&#x4E2A;json&#x5BF9;&#x8C61;
    def read_jsonfile(self, path):
        with open(path, "r", encoding='utf-8') as f:
            return json.load(f)

    # COCO&#x7684;&#x683C;&#x5F0F;&#xFF1A; [x1,y1,w,h] &#x5BF9;&#x5E94;COCO&#x7684;bbox&#x683C;&#x5F0F;
    def _get_box(self, points):
        min_x = min_y = np.inf
        max_x = max_y = 0
        for x, y in points:
            min_x = min(min_x, x)
            min_y = min(min_y, y)
            max_x = max(max_x, x)
            max_y = max(max_y, y)
        return [min_x, min_y, max_x - min_x, max_y - min_y]

if __name__ == '__main__':
    #&#x8FD9;&#x91CC;&#x662F;&#x539F;&#x6765;&#x4F5C;&#x8005;&#x7684;&#x8DEF;&#x5F84;
    #labelme_path = "../../../xianjin_data-3/"

    #&#x8FD9;&#x91CC;&#x6CE8;&#x610F;&#xFF1A;yxf
    #&#x9700;&#x8981;&#x628A;labelme_path&#x4FEE;&#x6539;&#x4E3A;&#x81EA;&#x5DF1;&#x653E;images&#x548C;json&#x6587;&#x4EF6;&#x7684;&#x8DEF;&#x5F84;
    labelme_path = "F:\\rockdata\\NoObeject\\"
    #saved_coco_path = "../../../xianjin_data-3/"
    saved_coco_path = "F:\\rockdata\\COCO\\"
    #saved_coco_path = "./"
    #&#x8981;&#x628A;saved_coco_path&#x4FEE;&#x6539;&#x4E3A;&#x81EA;&#x5DF1;&#x653E;&#x751F;&#x6210;COCO&#x7684;&#x8DEF;&#x5F84;&#xFF0C;&#x8FD9;&#x91CC;&#x4F1A;&#x5728;&#x6211;&#x5F53;&#x524D;COCO&#x7684;&#x6587;&#x4EF6;&#x5939;&#x4E0B;&#x5EFA;&#x7ACB;&#x751F;&#x6210;coco&#x6587;&#x4EF6;&#x5939;&#x3002;
    print('reading...')
    # &#x521B;&#x5EFA;&#x6587;&#x4EF6;
    if not os.path.exists("%scoco/annotations/" % saved_coco_path):
        os.makedirs("%scoco/annotations/" % saved_coco_path)
    if not os.path.exists("%scoco/images/train2017/" % saved_coco_path):
        os.makedirs("%scoco/images/train2017" % saved_coco_path)
    if not os.path.exists("%scoco/images/val2017/" % saved_coco_path):
        os.makedirs("%scoco/images/val2017" % saved_coco_path)
    # &#x83B7;&#x53D6;images&#x76EE;&#x5F55;&#x4E0B;&#x6240;&#x6709;&#x7684;joson&#x6587;&#x4EF6;&#x5217;&#x8868;
    print(labelme_path + "/*.json")
    json_list_path = glob.glob(labelme_path + "/*.json")
    print('json_list_path: ', len(json_list_path))
    # &#x6570;&#x636E;&#x5212;&#x5206;,&#x8FD9;&#x91CC;&#x6CA1;&#x6709;&#x533A;&#x5206;val2017&#x548C;tran2017&#x76EE;&#x5F55;&#xFF0C;&#x6240;&#x6709;&#x56FE;&#x7247;&#x90FD;&#x653E;&#x5728;images&#x76EE;&#x5F55;&#x4E0B;
    train_path, val_path = train_test_split(json_list_path, test_size=0.1, train_size=0.9)
    #&#x8FD9;&#x91CC;yxf&#xFF1A;&#x5C06;&#x8BAD;&#x7EC3;&#x96C6;&#x548C;&#x9A8C;&#x8BC1;&#x96C6;&#x7684;&#x6BD4;&#x4F8B;&#x662F;9&#xFF1A;1&#xFF0C;&#x53EF;&#x4EE5;&#x6839;&#x636E;&#x81EA;&#x5DF1;&#x60F3;&#x8981;&#x7684;&#x6BD4;&#x4F8B;&#x4FEE;&#x6539;&#x3002;
    print("train_n:", len(train_path), 'val_n:', len(val_path))

    # &#x628A;&#x8BAD;&#x7EC3;&#x96C6;&#x8F6C;&#x5316;&#x4E3A;COCO&#x7684;json&#x683C;&#x5F0F;
    l2c_train = Lableme2CoCo()
    train_instance = l2c_train.to_coco(train_path)
    l2c_train.save_coco_json(train_instance, '%scoco/annotations/instances_train2017.json' % saved_coco_path)
    for file in train_path:
         #shutil.copy(file.replace("json", "jpg"), "%scoco/images/train2017/" % saved_coco_path)
        #print("&#x8FD9;&#x91CC;&#x6D4B;&#x8BD5;&#x4E00;&#x4E0B;file&#xFF1A;"+file)
        img_name = file.replace('json', 'png')
        #print("&#x8FD9;&#x91CC;&#x6D4B;&#x8BD5;&#x4E00;&#x4E0B;img_name&#xFF1A;" + img_name)
        temp_img = cv2.imread(img_name)
        #print(temp_img) &#x6D4B;&#x8BD5;&#x56FE;&#x50CF;&#x8BFB;&#x53D6;&#x662F;&#x5426;&#x6B63;&#x786E;
        try:
            #&#x8FD9;&#x4E2A;&#x8FD9;&#x53E5;&#x662F;&#x539F;&#x6765;&#x4F5C;&#x8005;&#x7684;&#x4EE3;&#x7801;&#xFF0C;&#x8FD0;&#x884C;&#x4E4B;&#x540E;train&#x6587;&#x4EF6;&#x5939;&#x4E0B;&#x751F;&#x6210;&#x7684;&#x662F;&#x7A7A;&#x7684;
            #cv2.imwrite("{}coco/images/train2017/{}".format(saved_coco_path, img_name.replace('png', 'jpg')),temp_img)
            #&#x6211;&#x81EA;&#x5DF1;&#x653E;train&#x56FE;&#x50CF;&#x7684;&#x8DEF;&#x5F84;&#xFF1A;F:\rockdata\COCO\coco\images\train2017
            img_name_jpg=img_name.replace('png', 'jpg')
            print("jpg&#x6D4B;&#x8BD5;:"+img_name_jpg)
            filenames = img_name_jpg.split("\\")[-1]
            print(filenames) #&#x8FD9;&#x91CC;&#x662F;&#x5C06;&#x4E00;&#x4E2A;&#x8DEF;&#x5F84;&#x4E2D;&#x7684;&#x6587;&#x4EF6;&#x540D;&#x5B57;&#x63D0;&#x53D6;&#x51FA;&#x6765;
            cv2.imwrite("./COCO/coco/images/train2017/{}".format(filenames),temp_img)
            #&#x8FD9;&#x53E5;&#x5199;&#x5165;&#x8BED;&#x53E5;&#xFF0C;&#x662F;&#x5C06; X.jpg &#x5199;&#x5165;&#x5230;&#x6307;&#x5B9A;&#x8DEF;&#x5F84;./COCO/coco/images/train2017/X.jpg
        except Exception as e:
            print(e)
            print('Wrong Image:', img_name )
            continue

        print(img_name + '-->', img_name.replace('png', 'jpg'))
        #print("yxf"+img_name)

    for file in val_path:
        #shutil.copy(file.replace("json", "jpg"), "%scoco/images/val2017/" % saved_coco_path)

        img_name = file.replace('json', 'png')
        temp_img = cv2.imread(img_name)
        try:

            #cv2.imwrite("{}coco/images/val2017/{}".format(saved_coco_path, img_name.replace('png', 'jpg')), temp_img)
            img_name_jpg = img_name.replace('png', 'jpg')  #&#x5C06;png&#x6587;&#x4EF6;&#x66FF;&#x6362;&#x6210;jpg&#x6587;&#x4EF6;&#x3002;
            print("jpg&#x6D4B;&#x8BD5;:" + img_name_jpg)
            filenames = img_name_jpg.split("\\")[-1]
            print(filenames)
            cv2.imwrite("./COCO/coco/images/val2017/{}".format(filenames), temp_img)
        except Exception as e:
            print(e)
            print('Wrong Image:', img_name)
            continue
        print(img_name + '-->', img_name.replace('png', 'jpg'))

    # &#x628A;&#x9A8C;&#x8BC1;&#x96C6;&#x8F6C;&#x5316;&#x4E3A;COCO&#x7684;json&#x683C;&#x5F0F;
    l2c_val = Lableme2CoCo()
    val_instance = l2c_val.to_coco(val_path)
    l2c_val.save_coco_json(val_instance, '%scoco/annotations/instances_val2017.json' % saved_coco_path)

在Anaconda Prompt运行：

python labelme2CoCoCo.py

运行后，在我当前目录的COCO文件夹下，生成coco文件夹：

coco文件夹下有annotations文件夹和images文件夹，

annotations文件夹存放2个json文件。

images文件夹存放train （存放：划分的用于训练的图像数据）和val （存放：划分的用于验证的图像数据）两个文件夹。

这里是命令行运行结果截图：

B站视频和代码：感谢UP主

代码：https://github.com/MrSupW/datasetapi

mmdetection系列教程合集_哔哩哔哩_bilibili 将Labelme标注的数据做成COCO格式的数据集（实例分割的数据集） https://www.bilibili.com/video/BV1jV411U7zb?p=6 ;

3、来自Labelme的官网代码：

代码参考：labelme/examples/instance_segmentation at v3.11.2 · wkentaro/labelme (github.com)

python labelme2cocoGuan.py NoObeject data_dataset_coco –labels labels.txt

这里：NoObeject 文件夹是存放原始图像文件和json文件。

生成的数据集coco放在 data_dataset_coco文件夹。

labels.txt 长这样：

命令行里运行结果如下：

运行后生成一个 data_dataset_coco文件夹，

里面有一个JPEGImages文件夹（存放标注的那些原始图像）

和 annotations.json文件。

提示：这个代码运行前需要安装 pip install pycocotools

关于这个安装包的过程请看我之前的博客分享，专门讲解踩坑过程。

在Visual 2020里安装pip install pycocotools成功后，在Anaconda Prompt这里仍需再安装一遍，才能成功运行上述代码。

Original: https://blog.csdn.net/wenyunick/article/details/122193893
Author: 一直开心
Title: 将Labelme标注的数据做成COCO格式的数据集（实例分割的数据集）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/519120/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Tensorflow模型训练六步法

前几期我们简单介绍了tensorflow 2的一些基本概念、知识等，希望对你们有所帮助。这期我们将开始最简单的项目做起，搭建网络进行训练，并加载模型测试我们的模型效果。感兴趣的朋友…

人工智能 2023年7月13日
0063
java实现实体关系抽取

前言：21年广州荔湾区成了疫情灾区，很多人都没有工作，被居家隔离，感染病毒概率死亡率是0.005%，没有工作死亡率是100%，因此作为普通老百姓，自己开发了一个数据分析工具，叫ya…

人工智能 2023年5月31日
0068
语音识别中的评价指标通常包括词错误率（Wor

问题背景在语音识别中，评价指标是用来衡量语音识别系统性能的重要指标。其中，一种常用的评价指标是词错误率（Word Error Rate，简称WER），它可以用来衡量识别结果和参考…

人工智能 2024年1月3日
0051
HyperLPR车牌识别库代码分析（13）

2021SC@SDUSC 源代码下载地址：https://gitee.com/zeusees/HyperLPR 本篇内容将总结之前所分析的demo.py和SimpleRecogni…

人工智能 2023年6月22日
0090
听说大家都在用这个TikTok数据分析工具…

随着TikTok的迅猛发展，TikTok数据分析工具应运而生。但由于处于发展阶段，很多TikTok数据分析工具功能尚未齐全，仍在更新中。它们并不像国内飞瓜、蝉妈妈等那样成熟，所以达…

人工智能 2023年6月11日
00112
Capture, Learning, and Synthesisof 3D Speaking styles论文阅读笔记 VOCA

Capture, Learning, and Synthesisof 3D Speaking Styles论文阅读笔记摘要制作了一个4D面部（3D mesh 序列 + 同步语音…

人工智能 2023年5月27日
0087
Docker安装并使用Mysql（可用详细）

Docker安装并使用Mysql 一、Docker安装Mysql * 1、启动Docker 2、查询mysql 3、安装mysql – 1.默认拉取最新版本mysql …

人工智能 2023年7月29日
0074
deepsort训练车辆特征参数

deepsort用来跟踪被检测对象。网上常见的yolov5+deepsort，是pytorch版。此版本由ZQPei Github提供，源自nwojke Github ，将其修改为…

人工智能 2023年7月20日
0068
论文阅读 DyREP:Learning Representations Over Dynamic Graphs

6 DyREP:Learning Representations Over Dynamic Graphs link:https://scholar.google.com/schol…

人工智能 2023年6月4日
00103
[附源码]java毕业设计创意众筹网站

项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX（Webstorm也行）+ Eclispe（IntelliJ IDEA,Eclis…

人工智能 2023年6月27日
0091
python 关联规则

文章目录一、基本概念 * 定义1. 记录（事务）定义2. 事务集定义3. 项目（项）定义4. 项目集（项集）定义5. k项集定义6. 支持度（Support）定义7….

人工智能 2023年6月19日
0077
聚类结果的评价指标

聚类评价指标外部指标 * Jaccard系数 FM指数举例子 MI 互信息 – 信息熵列联表 NMI标准化互信息 AMI调整互信息内部指标 * 轮廓系数 DB指…

人工智能 2023年6月2日
0088
OpenCV-Python实战（番外篇）——利用 K-Means 聚类进行色彩量化

OpenCV-Python实战（番外篇）——利用 K-Means 聚类进行色彩量化 * – 前言 – 利用 K-Means 聚类进行色彩量化 –…

人工智能 2023年7月19日
0068
Python 基于OpenCV+face_recognition实现人脸捕捉与人脸识别（照片对比）

1.安装包依赖与上篇通过摄像头动态识别人脸一样，先下载好opencv-python、face-recognition，这里因为使用的是照片对比的方式，特意使用tkinter画了一…

人工智能 2023年6月25日
0084
记录一次ffmpeg编译

记录一次ffmpeg编译网上搜的linux编译都是xxxx，懒得说了不知道为什么 ffmpeg-4.2.2下我使用最大量编译都无法编译出 include、…

人工智能 2023年6月27日
0088
《计算传播学导论》读书笔记：第五章网络传播与传播网络

目录第五章网络传播与传播网络第一节引言第二节网络传播中热点研究问题一、用户传播能力度量与意见领袖发现二、传播最大化三、信息流行度预测四、用户传播行为预测五、传…

人工智能 2023年5月30日
0077

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

将Labelme标注的数据做成COCO格式的数据集（实例分割的数据集）

大家都在看