(二)Cityscapes数据集简介

2023年5月26日上午7:20 • 人工智能 • 阅读 85

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

文章目录

1.简介

Daimler AG现在称为 Mercedes-Benz研发中心和达姆施塔特工业大学（德语： Technische Universität Darmstadt）研究人员开放的数据集，论文发表在2016年的 CVPR。 cityscapess采集自德国及附近国家的50个城市，包括了春夏秋三个季节的街区场景，且使用双目相机的获取了立体视觉视频序列。研究人员认为雨雪等极端天气需要特殊的处理方法和数据集进行研究，因此在 cityscapess数据集中没有采集此类数据。数据采集使用的是 1/3英寸 CMOS 2MP sensors (OnSemi安森美
AR0331)，帧率为 17的卷帘相机，包括左目和右目，基线距离 22cm，采集的是色彩深度为 16位的的HDR图像。

数据集有选自 27个城市的 5000张图像进行了 pixel-level像素级的语义和实例标注，可用于训练语义分割网络，这5000张中的每一张都取自于对应的一个包含30帧的视频序列的第20帧，剩余 23个城市的 20000张图像进行了粗略标注，这20000张图像是每间隔20s或汽车行驶20m采集一张得到的。精标一张数据平均 1.5h，粗标一张数据 7min。不同的标注人员对选出来的30张数据进行重复标注，像素一致性达 96%,去除可标注为 unclear的类别后，像素一致性达 98%。

分割数据集包含了 33个类,因部分类别数据量过于稀少，在验证数据集上，只有 19个语义分割类，因此要根据 *_polygons.json文件生成 *_labelTrainIds.png用以训练语义分割网络，可借助 cityscapesScripts工程中的 cityscapesscripts/preparation/createTrainIdLabelImgs.py脚本，在语义分割的 5000张图像的标注文件中，转换后训练时设置成 ignore_indexe的类别 255的像素个数分布为 max: 1105427.0, min: 114462.0, avg: 263878.772，图像大小是 2048x1024, 255的占比最高大于 50%。有个问题就是，使用语义分割模型测试输入一张图像，其输出每个像素的类别，这些类别都在 0-18 上，是无法预测出 255 这种类别的，对于在标签文件上本来属于 255 类别的像素也会被预测成 0-18,这是否会影响模型的推理输出呢？

语义分割数据集以城市为单位划分，分成了 train:2975张， validation:500张, test:1525张,
与 KITTI/CamVid/DUS数据集进行对比，

更多的交通参与实例(汽车和人)

human和 vehicle数量分布，与 Caltech和 KITTI对比

立体信息,汽车到相机距离的分布

; 目录结构

示例:

.
├── gtBbox3d
│   ├── test
│   │   ├── berlin
│   │   ├── bielefeld
│   │   ├── bonn
│   │   ├── leverkusen
│   │   ├── mainz
│   │   └── munich
│   ├── train
│   │   ├── aachen
│   │   ├── bochum
│   │   ├── bremen
│   │   ├── cologne
│   │   ├── darmstadt
│   │   ├── dusseldorf
│   │   ├── erfurt
│   │   ├── hamburg
│   │   ├── hanover
│   │   ├── jena
│   │   ├── krefeld
│   │   ├── monchengladbach
│   │   ├── strasbourg
│   │   ├── stuttgart
│   │   ├── tubingen
│   │   ├── ulm
│   │   ├── weimar
│   │   └── zurich
│   └── val
│   ├── frankfurt
│   ├── lindau
│   └── munster
├── gtFine
│   ├── test
│   │   ├── berlin
│   │   ├── bielefeld
│   │   ├── bonn
│   │   ├── leverkusen
│   │   ├── mainz
│   │   └── munich
│   ├── train
│   │   ├── aachen
│   │   ├── bochum
│   │   ├── bremen
│   │   ├── cologne
│   │   ├── darmstadt
│   │   ├── dusseldorf
│   │   ├── erfurt
│   │   ├── hamburg
│   │   ├── hanover
│   │   ├── jena
│   │   ├── krefeld
│   │   ├── monchengladbach
│   │   ├── strasbourg
│   │   ├── stuttgart
│   │   ├── tubingen
│   │   ├── ulm
│   │   ├── weimar
│   │   └── zurich
│   └── val
│   ├── frankfurt
│   ├── lindau
│   └── munster
├── leftImg8bit
│   ├── test
│   │   ├── berlin
│   │   ├── bielefeld
│   │   ├── bonn
│   │   ├── leverkusen
│   │   ├── mainz
│   │   └── munich
│   ├── train
│   │   ├── aachen
│   │   ├── bochum
│   │   ├── bremen
│   │   ├── cologne
│   │   ├── darmstadt
│   │   ├── dusseldorf
│   │   ├── erfurt
│   │   ├── hamburg
│   │   ├── hanover
│   │   ├── jena
│   │   ├── krefeld
│   │   ├── monchengladbach
│   │   ├── strasbourg
│   │   ├── stuttgart
│   │   ├── tubingen
│   │   ├── ulm
│   │   ├── weimar
│   │   └── zurich
│   └── val
│   ├── frankfurt
│   ├── lindau
│   └── munster

路径: {root}/{type}{video}/{split}/{city}/{city}_{seq:0>6}_{frame:0>6}_{type}{ext}
参数解读:

{root},数据集根路径，安装使用 cityscapesScripts提供的工具 csViewer和 csLabelTool等时，需先设置 export CITYSCAPES_DATASET={root}
type,数据的类型,如 gtFine精准标注的分割数据, leftImg8bit左目LDR图像等
split,可能的值有 train/val/test/train_extra/demoVideo等,有些可能时空的
city,采集数据的城市
seq,图像数据所在视频序列编码,6位数字
frame,图像所在视频帧的编码,6位数字
ext,文件扩展名,如标注的 json文件 _polygons.json,全景分割中使用的实例标签文件 instanceIds.png等

以上路径中的 type可选的值有:

gtFine,精准标注的 5000张数据的标注文件,同样划分成 train/val/test,对于每个图像对应的标注文件有以下几个:

aachen_000085_000019_gtFine_color.png
aachen_000085_000019_gtFine_instanceIds.png
aachen_000085_000019_gtFine_labelIds.png
aachen_000085_000019_gtFine_polygons.json

_gtFine_polygons.json,标注生成的 json文件,可用来生成 _instanceTrainIds.png和 _labelTrainIds.png
_labelIds.png,以 labelId展示的语义分割标签文件,
_instanceIds.png,以 labelId展示的实例分割标签文件
_color.png,可视化文件

在使用 gtFine中的数据做语义分割和实例分割模型训练时,需将标注文件转成 19个类的 TrainIds上,可以借助 cityscapesScripts中的 csCreateTrainIdLabelImgs和 csCreateTrainIdInstanceImgs工具生成以下图像:

aachen_000085_000019_gtFine_instanceTrainIds.png
aachen_000085_000019_gtFine_labelTrainIds.png

gtCoarse,粗略标注的 19998张图像
leftImg8bit,左目8位LDR图像
rightImg8bit右目8位LDR图像
gtBbox3d,2020年7月发布的3d 汽车检测的标注文件,对精准标注的 5000张图像标注了汽车的 3d检测框,可见论文Cityscapes 3D (Gählert et al., CVPRW ’20)
gtBboxCityPersons,17年发布的行人检测标注文件

cityscapesScripts中提供的工具主要有:

csViewer,可视化图像,及对应的标注文件,可调整透明度
csLabelTool,数据集使用的标注文件
csCreateTrainIdLabelImgs,根据 _polygons.json生成 labels.py中定义的 TrainIds语义分割标签图像
csCreateTrainIdInstanceImgs,根据 _polygons.json生成labels.py中定义的 TrainIds标签实例分割图像

详细的可以在cityscapesScripts中找到.

总结一下,这个 2015年公开的数据集,到现在可以支持验证的任务有:

语义分割
实例分割
全景语义分割
3D 物体检测(汽车)
行人检测

其有左目右目的数据和视差图,应该可以用来做单目深度估计网络的训练.

参考资料

1.https://www.cityscapes-dataset.com/dataset-overview/
2.https://github.com/mcordts/cityscapesScripts

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

Original: https://blog.csdn.net/lx_ros/article/details/125667076
Author: 恒友成
Title: (二)Cityscapes数据集简介

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/518589/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

八种点云聚类方法（二）— KMeans

本文为博主原创文章，未经博主允许不得转载。本文为专栏《python三维点云从基础到深度学习》系列文章，地址为”https://blog.csdn.net/suiying…

人工智能 2023年5月31日
00116
深度学习中的分类和回归（1）

回归与分类在深度学习中，有回归和分类这两类问题。回归问题预测的是一个连续值，比如预测房价；而分类问题输出的是多个值，输出i就代表将结果预测为i的置信度。回归：估计一个连续值分…

人工智能 2023年6月17日
0077
基于卷积神经网络的高光谱分类 CNN+高光谱+印度松数据集

基于卷积神经网络的高光谱分类一、研究现状只考虑到高光谱图像的光谱特征，即： 1、提取特征(小波变换、Gabor纹理分析、形态学剖面) 2、利用分类方法分类(支持向量机、决策树、…

人工智能 2023年6月30日
0094
KBQA 常用数据集之MetaQA

目录 1. 论文相关 2. 数据集概述 2.1 内容介绍 2.2 使用的知识库 2.3 数据统计 2.4 文件内容介绍 3. 模型性能比较论文相关 MetaQA [Zhang e…

人工智能 2023年5月24日
00143
随机森林算法（Random Forest）原理分析及Python实现

目录一、基础概念 * 1.监督式机器学习 2. 回归和分类 3. 决策树 4. 随机森林二、Random Forest 的构造 * 1. 算法实现 2.数据的随机选取 3. 待…

人工智能 2023年6月15日
0057
Anaconda 安装低版本tensorflow

在调试很多tensorflow框架下的代码的时候，会发现许多诸如contrib的模块，在2.0以后的版本都废弃了，针对这个问题翻阅了很多解决博问，发现大部分都是重新安装低版本的te…

人工智能 2023年5月23日
00100
基于OpenCV的模板匹配

模板匹配是一项在一幅图像中寻找与另一幅模板图像最匹配(相似)部分的技术。模板匹配不是基于直方图的, 而是通过在输入图像上滑动图像块(模板)同时比对相似度, 来对模板和输入图像进行匹…

人工智能 2023年6月20日
0080
Matlab：字符向量元胞数组

Matlab：字符向量元胞数组创建字符向量元胞数组访问元胞数组中的字符向量将元胞数组转换为字符串数组要将文本存储为字符向量，请将其用单引号引起来。通常，字符向量包含您视为单…

人工智能 2023年6月28日
0080
A Practical Approach to Constructing a Knowledge Graph for Cybersecurity 阅读笔记

A Practical Approach to Constructing a Knowledge Graph for Cybersecurity 阅读笔记 Article Back…

人工智能 2023年6月10日
0074
pytorch简单实现GCN

目录 1.引入 2 环境配置 3 代码分析 4 模型搭建论文：SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NE…

人工智能 2023年7月22日
0080
深度学习-nlp系列（3）文本分类（Bert+TextCNN）pytorch

在前面两章讲解了 bert 和 TextCNN 模型，用这两个模型来进行文本分类。那我们就可以试一下将这两个模型进行融合来进行文本分类。模型介绍我们知道在进行模型融合时，要注意…

人工智能 2023年7月20日
0051
【数据治理】数据元、元数据、主数据、参考数据概述

【数据治理】数据元、元数据、主数据、参考数据概述数据元什么是数据元：《GB/T 19488.1 电子政务数据元第1部分：设计和管理规范》里是这样定义的：数据元（Data …

人工智能 2023年7月14日
0077
carlini/audio_adversarial_examples源码安装方法

Nicholas Carlini是文章Audio Adversarial Examples: Targeted Attacks on Speech-to-Text的作者，他将自己的…

人工智能 2023年5月27日
0075
基于 transformers 的 generate() 方法实现多样化文本生成：参数含义和算法原理解读

一、前言最近在做文本生成，用到huggingface transformers库的文本生成 generate() 函数，是 GenerationMixin 类的实现（ class…

人工智能 2023年7月26日
00250
python——基于三层神经网络实现手写数字分类

文章目录前言一、神经网络组成二、代码实现 * 1.引入库 2.导入数据集 3.全连接层 4.ReLU激活函数层 5.Softmax损失层 6.网络训练与推断模块 7.完整流程…

人工智能 2023年7月1日
0089
【Java】总结一下Java中的JVM知识点

说一下 JVM 的主要组成部分？及其作用？通过从JVM物理结构图我们可以看到：1.JVM两个子系统：类加载子系统和执行引擎子系统；2.JVM两个组件：本地接口方法组件和内存空间组…

人工智能 2023年6月26日
0076

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

(二)Cityscapes数据集简介

文章目录

1.简介

; 目录结构

参考资料

大家都在看