(二)Cityscapes数据集简介

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

文章目录

*
1.简介
目录结构
参考资料

1.简介

Daimler AG现在称为 Mercedes-Benz研发中心和达姆施塔特工业大学(德语: Technische Universität Darmstadt)研究人员开放的数据集,论文发表在2016年的 CVPRcityscapess采集自德国及附近国家的50个城市,包括了春夏秋三个季节的街区场景,且使用双目相机的获取了立体视觉视频序列。研究人员认为雨雪等极端天气需要特殊的处理方法和数据集进行研究,因此在 cityscapess数据集中没有采集此类数据。数据采集使用的是 1/3英寸 CMOS 2MP sensors (OnSemi安森美
AR0331),帧率为 17的卷帘相机,包括左目和右目,基线距离 22cm,采集的是色彩深度为 16位的的HDR图像。

数据集有选自 27个城市的 5000张图像进行了 pixel-level像素级的语义和实例标注,可用于训练语义分割网络,这5000张中的每一张都取自于对应的一个包含30帧的视频序列的第20帧,剩余 23个城市的 20000张图像进行了粗略标注,这20000张图像是每间隔20s或汽车行驶20m采集一张得到的。精标一张数据平均 1.5h,粗标一张数据 7min。不同的标注人员对选出来的30张数据进行重复标注,像素一致性达 96%,去除可标注为 unclear的类别后,像素一致性达 98%

分割数据集包含了 33个类,因部分类别数据量过于稀少,在验证数据集上,只有 19个语义分割类,因此要根据 *_polygons.json文件生成 *_labelTrainIds.png用以训练语义分割网络,可借助 cityscapesScripts工程中的 cityscapesscripts/preparation/createTrainIdLabelImgs.py脚本,在语义分割的 5000张图像的标注文件中,转换后训练时设置成 ignore_indexe的类别 255的像素个数分布为 max: 1105427.0, min: 114462.0, avg: 263878.772,图像大小是 2048x1024, 255的占比最高大于 50%有个问题就是,使用语义分割模型测试输入一张图像,其输出每个像素的类别,这些类别都在 0-18 上,是无法预测出 255 这种类别的,对于在标签文件上本来属于 255 类别的像素也会被预测成 0-18,这是否会影响模型的推理输出呢?

语义分割数据集以城市为单位划分,分成了 train:2975张, validation:500张, test:1525张,
KITTI/CamVid/DUS数据集进行对比,

  • 更多的交通参与实例(汽车和人)

(二)Cityscapes数据集简介
  • humanvehicle数量分布,与 CaltechKITTI对比

(二)Cityscapes数据集简介
  • 立体信息,汽车到相机距离的分布

(二)Cityscapes数据集简介

; 目录结构

示例:

.
├── gtBbox3d
│   ├── test
│   │   ├── berlin
│   │   ├── bielefeld
│   │   ├── bonn
│   │   ├── leverkusen
│   │   ├── mainz
│   │   └── munich
│   ├── train
│   │   ├── aachen
│   │   ├── bochum
│   │   ├── bremen
│   │   ├── cologne
│   │   ├── darmstadt
│   │   ├── dusseldorf
│   │   ├── erfurt
│   │   ├── hamburg
│   │   ├── hanover
│   │   ├── jena
│   │   ├── krefeld
│   │   ├── monchengladbach
│   │   ├── strasbourg
│   │   ├── stuttgart
│   │   ├── tubingen
│   │   ├── ulm
│   │   ├── weimar
│   │   └── zurich
│   └── val
│   ├── frankfurt
│   ├── lindau
│   └── munster
├── gtFine
│   ├── test
│   │   ├── berlin
│   │   ├── bielefeld
│   │   ├── bonn
│   │   ├── leverkusen
│   │   ├── mainz
│   │   └── munich
│   ├── train
│   │   ├── aachen
│   │   ├── bochum
│   │   ├── bremen
│   │   ├── cologne
│   │   ├── darmstadt
│   │   ├── dusseldorf
│   │   ├── erfurt
│   │   ├── hamburg
│   │   ├── hanover
│   │   ├── jena
│   │   ├── krefeld
│   │   ├── monchengladbach
│   │   ├── strasbourg
│   │   ├── stuttgart
│   │   ├── tubingen
│   │   ├── ulm
│   │   ├── weimar
│   │   └── zurich
│   └── val
│   ├── frankfurt
│   ├── lindau
│   └── munster
├── leftImg8bit
│   ├── test
│   │   ├── berlin
│   │   ├── bielefeld
│   │   ├── bonn
│   │   ├── leverkusen
│   │   ├── mainz
│   │   └── munich
│   ├── train
│   │   ├── aachen
│   │   ├── bochum
│   │   ├── bremen
│   │   ├── cologne
│   │   ├── darmstadt
│   │   ├── dusseldorf
│   │   ├── erfurt
│   │   ├── hamburg
│   │   ├── hanover
│   │   ├── jena
│   │   ├── krefeld
│   │   ├── monchengladbach
│   │   ├── strasbourg
│   │   ├── stuttgart
│   │   ├── tubingen
│   │   ├── ulm
│   │   ├── weimar
│   │   └── zurich
│   └── val
│   ├── frankfurt
│   ├── lindau
│   └── munster

路径: {root}/{type}{video}/{split}/{city}/{city}_{seq:0>6}_{frame:0>6}_{type}{ext}
参数解读:

  • {root},数据集根路径,安装使用 cityscapesScripts提供的工具 csViewercsLabelTool等时,需先设置 export CITYSCAPES_DATASET={root}
  • type,数据的类型,如 gtFine精准标注的分割数据, leftImg8bit左目LDR图像等
  • split,可能的值有 train/val/test/train_extra/demoVideo等,有些可能时空的
  • city,采集数据的城市
  • seq,图像数据所在视频序列编码,6位数字
  • frame,图像所在视频帧的编码,6位数字
  • ext,文件扩展名,如标注的 json文件 _polygons.json,全景分割中使用的实例标签文件 instanceIds.png

以上路径中的 type可选的值有:

  • gtFine,精准标注的 5000张数据的标注文件,同样划分成 train/val/test,对于每个图像对应的标注文件有以下几个:
aachen_000085_000019_gtFine_color.png
aachen_000085_000019_gtFine_instanceIds.png
aachen_000085_000019_gtFine_labelIds.png
aachen_000085_000019_gtFine_polygons.json
  • _gtFine_polygons.json,标注生成的 json文件,可用来生成 _instanceTrainIds.png_labelTrainIds.png
  • _labelIds.png,以 labelId展示的语义分割标签文件,
  • _instanceIds.png,以 labelId展示的实例分割标签文件
  • _color.png,可视化文件

在使用 gtFine中的数据做语义分割和实例分割模型训练时,需将标注文件转成 19个类的 TrainIds上,可以借助 cityscapesScripts中的 csCreateTrainIdLabelImgscsCreateTrainIdInstanceImgs工具生成以下图像:

aachen_000085_000019_gtFine_instanceTrainIds.png
aachen_000085_000019_gtFine_labelTrainIds.png
  • gtCoarse,粗略标注的 19998张图像
  • leftImg8bit,左目8位LDR图像
  • rightImg8bit右目8位LDR图像
  • gtBbox3d,2020年7月发布的3d 汽车检测的标注文件,对精准标注的 5000张图像标注了汽车的 3d检测框,可见论文Cityscapes 3D (Gählert et al., CVPRW ’20)
  • gtBboxCityPersons,17年发布的行人检测标注文件

cityscapesScripts中提供的工具主要有:

  • csViewer,可视化图像,及对应的标注文件,可调整透明度
  • csLabelTool,数据集使用的标注文件
  • csCreateTrainIdLabelImgs,根据 _polygons.json生成 labels.py中定义的 TrainIds语义分割标签图像
  • csCreateTrainIdInstanceImgs,根据 _polygons.json生成labels.py中定义的 TrainIds标签实例分割图像

详细的可以在cityscapesScripts中找到.

总结一下,这个 2015年公开的数据集,到现在可以支持验证的任务有:

  • 语义分割
  • 实例分割
  • 全景语义分割
  • 3D 物体检测(汽车)
  • 行人检测

其有左目右目的数据和视差图,应该可以用来做单目深度估计网络的训练.

参考资料

1.https://www.cityscapes-dataset.com/dataset-overview/
2.https://github.com/mcordts/cityscapesScripts

欢迎访问个人网络日志🌹🌹知行空间🌹🌹

Original: https://blog.csdn.net/lx_ros/article/details/125667076
Author: 恒友成
Title: (二)Cityscapes数据集简介

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/518589/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球