遥感影像数据集-DOTA

2023年6月10日下午11:35 • 人工智能 • 阅读 121

遥感影像的数据集大多数都包含了角度信息，并且目标相对较小，传统的目标检测在遥感影像的处理上效果不佳，比较常用的数据集有nwpu数据集和dota数据集，dota数据集来源谷歌地图，分辨率为4kx4k，需要做分割的处理，这里我主要记录一下整个分割的流程，以备后面不时之需。

数据集基本信息

[DOTA Dataset]是航空影像中物体检测的数据集，包含2806张图像，每张图像4000*4000分辨率。

数据版本类别数图像数图像尺寸实例数标注方式v1.0152806800~4000118282OBB + HBBv1.5162806800~4000400000OBB + HBB

注：OBB标注方式是指标注任意四边形；顶点按顺时针顺序排列。HBB标注方式是指标注示例的外接矩形。

DOTA数据集中总共有2806张图像，其中1411张图像作为训练集，458张图像作为评估集，剩余937张图像作为测试集。

具体的类别如下：

classnames_v1_5 = ['plane', 'baseball-diamond', 'bridge', 'ground-track-field', 'small-vehicle', 'large-vehicle', 'ship', 'tennis-court','basketball-court', 'storage-tank',
'soccer-ball-field', 'roundabout', 'harbor', 'swimming-pool', 'helicopter', 'container-crane']

classnames_v1_0 = ['plane', 'baseball-diamond', 'bridge', 'ground-track-field', 'small-vehicle', 'large-vehicle', 'ship', 'tennis-court','basketball-court', 'storage-tank',
'soccer-ball-field', 'roundabout', 'harbor', 'swimming-pool', 'helicopter']

标注文件的格式如下：

imagesource:GoogleEarth # &#x6765;&#x6E90;
gsd:0.146343590398 # &#x5730;&#x9762;&#x91C7;&#x6837;&#x8DDD;&#x79BB;
2238.0 1791.0 2254.0 1791.0 2254.0 1813.0 2238.0 1813.0 small-vehicle 1

四个点的坐标，类别和困难程度，其中类别是按照顺时针排列的

数据标注有两种方式：

第一种是标注旋转矩形，可以通过旋转矩形标注工具roLabelImg 来标注旋转矩形框。
第二种是标注四边形，通过脚本转成外接旋转矩形，这样得到的标注可能跟真实的物体框有一定误差。

然后将标注结果转换成coco标注格式，其中每个 bbox的格式为 [x_center, y_center, width, height, angle]，这里角度以弧度表示。

参考脊椎间盘数据集，我们将数据集划分为训练集(230)、测试集(57)，数据地址为：spine_coco 。该数据集图像数量比较少，使用这个数据集可以快速训练S2ANet模型。

开始处理

数据集我下载之后放在本地的 F:\BIGDATA\remote目录下

sudo apt-get install swig
swig -c++ -python polyiou.i
python setup.py build_ext --inplace

数据集解压之后按照这样的路径放置

-FileDir:
|_images: (DOTA img)
.................|_P0000.png
.................|_...

.................|_&#xD7;&#xD7;&#xD7;&#xD7;.png

|_labelTxt: (DOTA txt fotmat: poly classname 1/0)
.................|_P0000.txt
.................|_...

.................|_&#xD7;&#xD7;&#xD7;&#xD7;.txt

主要使用的代码有以下几个

DOTA.py 加载图片并绘制目标边框
ImgSplit.py 分割数据集
ResultMerge.py 将被分割数据集的检测结果合并,便于后续评估模型性能
dota_×_evaluation_task×.py 评估模型性能

下面将对代码的功能一一进行介绍：

DOTA.py 加载图片并绘制目标边框 demo中是按照类名加载所包含该类的图片并进行绘制，如果想加载指定图片看可视化的效果的话，直接在for循环中修改即可。
ImgSplit.py 分割数据集分割的方式有两种，一种是降低图片的分辨率，一种是直接将单张的遥感图片切割成多张图片，使用Paddle中提供的切割参数 crop_size=1024, stride=824, gap=200将图片切割成1024×1024的大小，步长是824，每张图片会有200的重叠区域，防止边缘信息的丢失，具体的调用如下。

&#x6211;&#x4EEC;&#x5C31;&#x5148;&#x8BBE;&#x7F6E;&#x4E0A;&#x9762;&#x7684;&#x53C2;&#x6570;&#x5373;&#x53EF;&#xFF0C;&#x5176;&#x4ED6;&#x7684;&#x9009;&#x62E9;&#x9ED8;&#x8BA4;
split = splitbase(
                    basepath='&#x5F85;&#x5206;&#x5272;&#x6570;&#x636E;&#x96C6;&#x6587;&#x4EF6;&#x8DEF;&#x5F84;',
                    outpath='&#x5206;&#x5272;&#x540E;&#x7684;&#x6570;&#x636E;&#x53CA;&#x6587;&#x4EF6;&#x4FDD;&#x5B58;&#x8DEF;&#x5F84;'
                    gap=&#x4E24;&#x5F20;&#x88AB;&#x5206;&#x5272;&#x56FE;&#x7247;&#x4E4B;&#x95F4;&#x7684;&#x91CD;&#x53E0;&#x533A;&#x57DF;,
                    subsize=&#x5206;&#x5272;&#x540E;&#x7684;&#x56FE;&#x7247;size,
                    thresh=&#x5982;&#x679C;&#x5B9E;&#x4F8B;&#x5728;&#x62C6;&#x5206;&#x8FC7;&#x7A0B;&#x4E2D;&#x88AB;&#x622A;&#x65AD;&#xFF0C;thresh&#x51B3;&#x5B9A;&#x662F;&#x5426;&#x4FDD;&#x7559;&#x5B9E;&#x4F8B;&#xFF0C;&#x9ED8;&#x8BA4;0.7
           )
split.splitdata(rate='&#x88C1;&#x526A;&#x524D;&#x5BF9;&#x56FE;&#x50CF;&#x8FDB;&#x884C;&#x6BD4;&#x4F8B;resize&#xFF0C;&#x8BE5;&#x53C2;&#x6570;&#x7528;&#x4E8E;&#x79BB;&#x7EBF;&#x591A;&#x5C3A;&#x5EA6;&#x88C1;&#x526A;')

&#x6CE8;&#x610F;&#xFF1A;&#x4E0D;&#x89C4;&#x5219;&#x56DB;&#x8FB9;&#x5F62;&#x5728;&#x88C1;&#x526A;&#x56FE;&#x50CF;&#x8FC7;&#x7A0B;&#x4E2D;&#x6709;&#x6982;&#x7387;&#x4F1A;&#x88AB;&#x622A;&#x65AD;&#xFF0C;&#x662F;&#x5426;&#x4FDD;&#x7559;&#x8BE5;&#x76EE;&#x6807;&#x53C2;&#x8003;&#x4EE5;&#x4E0B;&#x51E0;&#x79CD;&#x60C5;&#x51B5;&#xFF1A;
      1. &#x88AB;&#x622A;&#x65AD;&#x540E;&#x7684;&#x7269;&#x4F53;&#x5305;&#x7EDC;&#x6846;&#x9876;&#x70B9;&#x6570;&#x5C0F;&#x4E8E;4&#xFF0C;&#x8BE5;&#x76EE;&#x6807;&#x4E0D;&#x4FDD;&#x7559;
      2. &#x88AB;&#x622A;&#x65AD;&#x540E;&#x7684;&#x7269;&#x4F53;&#x5305;&#x7EDC;&#x6846;&#x9876;&#x70B9;&#x6570;&#x5927;&#x4E8E;5&#xFF0C;&#x8BE5;&#x76EE;&#x6807;&#x4E0D;&#x4FDD;&#x7559;
      3. &#x88AB;&#x622A;&#x65AD;&#x540E;&#x7684;&#x7269;&#x4F53;&#x5305;&#x7EDC;&#x6846;&#x4E0E;&#x539F;&#x59CB;&#x76EE;&#x6807;&#x8FB9;&#x6846;&#x91CD;&#x53E0;&#x533A;&#x57DF;&#x5360;&#x6BD4;&#x8D85;&#x8FC7;thresh&#x65F6;&#xFF0C;&#x6B63;&#x5E38;&#x4FDD;&#x7559;&#x76EE;&#x6807;
      4. &#x7B2C;3&#x79CD;&#x60C5;&#x51B5;&#x4E2D;&#x91CD;&#x53E0;&#x533A;&#x57DF;&#x5360;&#x6BD4;&#x4F4E;&#x4E8E;thresh&#x65F6;&#xFF0C;&#x76EE;&#x6807;&#x7684;diffcult&#x8BBE;&#x4E3A;2&#xFF0C;&#x5373;&#x66F4;&#x96BE;&#x8BC6;&#x522B;&#x7684;&#x76EE;&#x6807;

切割后的图片名称中包含了图片的位置信息，P0706__1__0__158.png 图片是将原图 P0706.png resize为原来的1倍，在width=0，height=158处进行裁剪，该位置信息在merge检测结果这一步骤中至关重要，因此不要更改切割后的图片以及label文件的文件名称。
* ResuleMerge.py 用于将分割之后的检测结果进行合并这俩基本整明白了，之后跑下基本的实验，佛了，家人们先把可视化整明白了吧佛了 ResuleMerge用于将分割结果进行合并，与上面的ImgSplit作用相反，利用被分割图像检测出的目标位置信息和图像名称中的裁剪位置信息，还原目标在原始未分割图像的位置，这样我们的检测结果才能正确绘制在原始图像上。裁剪图像中考虑到了重叠情况的出现，在merge之后添加了poly_NMS，用于计算任意四边形的IOU，这部分代码可以用在后面旋转框IOU的计算上面。详细的函数如下：

&#x5173;&#x952E;&#x51FD;&#x6570;:
    mergebypoly=(
                    srcpath='&#x5F85;merge&#x7684;&#x68C0;&#x6D4B;&#x7ED3;&#x679C;&#x6587;&#x672C;&#x6587;&#x4EF6;&#x4FDD;&#x5B58;&#x8DEF;&#x5F84;'
                    dstpath='merge&#x540E;&#x7684;&#x68C0;&#x6D4B;&#x7ED3;&#x679C;&#x6587;&#x672C;&#x6587;&#x4EF6;&#x4FDD;&#x5B58;&#x8DEF;&#x5F84;'
                )

待merge的检测结果文本文件需要遵循下列的数据格式：

[&#x76EE;&#x6807;&#x6240;&#x5C5E;&#x68C0;&#x6D4B;&#x56FE;&#x7247;(&#x5206;&#x5272;&#x540E;)&#x7684;&#x540D;&#x79F0;       confidence         poly(&#x8FD8;&#x539F;&#x524D;)]

merge之后的检测结果文本文件格式为：

 [&#x76EE;&#x6807;&#x6240;&#x5C5E;&#x539F;&#x56FE;&#x7684;&#x540D;&#x79F0;              confidence               poly(&#x8FD8;&#x539F;&#x540E;)]

注意: ResultMerge.py 函数中使用的 poly_nms不会区分不同的classid，它会将单个检测结果文本文件中的poly信息整合进一个列表进行NMS，即无视类别直接进行NMS。因此最好先将检测结果按类别存入文本文件中，再使用该函数进行检测结果的合并。
* dota_×_evaluation_task×.py 评估模型性能这里的这个文件主要是用来计算各个类别的AP和mAP，需要传入三个路径，函数的定义如下：

voc_eval(
                    detpath = r'.../Task1_{:s}.txt'
                    annopath = r'.../{:s}.txt'
                    imagesetfile = r'.../imgnamefile.txt'
                    ovthresh
                  )

detpath：是检测结果的文本文件，也就是合并之后的文本文件，要将所有检测出来的目标根据类别放入到对应的Task1_classname.txt中，数据格式如下：

[&#x6240;&#x5C5E;&#x56FE;&#x7247;&#x540D;&#x79F0;                 confidence                poly]

annopath：注释文本文件，即DOTA数据集的gt_labels文本文件，这里注意放入被检测的图片对应的文本文件即可。其数据格式如下：

 [poly           category          difficult]

imgnamefile：图像名称文本文件，用于检索图像对应的注释文件，其数据格式如下：

P0007
P0001
P0019
...

ovthresh：可用于设置 gt_poly 与 detection_poly 之间的IoU阈值,，超过该阈值则被认定为TP。运行demo可获得检测结果：

npos num: 118
ap:  0.879517382469394
map: 0.7317064576976655
classaps:  [67.64370381 87.46635739 49.62078363 87.95173825]

今天还是得出一份OBB的数据，这块我就直接转载原作者的博客了

该工具的主要的四个功能，在DOTA目标检测中是不可或缺的，但是每个功能之间又是相互独立的，无法无脑式的直接运行完一整套流程。这也可以理解，毕竟不同的项目处理数据的方式不同，最后的数据形式也不同，该工具在确保检测评估流程正常运行的同时给了大家自由发挥的空间。

项目中应用该工具的正常流程我认为应该是(以数据集DOTAv1.5_OBB为例):

Task1_plane.txt   format: [ P0001__1__0___0     confidence      poly       classname]

\5. 应用ResultMerge.py将所有 “原始图片名称”.txt 进行 merge和nms:

Task1_plane.txt(new)  format: [ P0001       confidence       poly(afterMerge)      classname]

6.写一个imgname2txt.py 将验证集的所有图片名称打印到namefile.txt中；

运行dota_×_evaluation_task×.py 评估模型性能。

整个工具的核心四部分已经介绍完毕，添加测试文件后的工程已上传至github，欢迎各位使用：

另外工程中还额外添加了 YOLO_Transform.py 与 Draw_DOTA_YOLO ，分别用于:

（b）将YOLO旋转目标labels(长边表示法:[classid x_c y_c longside shortside Θ]) 进行绘图。

YOLO DOTA格式转换原理讲解传送门：

[略略略：DOTA数据格式转YOLO数据格式工具(cv2.minAreaRect踩坑记录):24 赞同 · 41 评论文章

Original: https://blog.csdn.net/ECHOSON/article/details/120347766
Author: 肆十二
Title: 遥感影像数据集-DOTA

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/598091/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

全球及中国旋光仪行业发展格局分析及投资机会预测报告2022-2028年

全球及中国旋光仪行业发展格局分析及投资机会预测报告2022-2028年详情内容请咨询鸿晟信合研究网！【全新修订】：2022年3月【撰写单位】：鸿晟信合研究网1 旋光仪行业概述1….

人工智能 2023年6月11日
0081
K-近邻（考试版3）

K-近邻分类算法案例我的朋友海伦一直使用在线约会网站寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但她没有从中找到喜欢的人。经过一番总结，她发现曾交往过三种类型的人：&#…

人工智能 2023年7月1日
0078
【冰糖Python】PyTorch：最大值最小值 torch.max() torch.min() torch.maximum() torch.minimum()

获得 Tensor 元素中的最大值、最小值 1、torch.max() torch.max(input, dim, keepdim=False) 返回命名元组（最大值，最大值索引）…

人工智能 2023年7月23日
0077
MATALB创建LSTM，训练集精度高但是测试集精度很低是什么原因？

但是在训练过程中训练进度显示准确度已经达到100左右，但是测试精度只有50%。为了控制变量我甚至使用了相同的训练集和测试集，效果依然不一样。请问是什么问题呢？网络部分参考下文：…

人工智能 2023年7月13日
0085
CUDA 11.3安装

显卡驱动 1. 检查cuda对应driver版本： https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.ht…

人工智能 2023年7月21日
0056
热红外、可见光图像配准融合

热红外、可见光图像配准融合使用DJI M300RTK配备H20T云台相机进行光伏面板表面缺陷自动化检测。H20T云台相机配备一个2000w变焦镜头、一个1200w广角镜头、一个3…

人工智能 2023年6月22日
0088
Python图像处理丨图像的灰度线性变换

一.图像灰度线性变换原理图像的灰度线性变换是通过建立灰度映射来调整原始图像的灰度，从而改善图像的质量，凸显图像的细节，提高图像的对比度。灰度线性变换的计算公式如下所示：该公式中…

人工智能 2023年6月19日
0085
anaconda使用虚拟环境安装pytorch1.13+cuda11.7版（2022.11月测试有效）

要点：修改conda的源，用清华源，具体修改方法详见主要是要创建一个.condarc文件，内容改为下面这样的国内源。 ssl_verify: true channels: – …

人工智能 2023年6月30日
0077
PyTorch学习系列教程：构建一个深度学习模型需要哪几步？

导读继续PyTorch学习系列。前篇介绍了PyTorch中最为基础也最为核心的数据结构——Tensor，有了这些基本概念即可开始深度学习实践了。本篇围绕这一话题，本着提纲挈领删繁…

人工智能 2023年6月16日
0065
小爱同学app安卓版_小爱同学app下载安卓版-小爱同学安卓版v2.9.42-pc6手机下载…

小爱同学App是一款ai智能语音助手，拥有小米专用语音功能，可以和人一样交流，用户想看的想听的，只要告诉小爱同学就可以了，小爱就会从网络上帮助用户搜索需要的资源。功能介绍小艾是…

人工智能 2023年5月27日
00221
YOLOV5使用onnx转tensorrt(engine)

近几日完成ResNet相关实现engine方法，但仅仅基于基于简单分类网络实现转换，且基于Tensorrt C++ API 构建YLOV5实现engine转换相关资料较多，然调用O…

人工智能 2023年6月4日
0076
Pytorch —-注意力机制与自注意力机制的代码详解与使用

注意力机制的核心重点就是让网络关注到它更需要关注的地方。当我们使用卷积神经网络去处理图片的时候，我们会更希望卷积神经网络去注意应该注意的地方，而不是什么都关注，我们不可能手动…

人工智能 2023年7月25日
0083
【论文分享】☆☆☆ 异质图神经网络模型 HAN：Heterogeneous Graph Attention Network

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月14日
0090
启政务新视界，2022华为数字机器人秋季发布会9月8日正式开启

“十四五”规划和2035年远景目标纲要中明确提出，迎接数字时代，加快建设数字经济、数字社会、数字政府，以数字化转型整体驱动生产方式、生活方式和治理方式变革。…

人工智能 2023年6月4日
0098
【HuggingFace轻松上手】基于Wikipedia的知识增强预训练

【HuggingFace轻松上手】基于Wikipedia的知识增强预训练前记：预训练语言模型（Pre-trained Language Model，PLM）想必大家应该并不陌生，…

人工智能 2023年5月30日
0078
深度学习、机器学习领域毕业设计选题方法及建议

目录 1 .机器学习、深度学习选题方向 2.毕业论文命题（选题）技巧 3. 难度把控 3 最后 1 .机器学习、深度学习选题方向深度学习已经在语音识别、图像处理等方面取得了巨大成…

人工智能 2023年6月16日
0056

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

遥感影像数据集-DOTA

数据集基本信息

开始处理

大家都在看