swin-transformer训练自己的数据集＜自留＞

2023年6月25日上午10:34 • 人工智能 • 阅读 63

使用swin-transformer训练自己的数据集

前期准备（数据处理）
*
标注数据集
一、结构目录
二、要修改的地方
三、开始训练
四、训练过程结果

前期准备（数据处理）

标注数据集

LabelMe—-> COCO

LabelImg：能标注 VOC、YOLO格式数据集，标注VOC数据集尤其推荐
安装： pip install labelimg -i [http://mirrors.aliyun.com/pypi/simple/](http://mirrors.aliyun.com/pypi/simple/) --trusted-host mirrors.aliyun.com
启动：直接在命令中输入 labelimg 启动软件
①勾选 View – Auto Save mode：这样切换到下一张图时就会将标签文件自动保存在Change Save Dir设定的文件夹。
②Open Dir：选择图片所在的文件夹 JPEGimages
③Change Save Dir：选择保存标签文件要保存的目录 Annotations
快捷键
A：上一张图
D：下一张图
W：绘制矩形框

LabelImg—-> VOC

LabelMe：格式为LabelMe，提供了转VOC、COCO格式的脚本，可以标注矩形、圆形、线段、点。标注语义分割、实例分割数据集尤其推荐。
安装： pip install labelme -i [http://mirrors.aliyun.com/pypi/simple/](http://mirrors.aliyun.com/pypi/simple/) --trusted-host mirrors.aliyun.com
启动：直接在命令行输入 labelme 启动软件
①勾选 File->Automatically：这样切换到下一张图时就会将标签文件自动保存在Change Save Dir设定的文件夹。
②Open Dir：选择图片所在的文件夹 JPEGimages
File-> Change Output Dir：选择保存标签文件所在的目录 Annotations
③Edit -> Create Rectangle：选中，开始画矩形框
④注：如果想删除某个框，需要先点击左侧 Edit Polygons，然后再选择你要删的框，点击del键
快捷键
A：上一张图
D：下一张图
Ctrl + R：画矩形框

VOC 转COCO
在github上下载运行，把voc数据集改为CoCo数据集
注：把数据在网站中格式化处理，可以看到数据集中的每个类别

一、结构目录

annotations下包含的是标签文件，分别有测试集（test）训练集（train）验证集（val）中间包含文件信息，目标位置信息

; 二、要修改的地方

类别修改configs/ base/models/ mask_rcnn_swin_fpn.py中的 num_classes


num_classes=4,

配置权重信息修改 configs/base/ default_runtime.py 中的 interval，loadfrom
interval：dict(interval=1) # 表示多少个 epoch 验证一次，然后保存一次权重信息
loadfrom：表示加载哪一个训练好（预训练）的权重，可以直接写绝对路径如： load_from = r"E:\workspace\Python\Pytorch\Swin-Transformer-Object-Detection\mask_rcnn_swin_tiny_patch4_window7.pth"
修改训练图片尺寸大小：如果显存够的话可以不改（基本都运行不起来），文件位置为：configs/swin/ mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py

修改所有的 img_scale 为：img_scale = [(224, 224)] 或者 img_scale = [(256, 256)] 或者 480，512等。

同时 configs/base/datasets/ coco_instance.py 中的 img_scale 也要改成 img_scale = [(224, 224)] 或者其他值
注意：值应该为32的倍数，大小根据显存或者显卡的性能自行调整

配置数据集路径：configs/base/datasets/ coco_instance.py
修改 data_root文件的最上面指定了数据集的路径，因此在项目下新建 data/coco目录，下面四个子目录 annotations和test2017，train2017，val2017。
修改该文件下的 train val test 的路径为自己新建的路径：configs/base/datasets/ coco_instance.py
修改 batch size 和线程数，路径：configs/base/datasets/ coco_instance.py ，根据自己的显存和CPU来设置

samples_per_gpu=8,
workers_per_gpu=4,

7. 修改分类数组：mmdet/datasets/ coco.py
CLASSES中填写自己的分类：

CLASSES = ('person', 'bicycle', 'car')

8. 修改最大epoch configs/swin/ mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py
修改72行：runner = dict(type=’EpochBasedRunnerAmp’, max_epochs= 36)#最大epochs
swin-transformer训练自己的数据集＜自留＞

三、开始训练

在终端输入

python tools/train.py configs\swin\mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py

解释：执行tools下train.py文件——传入configs\swin\mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_3x_coco.py 这个参数（这个参数就是我们要使用的网络）

四、训练过程结果

2. 最后生成结果，会在项目根目录下生成work_dirs文件夹

log：保存训练时终端打印的日志
epoch.pth：我们得到的权重文件
lastest.pth:最新保存的权重文件

Original: https://blog.csdn.net/qq_45720073/article/details/125772205
Author: 壹万1w
Title: swin-transformer训练自己的数据集＜自留＞

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/650751/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

举例说明银行如何做反欺诈

金融交易面对严峻的欺诈环境，目前仍有三大急需解决的问题。一是欺诈风险监控需要更丰富的基础数据，二是欺诈风险监控需要更精准的模型方法，三是欺诈风险监控需要更及时的干预措施。面对上述挑…

人工智能 2023年7月17日
0051
关于label smoothing(标签平滑)

目的： label smoothing常用于分类任务，防止模型在训练中过拟合，提高模型的泛化能力。意义：对于分类问题，我们通常使用one-hot编码，”非黑即白&#…

人工智能 2023年7月22日
0039
python-OpenCV视频常规处理（六）

一、视频处理 opencv不仅能够处理图像，还能够处理视频，视频是由大量的图像构成的，这些图像是以固定的时间间隔从视频中获取的，这样就能够使得图像处理的方法对这些图像进行处理，进而…

人工智能 2023年7月18日
0071
YOLOP个人数据代码复现

私聊我拉你进群交流一 . YOLOP算法介绍 YOLOP算法是用于全景驾驶感知算法！集成目标检测/可行驶区域分割和车道线检测三大视觉任务同时处理.YOLOP 是第一个可以在嵌入式…

人工智能 2023年5月26日
0079
OpenGL之环境映射

1.1 环境映射（Environment Mapping）具有光滑表面的物体会反射形成周围环境的影响，是一种环境光效果。光线跟踪等(全局光照)可以实现这种效果，但是效率太低，可以…

人工智能 2023年6月30日
0070
离线学习(岭回归)

学习规则—离线学习(岭回归) 离线学习(岭回归) 离线学习规则是机器学习领域最常见的学习规则。它包括梯度下降和线性回归，在储层计算领域，线性回归可能是最简单以及最常用的训练人工神经…

人工智能 2023年6月18日
0068
SSM框架实现登录注册功能

刚刚写出来的SSM登录注册案例，网上随便翻一下都有，本篇直接上手，使用Maven工程搭建一个简单的SSM框架实现简单的登录注册，验证重名功能。目录项目结构图持久层相关配置文…

人工智能 2023年7月29日
0084
echarts散点图加趋势线_如何采用Excel绘制简单散点图、分组散点图并拟合回归直线？…

散点图用点的密集程度和趋势表示两个连续变量间的相关关系和变化趋势。经常用于相关、回归分析之前。本讲目的：绘制如下的图形简单散点图分组散点图 1 简单散点图：两个连续变量之间的…

人工智能 2023年6月18日
0070
银行账户实验-1.1

实验目的与要求模仿个人银行账户管理系统的C++版本（第4章-第8章），使用Java语言重新实现该系统，比较C++与Java在实现上的异同，熟练掌握Java基础及语法。根据系统需…

人工智能 2023年6月4日
0067
关系抽取新SOTA: 《A Frustratingly Easy Approach for Joint Entity and Relation Extraction》论文笔记

一、前言关系抽取作为知识图谱三元组抽取任务中最最重要的算法，一直受到工业界和学术界的广泛研究。关系抽取任务要做的是识别文本中的实体，并对相应的实体词预测正确的关系。其主要可以归纳…

人工智能 2023年6月1日
00120
图像处理中常用的相似度评估指标

导读有时候我们想要计算两张图片是否相似，而用来衡量两张图片相似度的算法也有很多，例如： RMSE、 PSNR、 SSIM、 UQI、 SIFT以及 深&am…

人工智能 2023年5月26日
0085
Ubuntu系统安装opencv详细操作及具体应用

Ubuntu系统安装opencv详细操作及具体应用前言一、opencv是个什么东西二、opencv的安装 * 1、资源准备及前期准备 2、安装编译 3、配置更改 4、验证版本…

人工智能 2023年5月26日
0066
pandas – merge 函数

All default pd.merge( left, right, how="inner", on=None, left_on=None, right_on=…

人工智能 2023年7月17日
0041
详解3D物体检测模型: Voxel Transformer for 3D Object Detection

本文介绍一个新的的3D物体检测模型： VoTr，论文已收录于 ICCV 2021。这是第一篇使用 voxel-based Transformer 做3D 主干网络，用于点云数据3…

人工智能 2023年7月9日
0060
R语言使用＜-操作符创建新的变量、使用attach函数绑定数据、直接使用两个数据列名称通过加和创建新的数据列（sum variables to make new featurs in datafram

好的，我来给你讲解一下。首先，我们需要使用 pandas 库来处理数据。假设我们有一个名为 df 的数据_表，我们可以 _使用_以下代码来 _创建_市局透视表和交叉表： p…

人工智能 2023年7月18日
0037
树莓派4+TensorFlow+OpenCV+英特尔加速棒环境搭建

文章目录一、树莓派系统烧录二、更换源 * 2.1、设置root登录密码 2.2、更换apt 源 – 2.2.1、先备份源文件 2.2.2、编辑系统源文件 2.2.3…

人工智能 2023年5月26日
0098

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

swin-transformer训练自己的数据集＜自留＞

使用swin-transformer训练自己的数据集

标注数据集

大家都在看