使用mmsegmentation训练自己的模型

2023年7月22日下午3:58 • 人工智能 • 阅读 90

1. 学习前言

mmsegmentation是一个基于ptorch的语义分割代码库，其中复现了众多先进的分割模型。由于代码风格统一，功能齐全，我打算用mmseg来跑对比实验。

本文使用mmseg中的segmenter模型来运行自己的数据集。自定义的数据集包含背景有8类(7类目标+1类背景），RGB图，图像大小不定，按照ade20k的数据样式排列。

全文只涉及跑segmenter的最小单元，仅适合入门。我理解错误的地方，还请大家能多多指正。

PS：我跑出来的效果并不好，这大概就是生搬硬套的代价吧

2. 数据准备

首先要模仿ade20k存放数据的风格来规划自己的数据集。
ade20k中图像是jpg格式，ground truth是png格式。存放结构如下图所示， ade20k和ADEChallengeData2016这些名字可以改成自己数据集的名，比如我的就叫tiger和tiger_roi

ade20k/
    |ADEChallengeData2016/
    |               |annotations/
    |               |       |training/
    |               |       |validation/
    |               |images/
    |               |       |training/
    |               |       |validation/

自定义数据：

tiger/
    |tiger_roi/
    |       |annotations/
    |       |       |training/
    |       |       |validation/
    |       |images/
    |       |       |training/
    |       |       |validation/

3. 环境准备

需要安装mmcv和mmsegmentation
github上官方文档有安装方法，我个人实际操作待更新

4. 数据丢进mmsegmentation的文件夹里

来到mmsegmentation文件中，新建一个空的文件夹，命名为data。然后把刚刚自定义的数据集拖进来。

5. 修改config文件

想让程序跑起来，只需要一行命令

cd mmsegmentation
python tools/train.py &#x914D;&#x7F6E;&#x6587;&#x4EF6;

所以我们现在来看看这个配置文件是什么

对于segmenter模型来说，他的配置文件在mmsegmentation/configs/segmenter/，就是这几个红框圈中py文件，根据需求使用其一就可以。我认为配置文件其实就是设定参数（这几个区别没有仔细研究）

那我们打开第一个看看（segmenter_vit-b_mask_8x1_512x512_160k_ade20k.py）

_base_ = [
    '../_base_/models/segmenter_vit-b16_mask.py',
    '../_base_/datasets/ade20k.py', '../_base_/default_runtime.py',
    '../_base_/schedules/schedule_160k.py'
]
optimizer = dict(lr=0.001, weight_decay=0.0)

img_norm_cfg = dict(
    mean=[127.5, 127.5, 127.5], std=[127.5, 127.5, 127.5], to_rgb=True)
crop_size = (512, 512)
train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations', reduce_zero_label=True),
    dict(type='Resize', img_scale=(2048, 512), ratio_range=(0.5, 2.0)),
    dict(type='RandomCrop', crop_size=crop_size, cat_max_ratio=0.75),
    dict(type='RandomFlip', prob=0.5),
    dict(type='PhotoMetricDistortion'),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size=crop_size, pad_val=0, seg_pad_val=255),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_semantic_seg'])
]
test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='MultiScaleFlipAug',
        img_scale=(2048, 512),
        # img_ratios=[0.5, 0.75, 1.0, 1.25, 1.5, 1.75],
        flip=False,
        transforms=[
            dict(type='Resize', keep_ratio=True),
            dict(type='RandomFlip'),
            dict(type='Normalize', **img_norm_cfg),
            dict(type='ImageToTensor', keys=['img']),
            dict(type='Collect', keys=['img'])
        ])
]
data = dict(
    # num_gpus: 8 -> batch_size: 8
    samples_per_gpu=1,
    train=dict(pipeline=train_pipeline),
    val=dict(pipeline=test_pipeline),
    test=dict(pipeline=test_pipeline))

看不懂，没关系！这个里面用的是ade20k数据集，我自己的数据集只是和ade20k的类别和路径不同罢了。所以只要找到哪里是数据路径，哪里是类别数，这个实验就完成了。（bushi

这个文件中的

_base_ = [
    '../_base_/models/segmenter_vit-b16_mask.py',
    '../_base_/datasets/ade20k.py', '../_base_/default_runtime.py',
    '../_base_/schedules/schedule_160k.py'
]

代表这个配置文件也是继承自以上四个py文件里，以我多年copy代码的经验，我要改的地方就在…/ base/datasets/ade20k.py。

那我们去…/ base/datasets/ade20k.py看看

dataset settings
dataset_type = 'ADE20KDataset'
data_root = 'data/ade/ADEChallengeData2016'
img_norm_cfg = dict(
    mean=[123.675, 116.28, 103.53], std=[58.395, 57.12, 57.375], to_rgb=True)
crop_size = (512, 512)
train_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(type='LoadAnnotations', reduce_zero_label=True),
    dict(type='Resize', img_scale=(2048, 512), ratio_range=(0.5, 2.0)),
    dict(type='RandomCrop', crop_size=crop_size, cat_max_ratio=0.75),
    dict(type='RandomFlip', prob=0.5),
    dict(type='PhotoMetricDistortion'),
    dict(type='Normalize', **img_norm_cfg),
    dict(type='Pad', size=crop_size, pad_val=0, seg_pad_val=255),
    dict(type='DefaultFormatBundle'),
    dict(type='Collect', keys=['img', 'gt_semantic_seg']),
]
test_pipeline = [
    dict(type='LoadImageFromFile'),
    dict(
        type='MultiScaleFlipAug',
        img_scale=(2048, 512),
        # img_ratios=[0.5, 0.75, 1.0, 1.25, 1.5, 1.75],
        flip=False,
        transforms=[
            dict(type='Resize', keep_ratio=True),
            dict(type='RandomFlip'),
            dict(type='Normalize', **img_norm_cfg),
            dict(type='ImageToTensor', keys=['img']),
            dict(type='Collect', keys=['img']),
        ])
]
data = dict(
    samples_per_gpu=4,
    workers_per_gpu=4,
    train=dict(
        type=dataset_type,
        data_root=data_root,
        img_dir='images/training',
        ann_dir='annotations/training',
        pipeline=train_pipeline),
    val=dict(
        type=dataset_type,
        data_root=data_root,
        img_dir='images/validation',
        ann_dir='annotations/validation',
        pipeline=test_pipeline),
    test=dict(
        type=dataset_type,
        data_root=data_root,
        img_dir='images/validation',
        ann_dir='annotations/validation',
        pipeline=test_pipeline))

其中data_root = ‘data/ade/ADEChallengeData2016’数据路径，但是没找到类别数的定义，没关系，我们先把这个改成data_root = ‘data/tiger/tiger_roi’。（或者可以新建一个配置文件，但为了教程简洁，就不这么干了）

类别数的定义在…/ base/models/segmenter_vit-b16_mask.py
和刚刚的方法类似，找到num_classes=150，改成自定义数据集的类别（ade20k数据集中有150类目标+背景，Ground truth中0代表背景，1-150代表不同是物体。所以我也应该在这里设定目标类别，也就是num_classes=7。但是这样训练下来效果特别差，而且推理过程得到的结果0也并非代表实际的背景，希望大佬教教我这里）

到现在，配置文件就算是改完啦

6. 训练

cd mmsegmentation
python tools/train.py segmenter_vit-b_mask_8x1_512x512_160k_ade20k.py --work-dir [&#x653E;&#x65E5;&#x5FD7;&#x6587;&#x4EF6;&#x548C;&#x8BAD;&#x7EC3;&#x7ED3;&#x679C;&#x7684;&#x6587;&#x4EF6;&#x5939;]  --seed 0

7. 推理

官方demo

8. 学习后言

这改配置，多是一件美事。

Original: https://blog.csdn.net/gray___/article/details/124247411
Author: 胖琦今天也在摸鱼
Title: 使用mmsegmentation训练自己的模型

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/709204/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

SSD项目代码解析(pytroch)（一）

一、前言 SSD（Single Shot MultiBox Detector)是一种单阶段实时目标检测模型，在问世之初，取得了非常好的性能和实时检测能力，一度是最受欢迎的目标检测架…

人工智能 2023年7月23日
0082
VS配置永久OpenCV（小萌轻松操作）：超细致

VS配置永久OpenCV（小萌轻松操作）：超细致一、下载安装Visual Studio2022 1.进入：Visual Studio2022的官网，点击Community202…

人工智能 2023年7月26日
0085
opencv进行人脸识别并发送到stm32进行显示

一、项目基本介绍刷脸支付、刷脸乘车等以人脸识别为基础的应用在我们生活中使用的越来越多。基于此设计并制作一个人脸识别系统，可以实现以下功能：处理器通过摄像头采集图像，之后进行图像处…

人工智能 2023年6月23日
0093
NLP实战：面向中文电子病历的命名实体识别

一.前言本篇文章是关于NLP中的中文命名实体识别（Named Entity Recognition，NER）的实战项目，该项目利用了大型预训练语言模型BERT和BiLSTM神经网…

人工智能 2023年7月27日
0059
数据分析——Pandas（进阶）

编辑器：jupyter notebook 一、数据统计 import numpy as np import pandas as pd 1. 创建DataFrame对象生成100行…

人工智能 2023年7月7日
0071
动手强化学习（九）：策略梯度算法

动手强化学习（七）：DQN 改进算法——Dueling DQN 1. 简介 2. 策略梯度 3. REINFORCE 4. REINFORCE 代码实践 5. 小结 6. 扩展：策…

人工智能 2023年6月25日
0074
目标检测中如何定义正负样本，和正负样本在学习过程中loss计算起的作用

如何定义正负样本，和正负样本在学习过程中loss计算起的作用 * – 正负样本定义 – 分类和回归head如何学习和利用划分后的正负样本（loss如何计算）…

人工智能 2023年7月9日
0087
排序算法(一)

排序算法分类排序算法可以分为两大类：比较排序和非比较排序比较排序：可以分为交换排序，插入排序，选择排序和归并排序交换排序：冒泡排序和快速排序插入排序：简单插入排序、希尔排序选择排…

人工智能 2023年6月28日
0068
主管发话：一周搞不定用友U8 ERP跨业务数据分析，明天就可以“毕业”了

随着月末来临，又到了汇报总结的时刻。（图片来自网络）到了这个特殊时期，你的老板就一定想要查看企业整体的运转情况、销售业绩、客户实况分析、客户活跃度、Top10 sales、产…

人工智能 2023年7月16日
0060
栅格法分割地面点云

文章目录前言一、栅格法的主要方法二、处理步骤 * 1.函数入口 2.groundRemove函数伪代码及使用效果前言由于道路的非平面性质，来自3D激光扫描仪的点云还包括…

人工智能 2023年7月9日
0064
图卷积网络在推荐系统中的应用NGCF（Neural Graph Collaborative Filtering）配套pytorch的代码解释

注：本文所用到的代码及论文，文章底部有链接，可自行下载论文部分： 1、简单介绍概念知识：开发了一个新的推荐框架 Neural Graph Collaborative Filte…

人工智能 2023年7月22日
00121
Lane detection–CLRNet(Cross Layer Refinement Network for Lane Detection)总结

模型总结: 本文主要是对CLRNet的总结和自己的理解。有一部分还不理解。希望大佬们多教教。CLRNet论文链接CLRNet代码链接车道线检测的难点: 1. 低级语义信息检测的结…

人工智能 2023年6月25日
0068
MATLAB基础教程（10）——二维中的数据可视化

目录 MATLAB数据可视化绘图在同一个figure里面绘制多个图形本期小结 MATLAB数据可视化绘图绘制图形（二维）一般使用plot函数，这个函数一般能满足很多画图的…

人工智能 2023年6月22日
0067
Pandas分层索引入门教程（详解）

分层索引（Multiple Index）是 Pandas 中非常重要的索引类型，它指的是在一个轴上拥有多个（即两个以上）索引层数，这使得我们可以用低维度的结构来处理更高维的数据。比…

人工智能 2023年7月7日
0053
在部署AI算法时，如何进行性能评估和优化

问题：如何进行性能评估和优化AI算法部署？ 1. 介绍在部署AI算法时，性能评估和优化是关键步骤之一。通过性能评估，我们可以了解算法的表现，并对其进行进一步优化。本文将详细介绍如…

人工智能 2024年1月3日
0046
[PaperReading]CF-YOLO

CF-YOLO: Cross Fusion YOLO for Object Detection in Adverse Weather with a High-quality Rea…

人工智能 2023年6月20日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31