yolov5ds训练步骤

2023年6月17日上午6:15 • 人工智能 • 阅读 104

参考链接
0、配置环境
1、下载预训练模型——推荐
2、准备数据集——非常关键
*
2-1、det文件夹下
–
2-2、seg文件夹下
–
- 1. getmask.py
- 2. segsplit.py
3、配置文件参数修改
*
3-1、models/segheads.yaml
3-2、data/voc.yaml
3-3、models/yolov5s.yaml
3-4、trainds.py
4、遇到的问题
*
4-1、运行trainds.py
4-2、运行detectds.py

参考链接

🍅yolov5ds：Yolov5同时进行目标检测和分割分割（yolov5ds作者的博客介绍）
github地址：👉yolov5ds
训练yolov5ds案例：用YOLOv5ds训练自己的数据集——同时检测和分割
对上训练yolov5ds案例的补充：用YOLOv5ds训练自己的数据集，注意点！
yolov5ds-断点训练、继续训练（yolov5同样使用）

以下步骤是参考：用YOLOv5ds训练自己的数据集——同时检测和分割

0、配置环境

不在赘述，跟YOLOv5差不多

1、下载预训练模型——推荐

在yolov5ds-main根目录新建weights文件夹

下载yolov5预训练模型Releases · ultralytics/yolov5 · GitHub放到weights文件夹中

我下载的是 yolov5s.pt，下面均以 yolov5s.pt为例

2、准备数据集——非常关键

在yolov5ds-main根目录新建 paper_data文件夹

paper_data文件夹下新建 det和 seg两个文件夹

det文件夹存放检测数据集

seg文件夹存放分割数据集

🍀对于数据集，我的整体步骤是：

（1）运行：paper_data/det/json2txt.py，生成json对应的txt文件

（2）运行：paper_data/det/split.py，以9:1划分train、val（没有划分test），存放到paper_data/det/ImageSet/Main

（3）运行：paper_data/det/voc_labels.py，通过（2）划分的数据集将文件绝对路径存放到相应txt中，存放到paper_data/det

（4）运行：paper_data/seg/getmask.py，将raw_data中所有的.png图片复制到paper_data/seg/labels中

（5）运行：paper_data/seg/segsplit.py，按照train.txt和val.txt划分到paper_data/seg/images或labels下的train、val文件夹下

❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀❀

关于以下我制作数据集的代码，我都分享出来了，有需要的好兄弟自取：👉百度网盘：paper_data

2-1、det文件夹下

images文件夹下存放 .jpg图像（或者.png格式）

labels文件夹下存放 .txt标签文件

Annotations文件夹下存放 xml标签文件（这个在训练过程其实用不到，只是如果标签文件是xml格式的话，就暂存在这个文件夹，然后会通过 3.voc_labels.py转换成txt格式且划分到labels中的train或val子文件下）

注：xml、txt文件应和对应图像名称相同

再注：

因为，我的数据集格式只有实例分割数据集：jpg图像+json格式标签，所以这里还多了json2txt.py文件
有xml检测标签的，就直接执行2、3步
*直接有txt，也只执行2、3步，但是第3步中要注释掉调用 convert_annotation(image_id)函数

1. json2txt.py

（1）paper_data/det/ json2txt.py，生成json对应的txt文件

import json
import os
import os.path
import re

def getclass(rootdir):
    classes = []
    for file in os.listdir(rootdir):
        load_f = open(os.path.join(rootdir, file), 'r')
        load_dict = json.load(load_f)
        objects = load_dict['shapes']

        for i in range(0, len(objects)):
            label = objects[i]['label']
            if label not in classes:
                classes.append(label)

    return classes

def image_id(rootdir):
    a = []

    for root, dirnames, filenames in os.walk(rootdir):
        for filename in filenames:
            filename = filename.strip('.json')
            a.append(filename)
    return a

def position(pos):

    x = []
    y = []
    nums = len(pos)
    for i in range(nums):
        x.append(pos[i][0])
        y.append(pos[i][1])
    x_max = max(x)
    x_min = min(x)
    y_max = max(y)
    y_min = min(y)
    b = (float(x_min), float(x_max), float(y_min), float(y_max))
    return b

def convert(size, box):

    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0 - 1
    y = (box[2] + box[3]) / 2.0 - 1
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)

def convert_annotation(rootdir, out_file, cls_list, image_id):

    load_f = open(rootdir + '/{0}.json'.format(image_id), 'r')
    load_dict = json.load(load_f)

    out_file = open(out_file + '/{0}.txt'.format(image_id), 'w')

    w = load_dict['imageWidth']
    h = load_dict['imageHeight']

    objects = load_dict['shapes']
    nums = len(objects)

    for i in range(0, nums):
        print(image_id + '第{}个'.format(i))
        pos = objects[i]['points']
        box = position(pos)
        bb = convert([w, h], box)

        cls = objects[i]['label']

        if re.match('Support', cls) is not None:
            cls_id = 0
        elif re.match('Bolt_hole', cls) is not None:
            cls_id = 1
        elif re.match('Grouting_hole', cls) is not None:
            cls_id = 2
        elif re.match('Cable', cls) is not None:
            cls_id = 3
        elif re.match('Pipe', cls) is not None:
            cls_id = 4
        elif re.match('Signal_light', cls) is not None:
            cls_id = 6
        elif re.match('Sign', cls) is not None:
            cls_id = 5
        elif re.match('Railway', cls) is not None:
            cls_id = 7
        elif re.match('PJB', cls) is not None:
            cls_id = 8
        elif re.match('Instrument_box', cls) is not None:
            cls_id = 9
        elif re.match('Crack', cls) is not None:
            cls_id = 10
        elif re.match('Falling_block', cls) is not None:
            cls_id = 11
        else:
            cls_id = -1

        out_file.write(str(cls_id) + " " + " ".join([str(round(a, 3)) for a in bb]) + '\n')

if __name__ == '__main__':

    rootdir = '../../raw_data/labels-json'

    cls_list = getclass(rootdir)
    print(cls_list)

    out_file = 'labels'
    if not os.path.exists(out_file):
        os.makedirs(out_file)

    ids = image_id(rootdir)

    for id in ids:
        convert_annotation(rootdir, out_file, cls_list, id)
        print(id + '.json' + '已转换')

    print('over!')

2. split.py

det文件夹下新建一个 split.py文件，使用下面代码生成 ImageSets，里面有一个 Main文件夹， Main文件夹里包括 test.txt、 train.txt、 trainval.txt、 val.txt四个文本文档

trainval.txt包含你数据集里所有图像名称
train.txt为数据集的训练集，为总数据集的90%
val.txt为数据集的验证集，为总数据集的10%
test.txt文件里是空的不用担心，因为没有划分测试集


import os
import random
import argparse

parser = argparse.ArgumentParser()

parser.add_argument('--xml_path', default='./images', type=str,
                    help='input xml label path')

parser.add_argument('--txt_path', default='./ImageSets/Main', type=str,
                    help='output txt label path')
opt = parser.parse_args()

trainval_percent = 1.0
train_percent = 0.9
xmlfilepath = opt.xml_path
txtsavepath = opt.txt_path
total_xml = os.listdir(xmlfilepath)
if not os.path.exists(txtsavepath):
    os.makedirs(txtsavepath)

num = len(total_xml)
list_index = range(num)
tv = int(num * trainval_percent)
tr = int(tv * train_percent)

random.seed(0)
trainval = random.sample(list_index, tv)
train = random.sample(trainval, tr)

file_trainval = open(txtsavepath + '/trainval.txt', 'w')
file_test = open(txtsavepath + '/test.txt', 'w')
file_train = open(txtsavepath + '/train.txt', 'w')
file_val = open(txtsavepath + '/val.txt', 'w')

for i in list_index:
    name = total_xml[i][:-4] + '\n'
    if i in trainval:
        file_trainval.write(name)
        if i in train:
            file_train.write(name)
        else:
            file_val.write(name)
    else:
        file_test.write(name)

file_trainval.close()
file_train.close()
file_val.close()
file_test.close()

3. voc_labels.py

更改记录：

添加了 abs()函数，以保证转换为txt时都是正数，不然可能运行代码时加载数据会出错
out_dir如果不存在则创建


import xml.etree.ElementTree as ET
import os
from os import getcwd

sets = ['train', 'val', 'test']
classes = ['Bolt_hole', 'Grouting_hole', 'Crack']
abs_path = os.getcwd()
print(abs_path)

def convert(size, box):
    dw = 1. / (size[0])
    dh = 1. / (size[1])
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return x, y, w, h

def convert_annotation(image_id):

    in_file = open(os.path.join(r'E:\A_new_dataset\A_tunnel_crack\labels_xml', f'{image_id}.xml'), encoding='UTF-8')
    out_dir = os.path.join(abs_path, 'labels')
    if not os.path.exists(out_dir):
        os.makedirs(out_dir)
    out_file = open(os.path.join(out_dir, f'{image_id}.txt'), 'w')

    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)
    for obj in root.iter('object'):
        cls = obj.find('name').text
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        b1, b2, b3, b4 = b

        if b2 > w:
            b2 = w
        if b4 > h:
            b4 = h
        b = (b1, b2, b3, b4)
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " + " ".join([str(abs(a)) for a in bb]) + '\n')

wd = getcwd()
for image_set in sets:
    if not os.path.exists('./labels'):
        os.makedirs('./labels')
    image_ids = open('./ImageSets/Main/%s.txt' % (image_set)).read().strip().split()
    list_file = open('./%s.txt' % (image_set), 'w')
    for image_id in image_ids:
        list_file.write(abs_path + '/images/%s.png\n' % (image_id))
        convert_annotation(image_id)
    list_file.close()

运行之后会在det目录下生成train.txt、test.txt、val.txt三个文件，对应的图像名称前加入了绝对路径

运行完以上代码后，det文件夹结构为：

2-2、seg文件夹下

images存放图像

labels存放分割图像，类似下面这种图

（经过下面的 segsplit.py代码后，会在images、labels里面分别创建train、val两个子文件夹，这里的train和val里的图要与上述提到的 det/Main/train.txt和 val.txt里分好的相对应）

注：labels图像应和images对应图像名称相同，格式为 png

这种图是用labelme标注后，使用labelme里自带的一个程序生成

可以参考我的这篇博文：labelme的安装、批量转换方法（版本号4.5.13）
用自己的数据集训练maskrcnn_沙雅云的博客-CSDN博客_maskrcnn训练自己的数据集

通过网上批量转换labelme生成的json代码，生成了如下的文件夹，然后下面的 getmask.py就是实现将这些文件夹中的label.png全部提出来放到一起

; 1. getmask.py

"""
将所有json转成的label.png拷贝到专门的文件夹
"""

import shutil
import os

json_dir = '../../raw_data/labels-json-labelmeout'
mask_dir = 'labels'

if not os.path.exists(mask_dir):
    os.makedirs(mask_dir)

jsonlist = os.listdir(json_dir)

for x in jsonlist:

    file_new_path = shutil.copy(os.path.join(json_dir, x, 'label.png'), os.path.join(mask_dir, x[:-5] + '.png'))
    print(x + '.png' + ' done.')

2. segsplit.py

import os
import shutil

"""
实现：
1. 将train.txt 和 val.txt中指定的原始图像【复制】到seg/images/train子文件或者val子文件
2. 将train.txt 和 val.txt中指定的原始图像对应的标签png图像，移动到seg/labels/train子文件夹或val子文件夹
"""

def openreadtxt(file_name):
    data = []
    f = open(file_name, 'r')
    for row in f.readlines():
        tmp_list = row.split('\n')[0]
        data.append(tmp_list)
    f.close()
    return data

if __name__ == '__main__':

    labels_dir = r'E:\A_new_dataset\A_tunnel_crack\masks'

    images_train_dir = './images/train'
    images_val_dir = './images.val'
    labels_train_dir = './labels/train'
    labels_val_dir = './labels/val'

    os.makedirs(images_train_dir)
    os.makedirs(images_val_dir)
    os.makedirs(labels_train_dir)
    os.makedirs(labels_val_dir)

    train_list = openreadtxt('../det/train.txt')
    val_list = openreadtxt('../det/val.txt')
    print(train_list, len(train_list))
    print(val_list, len(val_list))

    for file_path in train_list:
        file = file_path.split('/')[-1]
        filename, _ = os.path.splitext(file)

        shutil.copy(file_path, os.path.join(images_train_dir, file))

        labels_name = filename + '.png'
        shutil.copy(os.path.join(labels_dir, labels_name), os.path.join(labels_train_dir, labels_name))

    for file_path in val_list:
        file = file_path.split('/')[-1]
        filename, _ = os.path.splitext(file)

        shutil.copy(file_path, os.path.join(images_val_dir, file))

        labels_name = filename + '.png'
        shutil.copy(os.path.join(labels_dir, labels_name), os.path.join(labels_val_dir, labels_name))

经过以上两个代码之后的 paper_data/seg 文件夹结构：

到此，检测、分割的数据集都做好了，paper_data数据集总结构为：

3、配置文件参数修改

3-1、models/segheads.yaml

segnc：改为自己的分割类别数 + 1（这里一定要+1）

3-2、data/voc.yaml

train：改为自己det文件夹下train.txt路径
val：改为自己det文件夹下val.txt路径
road_seg_train：改为自己seg文件夹下images/train文件夹路径
road_seg_val：改为自己seg文件夹下images/val文件夹路径
nc：改为自己的检测类别数
segnc：改为自己的分割类别数（这里一定不要+1 ！！！）

3-3、models/yolov5s.yaml

nc：改为自己的检测类别数

3-4、trainds.py

parse_opt函数下修改对应 default里面的内容

关于resume断点训练、继续训练的方法：yolov5ds-断点训练、继续训练（yolov5同样适用）

; 4、遇到的问题

4-1、运行trainds.py

出现报错： RuntimeError: weight tensor should be defined either for all or no class at ...

原因：这个文件中计算分割损失时，没有初始化weight，所以无法设置weight（可能是我自己的torch.nn有问题？）

解决方案：在 trainds.py 中用 Ctrl+F 搜索定位到 SegLoss = nn.CrossEntropyLoss，然后去除掉里面的weight参数，改为以下：

SegLoss = nn.CrossEntropyLoss(ignore_index=255)

4-2、运行detectds.py

出现报错： RuntimeError: Input type (torch.cuda.HalfTensor) and weight type (torch.HalfTensor)

原因：输入放在的gpu上，权重却没有放在gpu上，导致数据类型不一致

解决方案：在 detectds.py 中用 Ctrl+F 搜索定位到 model = ckpts['model']位置，然后在下方加上一行代码：

model = model.cuda()

IndexError: index 1 is out of bounds for axis 0 with size 1

Original: https://blog.csdn.net/LWD19981223/article/details/125921793
Author: 孟孟单单
Title: yolov5ds训练步骤

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/628962/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Android端实现多人视频语音聊天｜音视频开发

1 多人视频通话功能本文展示了如何使用即构实时音视频SDK ZEGO Express SDK 构造多人视频通话场景，即实现多对多实时音视频互动。用户可在房间内与其余用户进行实时…

人工智能 2023年6月3日
00119
【OpenCV学习】（十）特征点检测与匹配

【OpenCV学习】（十）特征点检测与匹配背景提取图像的特征点是图像领域中的关键任务，不管在传统还是在深度学习的领域中，特征代表着图像的信息，对于分类、检测任务都是至关重要的；…

人工智能 2023年7月20日
0057
深度学习之bottleneck layer

一、 bottleneck layery中文名称：瓶颈层。我初次接触也就是在残差网络中。一般在较深的网络中，如resnet101中使用。一般的结构如下：其中两个1X1flite…

人工智能 2023年6月16日
0096
【YOLOV5-6.x讲解】YOLO5.0VS6.0版本对比+模型设计

主干目录：【YOLOV5-6.x 版本讲解】整体项目代码注释导航现在YOLOV5已经更新到6.X版本，现在网上很多还停留在5.X的源码注释上，因此特开一贴传承开源精神！5.X版本…

人工智能 2023年7月20日
0072
前端AST详解，手写babel插件

🐱个人主页：不叫猫先生🙋‍♂️作者简介：专注于前端领域各种技术，热衷分享，关注我会给你带来一些不一样的认知和成长。📝个人签名：不破不立 🍬本文目录 🥙一、前言 🥪二、节点介绍 🌮…

人工智能 2023年7月31日
00147
语音识别-基于CTC-BiLSTM联合模型的英语语音识别系统

本博客偏向实践，以 LibriSpeech公开英语语料数据集作为训练语料，搭建了基于CTC（Connectionist temporal classification）-BiLST…

人工智能 2023年5月25日
0094
深入浅出PyTorch（一）之mac安装

改用Linux了，笔记改到这里： https://blog.csdn.net/weixin_41794514/article/details/126850887?spm=1001….

人工智能 2023年7月23日
0065
TEB算法-2

RobotFootprintModel为机器人的模型基类，用来定义机器人的形状。但机器人模型类目前只用于优化，因为考虑到导航栈的足迹可能是低效的。因此，设置机器人的形状只是用来检测…

人工智能 2023年6月10日
0057
详解空域图像增强+频域图像增强

空域图像增强+频域图像增强文章目录空域图像增强+频域图像增强前言空域图像增强 * 一.灰度映射：点处理 – 1.图像求反（将灰度值翻转） 2.对数变换（动态范围…

人工智能 2023年6月20日
00122
node/npm/nvm node /以及镜像的安装和使用

node: 概述: Node.js发布于2009年5月，由Ryan Dahl开发，是一个基于ChromeV8引擎的JavaScript运行环境，使用了一个事件驱动、非阻塞式I/O模…

人工智能 2023年6月27日
0078
2022-2028年全球与中国化学抑尘剂行业市场深度调研及投资预测分析

本文研究全球与中国市场化学抑尘剂的发展现状及未来发展趋势，分别从生产和消费的角度分析化学抑尘剂的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点…

人工智能 2023年6月11日
0090
云云云云云云云云EasyDL 语音（3）

说明：是用零码自训练语音识别语言模型，声音分类模型。提高业务领域专有名词识别准确率，区分不同声音类别，广泛应用于行业数据采集录入、语音指令、呼叫中心、声音类型检测等应用场景。说白了…

人工智能 2023年5月23日
00101
【图像增强】基于高斯同态滤波实现图像增强附matlab代码

1 简介沙尘天气下采集得到的图像会呈现对比度下降,图像动态范围被压缩造成模糊不清等问题.针对在沙尘图像增强处理时传统单一图像增强方法存在的不足,融合了同态滤波与直方图均衡化的方法…

人工智能 2023年6月21日
00108
机器学习期末复习

一、前言接下来是对于机器学习期末复习题的问答与解析，按照知识点分布包括下面几个部分：二、模型评估与选择三、对数几率回归四、决策树五、神经网络六、支持向量机七、聚类分析八、K-N…

人工智能 2023年7月28日
0056
AI常用框架和工具丨2. 数据分析处理库Pandas

数据分析处理库Pandas，AI常用框架和工具之一。理论知识结合代码实例，希望对您有所帮助。文章目录 * – 环境说明 – 一、Pandas简介 &#82…

人工智能 2023年7月17日
0065
scMRA:一种健壮的深度学习方法，可以用多个参考数据集注释scRNA-seq数据

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、前言二、材料和方法三、结果四、讨论文章地址：https://academic.oup….

人工智能 2023年7月17日
0054

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31