YOLOV7训练自己的数据集，我先来试试火（VisDrone数据集）

2023年5月26日上午6:38 • 人工智能 • 阅读 77

源码：
https://github.com/WongKinYiu/yolov7
论文：
https://arxiv.org/abs/2207.02696

这个yolov7是yolov4团队的作品，我等着你yolov100。

; 背景

yolo系列已经成了大家学习工作中常用的目标检测网络，果然，yolov7又来了。一般人yolo取名到2亿都可以，但听说这个作者是yolov4的，我就来踩踩坑，试试火

代码

搭建环境，这里直接用conda按照源码requirements.txt安装就行。

（我yolov5环境(python3.7+torch1.8.0)都可以训练,我之前写过一篇几分钟搭建yolov5的文章）

数据准备

现成数据（VisDrone）+配置脚本(yolov7.yaml等)：

数据集:官方的VisDrone格式和yolov5的不同，要转换一下
这里我有转换好的，下载地址：4euh

制作自己数据集（lableme标注自己图片+labelme转yolo的脚本）：
强烈建议用labelme

labelme格式标注完就是一张图对应一个json：

yolo格式是一个图对应一个txt：

我是把转化完的txt和json都同一个文件夹下

标注软件：

labelme就一个exe文件50m左右，下载地址：8q3m，windows上下载后直接执行，非常方便

labelme转yolov5脚本：

（只写了检测的，labelme的分割、关键点等等脚本有机会写个总的）

import os
import json
import glob

labelme_dir=r"C:\Users\ttao\Pictures\my_"

def get_labelme_data(labelme_dir):

    with open(labelme_dir) as f:
        j=json.load(f)
        out_data=[]
        img_h =j["imageHeight"]
        img_w =j["imageWidth"]
        for shape in j["shapes"]:
            label=shape["label"]
            points=shape["points"]
            x,y,x2,y2=points[0][0],points[0][1],points[1][0],points[1][1]
            x_c=(x+x2)//2
            y_c=(y+y2)//2
            w=abs(x-x2)
            h=abs(y-y2)
            out_data.append([label,x_c,y_c,w,h])
    return img_h,img_w,out_data

def rename_Suffix(in_,mode=".txt"):
    in_=in_.split('.')
    return  in_[0]+mode

def make_yolo_data(in_dir):
    json_list=glob.glob(os.path.join(in_dir,'*.json'))

    for json_ in json_list:
        json_path=os.path.join(in_dir,json_)
        json_txt=rename_Suffix(json_)
        img_h,img_w,labelme_datas=get_labelme_data(json_path)
        with open(os.path.join(in_dir,json_txt),'w+') as f:
            for labelme_data in labelme_datas:
                label=labelme_data[0]
                x_c=labelme_data[1]/img_w
                y_c=labelme_data[2]/img_h
                w=labelme_data[3]/img_w
                h=labelme_data[4]/img_h
                f.write("{} {} {} {} {}\n".format(label,x_c,y_c,w,h))
            f.close()

if __name__ == '__main__':
    make_yolo_data(labelme_dir)

训练

配置：train.py+数据集配置文件（.yaml）+选择网络的配置文件（默认为yolov7.yaml）
👉Visdrone数据集
数据集是无人机角度拍摄的，中国各城市的，主要是各种汽车、人等数据集
我具体配置情况如下：

train.py
–cfg 模型选择，这里默认是yolov7

–data 数据格式配置，我这里是自己的VisDrone数据格式，训练yolo的要改，看下面训练自己数据集

–hyp 超参数，先不管

–batch-size 这个yolov7我设高了容易爆，小点

VisDrone.yaml

然后就可以训练了

👉自己的数据集
把上面的VisDrone.yaml换成yolo系列格式的yaml，
yolo系列例子：
比如我的灭火器数据集，exting.yaml如下

train: my_data/train_exting
val: my_data/val_exting

nc: 2
names: ['exting_s','exting_m']

和VisDrone不同的是，yolo系列数据格式这样放

接下来配置train.py就行了。

坑（我遇到的）：

1、首先如果中途报错有什么却库和少包，大概率就是torch环境问题，按照我yolov5搭建的方式没什么问题

原由：这里dataloader workers数量默认是8，当batch-size大，内存不够，报错
方法：
要么设置dataloader=1，但会降低训练速度，贼慢（但如果显卡本来就弱，那可能不全是cpu问题）
要么使用 FixNvPe.py 脚本，减少 MemoryPerProcess，不会降低训练速度。
具体方法（我也是看简书上大神的）

直接把VisDrone训练和测试集的label.cache删除

4、这个yolov7我2080ti，8g显存，batch_size=4，结果训练一段就爆显存。参考一下，自己改下batch_size，嫌弃太大的有个yolov7-tiny版本

最后总结：
yolov7是80多m，即使是yolov7-tiny的也是40多m，yolov5s大概17m（目前我jeston nano就是用这个部署的，飞桨的yolov5s可能20多m），yolo-fastest大概1.3m，想比较效果的自己可以去试试yolov5s和yolo-fatest等等。

Original: https://blog.csdn.net/qq_43117155/article/details/125672691
Author: he_eeeeeeeeeee
Title: YOLOV7训练自己的数据集，我先来试试火（VisDrone数据集）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/518439/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ChatGPT使用指南

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0067
IDEA断点调试快捷键

1.在开发中，新手程序员在查找错误时，这时老程序员就会温馨提示，可以用断点调试，步一步的看源码执行的过程，从而发现错误所在。2.重要提示: 在断点调试过程中，是运行状态，是以对象的…

人工智能 2023年6月29日
0038
matplotlib正常显示中文教程

文章目录 * – 问题展示 – + * 源码 * 结果 – 解决方法 – + 解决方法一 + * 源码 * 结果 + 解决方法二 +…

人工智能 2023年7月17日
0065
数据分析三、pandas库分组聚合与数据可视化

分组聚合与数据可视化一、分组聚合 * 1.1、单层分组聚合：df.groupby(by)[‘列索引’].mean()。 – 1.1.1单层分组…

人工智能 2023年7月8日
00108
ResNet原理与实战

目录 ResNet原理 ResNet实战程序各个网络的区别： ResNet原理 resNet诞生于2015年，是当年ImageNet竞赛的冠军，Top5的错误率为3.57%，Re…

人工智能 2023年5月26日
0069
【朴素贝叶斯】深入浅出讲解朴素贝叶斯算法（公式、原理）

朴素贝叶斯（Naive Bayes）是一种简单经典的分类算法，它的经典应用案例为人所熟知：文本分类（如垃圾邮件过滤）。 1、贝叶斯定理先验概率：即基于统计的概率，是基于以往历史经…

人工智能 2023年7月3日
0063
数据科学你得知道的几种分布（下）[泊松分布，卡方分布，Beta分布]

一、泊松分布泊松分布是一种在随机时间空间中的概率分布经典的应用场景有”一本书一页中的印刷错误””某地区在一天内邮递遗失的信件数”…

人工智能 2023年7月17日
0089
目标检测——【Transformer】Accelerating DETR Convergence via Semantic-Aligned Matching

目录文章侧重点 * 想要解决的问题： Sematic-Aligned-Matching DERT 网络结构 * SAM-DERT Semantics Aligner &#8211…

人工智能 2023年7月11日
0080
2022完整版：云计算面试题和答案（学习复习资料）

云计算面试题和答案（学习复习资料）1、什么是云计算？云计算是一种基于互联网的新时代计算机技术。它是下一阶段的技术，使用云随时随地为用户提供服务。它提供了一种访问全球多个服务器的方…

人工智能 2023年6月27日
0070
MXNe

MXNet问题详解：图像分类模型训练 MXNet是一种流行的深度学习框架，常用于图像分类任务。在本文中，我们将深入研究MXNet，并展示如何使用MXNet进行图像分类模型的训练。具…

人工智能 2023年12月31日
0022
kaggle经典题–“泰坦尼克号”–0.8275准确率–东北大学20级python大作业开源（附详细解法与全部代码以及实验报告）

kaggle经典题–“泰坦尼克号”–0.8275准确率–东北大学20级python大作业开源（附详细解法与全部代码以及实…

人工智能 2023年7月16日
0064
计算机视觉CV领域中多尺度特征的概念

知乎：深度学习中的多尺度模型设计知乎：计算机视觉中的多尺度模型都有哪些设计？ CSDN：多尺度理解什么是多尺度？所谓多尺度，实际就是对信号的不同粒度的采样。通常在不同的尺度…

人工智能 2023年7月27日
0060
双流网络: Two-Stream Convolutional Networks for Action Recognition in Videos

Contents Introduction Two-stream architecture for video recognition Evaluation Enlightenme…

人工智能 2023年5月26日
0095
基于深度学习的对联自动生成系统

1.项目目标设计一个基于深度学习的对联生成系统。最终结果可以是一个简单的界面，在界面中，我输入一句上联，通过点击相应按钮，系统生成相应下联并显示出来。 2.国内外相关工作对联是…

人工智能 2023年5月30日
0052
神经网络——常见的回归损失函数

GIoU Loss 在 IoU Loss 的基础上解决了边界框不重合的问题； DIoU Loss 在 IoU 和 GIoU Loss 上加入了边界框中心点的信息； CIoU Los…

人工智能 2023年7月17日
0050
【分类模型】聚类分析

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月31日
0082

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

YOLOV7训练自己的数据集，我先来试试火（VisDrone数据集）

; 背景

代码

搭建环境，这里直接用conda按照源码requirements.txt安装就行。

数据准备

训练

坑（我遇到的）：

大家都在看