基于yoloV5-v6分类多检测头模型修改（多国车牌检测）

2023年7月1日上午1:20 • 人工智能 • 阅读 124

加我微信拉你进群交流：wu331376411

一修改背景

基于yoloV5系列越来越强大，适用面越来越广泛，主要是由于训练简单，模型适配性好，推理速度快等优点，yoloV5系列适用非常广泛。
但随着越发强大的系统，导致模型堆叠问题越发严重，输入相同的图片检测的内容不同，或者输入不同的图片检测类似的内容。这些都需要使用多个模型来完成，导致设备负载大，推理堆叠。实际运用场景可能有：多国车牌，使用不同的国家字符，需要用多个对应国家的模型来完成车牌文字检测识别，又比如：ADAS系统，输入相同的图像，不仅仅要检测前方的车辆类型，交通标志，车道线（YOLOP）等等。诸如需求比比皆是，故此在官方的模型上使其共用backbone，使用不同的检测头来完成相对于效果。

二修改思路

共用backbone，使用多个检测头来分别检测不同国家的车牌。
比如我们定义第一个头是：大陆车牌，第二个头是：港澳车牌，第三个头是：老挝车牌等等。
重点 : 我们创建了多头，但是每次我们输入的图片只是其中一个头的，如果每个头都运行，会很浪费时间，所以我们只运行对应的一个头，这里就需要后期建立一个多头的列表，选择我们数据输入的对应头就OK了。


nc1 : 20
nc2 : 30
nc3 : 40

nc: [nc1,nc2,nc3]
depth_multiple: 0.33
width_multiple: 0.50
anchors:
  - [10,13, 16,30, 33,23]
  - [30,61, 62,45, 59,119]
  - [116,90, 156,198, 373,326]

backbone:

  [[9, 1, Conv, [64, 6, 2, 2]],
   [-1, 1, Conv, [128, 3, 2]],
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],
  ]

head1:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],
   [-1, 3, C3, [256, False]],

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],
   [-1, 3, C3, [1024, False]],

   [[17, 20, 23], 1, Detect, [nc1, anchors]],

  ]

head2:
  [[9, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],
   [-1, 3, C3, [256, False]],

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 29], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 25], 1, Concat, [1]],
   [-1, 3, C3, [1024, False]],

   [[32, 35, 38], 1, Detect, [nc2, anchors]],
  ]

head3:
  [ [ 9, 1, Conv, [ 512, 1, 1 ] ],
    [ -1, 1, nn.Upsample, [ None, 2, 'nearest' ] ],
    [ [ -1, 6 ], 1, Concat, [ 1 ] ],
    [ -1, 3, C3, [ 512, False ] ],

    [ -1, 1, Conv, [ 256, 1, 1 ] ],
    [ -1, 1, nn.Upsample, [ None, 2, 'nearest' ] ],
    [ [ -1, 4 ], 1, Concat, [ 1 ] ],
    [ -1, 3, C3, [ 256, False ] ],

    [ -1, 1, Conv, [ 256, 3, 2 ] ],
    [ [ -1, 44 ], 1, Concat, [ 1 ] ],
    [ -1, 3, C3, [ 512, False ] ],

    [ -1, 1, Conv, [ 512, 3, 2 ] ],
    [ [ -1, 40 ], 1, Concat, [ 1 ] ],
    [ -1, 3, C3, [ 1024, False ] ],

    [ [ 47, 50, 53 ], 1, Detect, [ nc3, anchors ] ],
  ]

注意: 每一层的连接方式需要修正，需要看是层的索引值。


                 from  n    params  module                                  arguments
  0                -1  1      3520  models.common.Conv                      [3, 32, 6, 2, 2]
  1                -1  1     18560  models.common.Conv                      [32, 64, 3, 2]
  2                -1  1     18816  models.common.C3                        [64, 64, 1]
  3                -1  1     73984  models.common.Conv                      [64, 128, 3, 2]
  4                -1  2    115712  models.common.C3                        [128, 128, 2]
  5                -1  1    295424  models.common.Conv                      [128, 256, 3, 2]
  6                -1  3    625152  models.common.C3                        [256, 256, 3]
  7                -1  1   1180672  models.common.Conv                      [256, 512, 3, 2]
  8                -1  1   1182720  models.common.C3                        [512, 512, 1]
  9                -1  1    656896  models.common.SPPF                      [512, 512, 5]
 10                -1  1    131584  models.common.Conv                      [512, 256, 1, 1]
 11                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 12           [-1, 6]  1         0  models.common.Concat                    [1]
 13                -1  1    361984  models.common.C3                        [512, 256, 1, False]
 14                -1  1     33024  models.common.Conv                      [256, 128, 1, 1]
 15                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 16           [-1, 4]  1         0  models.common.Concat                    [1]
 17                -1  1     90880  models.common.C3                        [256, 128, 1, False]
 18                -1  1    147712  models.common.Conv                      [128, 128, 3, 2]
 19          [-1, 14]  1         0  models.common.Concat                    [1]
 20                -1  1    296448  models.common.C3                        [256, 256, 1, False]
 21                -1  1    590336  models.common.Conv                      [256, 256, 3, 2]
 22          [-1, 10]  1         0  models.common.Concat                    [1]
 23                -1  1   1182720  models.common.C3                        [512, 512, 1, False]
 24      [17, 20, 23]  1     67425  Detect                                  [20, [[10, 13, 16, 30, 33, 23], [30, 61, 62, 45, 59, 119], [116, 90, 156, 198, 373, 326]], [128, 256, 512]]
 25                 9  1    131584  models.common.Conv                      [512, 256, 1, 1]
 26                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 27           [-1, 6]  1         0  models.common.Concat                    [1]
 28                -1  1    361984  models.common.C3                        [512, 256, 1, False]
 29                -1  1     33024  models.common.Conv                      [256, 128, 1, 1]
 30                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 31           [-1, 4]  1         0  models.common.Concat                    [1]
 32                -1  1     90880  models.common.C3                        [256, 128, 1, False]
 33                -1  1    147712  models.common.Conv                      [128, 128, 3, 2]
 34          [-1, 29]  1         0  models.common.Concat                    [1]
 35                -1  1    296448  models.common.C3                        [256, 256, 1, False]
 36                -1  1    590336  models.common.Conv                      [256, 256, 3, 2]
 37          [-1, 25]  1         0  models.common.Concat                    [1]
 38                -1  1   1182720  models.common.C3                        [512, 512, 1, False]
 39      [32, 35, 38]  1     94395  Detect                                  [30, [[10, 13, 16, 30, 33, 23], [30, 61, 62, 45, 59, 119], [116, 90, 156, 198, 373, 326]], [128, 256, 512]]
 40                 9  1    131584  models.common.Conv                      [512, 256, 1, 1]
 41                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 42           [-1, 6]  1         0  models.common.Concat                    [1]
 43                -1  1    361984  models.common.C3                        [512, 256, 1, False]
 44                -1  1     33024  models.common.Conv                      [256, 128, 1, 1]
 45                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 46           [-1, 4]  1         0  models.common.Concat                    [1]
 47                -1  1     90880  models.common.C3                        [256, 128, 1, False]
 48                -1  1    147712  models.common.Conv                      [128, 128, 3, 2]
 49          [-1, 44]  1         0  models.common.Concat                    [1]
 50                -1  1    296448  models.common.C3                        [256, 256, 1, False]
 51                -1  1    590336  models.common.Conv                      [256, 256, 3, 2]
 52          [-1, 40]  1         0  models.common.Concat                    [1]
 53                -1  1   1182720  models.common.C3                        [512, 512, 1, False]
 54      [47, 50, 53]  1    121365  Detect                                  [40, [[10, 13, 16, 30, 33, 23], [30, 61, 62, 45, 59, 119], [116, 90, 156, 198, 373, 326]], [128, 256, 512]]
self.headi 24
self.headi 39
self.headi 54
Model Summary: 508 layers, 12958705 parameters, 12958705 gradients

三模型修改

1 网络结构修改

修改结构的时候主要需要注意，这里是多个头，我们创建一个多头列表，输入对应头数据来完成模型训练即可。

修改模型初始化

主要是需要记录头的数量，骨干网络的层数，不同头的层数（列表）
头的数量可以根据索引来进行输入数据，训练对应的头，推理的时候也是对应输入头的索引即可，
骨干是共用的，所以记录数量，后期好用于网络结构拼接。
不同的头可以使用不同的层数，针对难度大的数据可以使用较多的卷积，默认是15层。
初始化detect层
detect层的m.stride值，默认是[8,16,32]。由于都有不同的头，anchor对应的下采样比例可能出现不一样，可能需要使用不同的anchor来进行初始化，所以这里每个头的m.stride 都需要进行初始化。用一个循环完成。
网络拼接
网络拼接的时候需要主要，共用主干后，对应的值会有一些变话，都可以更具传入的头和对应头的层数进行查询，这里的计算大家可以自己算一下，需要注意的是P4，P5拼接的层数是头数量15的倍数，_forward_once函数中，新加代码乘以15的由来。

还有一些小的修改，大家可以自己查看yolo_plate.py文件。基本都是和输入头索引对应的detect层的位置，也就是前面计算的 self.headi_forward 值

; 2数据读取修改

修改数据读取配置文件
添加 headnum 头的数量，用于数据读取的循环值。
依次写个头的对应的数据路径，类别，以及类别名称即可。
数据读取成dataloader
这里是多个头的数据，所以创建的时候使用列表来进行存储

修改create_dataloader方法，返回列表值即可

这里需要记录类别数量，名字等等对应即可，修改较为简单，省去，不清楚的可以去查看源码。
数据训练数据读取
这里我们创建了多个头的数据dataloader，我们训练的时候是同时进行训练的，所以每次从一个dataloader中读取相同张数的数据，进行一个batch训练，然后将loss进行相加然后回传。
由于数据长短不同，所以我们按照最长的数据进行设置一个epoch的长度，如果短的读取完了，再次创建train_loader来进行重复读取训练。

数据运行逻辑：

3 训练工程常见问题修改

根据检测头的数量修改读取数据的路径：
general.py文件，修改读取数量路径，修改为列表形式。
根据数量dataloader 读取对应的bar数据读取器，列表形式

; 四模型训练

我使用416大小训练了2个头的内容，map涨点很快，训练速度和之前的训练过程相当，稍微慢一丢丢


python train_plate.py --data data/mydata.yaml --batch 256 --epochs 400 --weights weights/yolov5s.pt   --imgsz 416  --device '0,1'  --cfg models/yolov5s_plate.yaml  --hyp data/hyps/palte_head.yaml --name car_plate_head_size416

模型收敛的比单个头训练的更快一些。

五模型开源

目前还有一些内容没有更新完成，完成后上传github

Original: https://blog.csdn.net/small_wu/article/details/127084546
Author: 五小白
Title: 基于yoloV5-v6分类多检测头模型修改（多国车牌检测）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/662438/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

如何加速pandas的DataFrame

使用pandarallel模块对 Pandas加速 python的dataFrame确实好用，但是明显只能单核运算使用pandas，当您运行以下行时： Standard appl…

人工智能 2023年6月2日
00110
python的几种非线性回归

前一阵子有人和我吐槽过matlab内置的几个线性数据拟合工具满足不了需求，今天正好看到了一个关于使用scipy进行非线性回归的工具使用方法，写下来备忘。 Theory Given …

人工智能 2023年6月17日
0068
树突网络Dendrite Net

目录导读引言 Dendrite Net * 系统鉴别System Identification 回归与分类结论个人理解 Reference ; 导读本篇文章来自西安交通大…

人工智能 2023年7月14日
0035
语音识别(ASR)论文优选：端到端ASR综述Recent Advances in End-to-End Automatic Speech Recognition

声明：平时看些文章做些笔记分享出来，文章中难免存在错误的地方，还望大家海涵。搜集一些资料，方便查阅学习：http://yqli.tech/page/speech.html。语音合成…

人工智能 2023年5月25日
0063
[论文阅读笔记67]Chinese NER by Span-Level Self-Attention

1. 基本信息题目论文作者与单位来源年份Chinese NER by Span-Level Self-AttentionXiaoyu Dong，Xin Xin，Ping Guo …

人工智能 2023年5月28日
0060
visual studio 2022 opencv 4.6.0 创建测试工程

前言 OpenCV ： Open Source Computer Vision Library，开源的计算机视觉和机器学习库，可以支持 C++、Python 等开发平台这里使用 …

人工智能 2023年6月29日
0052
【南京大学操作系统(蒋岩炎)】（三）理解并发程序执行 | 并发控制：互斥

目录 I 基础知识9 1 MINIX 操作系统_简介11 1.1 MINIX与UNIX . . . . . . . . . . . . . . . . . . . . . . . …

人工智能 2023年6月27日
0099
机器学习_深度学习毕设题目汇总——数据分析_数据挖掘

下面是该类的一些题目：题目基于大数据分析的市场精准描述与预测基于可调Q因子小波变换和迁移学习的脑电数据分析方法研究基于深度学习的烟草近红外光谱数据分析基于自回归模型和机器学习的大…

人工智能 2023年6月19日
0084
Python Pandas操作Excel 01

1.1 Pandas操作Excel 01 1.1.1 数据类型和新建文件我们用pandas，操作的常见数据类型有： csv txt excel sql 数&…

人工智能 2023年7月7日
0069
web前端电影项目作业源码大学生影视主题网页制作电影网页设计模板学生静态网页作业成品 dreamweaver电影HTML网站制作

HTML实例网页代码, 本实例适合于初学HTML的同学。该实例里面有设置了css的样式设置，有div的样式格局，这个实例比较全面，有助于同学的学习,本文将介绍如何通过从头开始设计个…

人工智能 2023年6月27日
00155
MMdet的Resnet卷积替换成Ghost卷积组所出现的问题

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月22日
0058
在huggingface（transformers）加载Bert遇到的attention_mask问题

记录一个非常有意思的，看了源码才了解的Bert使用方法。如何通过Bert实现类似left-to-right的语言模型呢？一开始自己以为只能如下使用。自己以为关于attent…

人工智能 2023年6月4日
0069
爬虫预热：Python3+pip环境配置

以下全是Windows下的安装 Anaconda 首推如果你没有安装Python的话，那就去Anaconda下安装（网址:阿纳康达|全球最受欢迎的数据科学平台 (anaconda….

人工智能 2023年5月25日
0096
论文笔记（综述）——Image fusion meets deep learning: A survey and perspective

文章目录零、摘要（Abstract）一、引言（Introduction）二、方法回顾（Method review） * 1、数字摄影图像融合（Digital photogra…

人工智能 2023年6月18日
0089
【论文汇总】2D目标检测文章汇总，持续更新

记录自己比较感兴趣的2D目标检测文章 DatePub.TitleCode2022ECCV https://github.com/mohsenzand/objectbox2021MM…

人工智能 2023年7月9日
0052
Jupyter使用技巧+快捷键【速查手册】

文章目录 * – 一、编辑模式与命令行模式 – 二、编辑模式快捷键 – + （1）运行代码(命令模式也可用) + （2）光标跳转 + （3）提示…

人工智能 2023年7月15日
00139

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

基于yoloV5-v6分类多检测头模型修改（多国车牌检测）

1 网络结构修改

; 2数据读取修改

3 训练工程常见问题修改

大家都在看