目标检测 YOLOv5 自定义网络结构

2023年7月12日上午4:44 • 人工智能 • 阅读 90

flyfish

版本：YOLOv5:v5

具体已经借鉴的自定义网络结构包括

MobileNetV3 Large
MobileNetV3 Small

ShuffleNetV2
ShuffleNetV2-Focus
ShuffleNetV2-stem（Pelee的stem模块）

python train.py  --batch 64 --epochs 300 --data data/coco128.yaml --cfg  models/yolov5-mobilenetv3small.yaml

yolov5-mobilenetv3small.yaml 可以更换为如下配置

├── yolov5-mobilenetv3large.yaml
├── yolov5-mobilenetv3small.yaml
├── yolov5-shufflenetv2-focus.yaml
├── yolov5-shufflenetv2-stem.yaml
├── yolov5-shufflenetv2.yaml

一种方式是可以将原结构整理成
backbones
necks
heads
detectors
losses
utils
例如backbones里面有shufflenetv2，mobilenetv3.py等

另一种方式
采用YOLOv5的配置方式
添加模块，根据配置文件生成网络结构。

这里使用的是第二种方式

本文以将ShuffleNetV2的InvertedResidual模块加入到YOLOv5的Backbone中为例说明如何自定义网络结构，加入自定义模块

第一步：加入模块代码

在common.py的顶部加入导入

from torch import Tensor
from typing import Callable, Any, List

将InvertedResidual类和InvertedResidual类需要的channel_shuffle函数都加入到common.py的底部

def channel_shuffle(x: Tensor, groups: int) -> Tensor:
    batchsize, num_channels, height, width = x.size()
    channels_per_group = num_channels // groups

    x = x.view(batchsize, groups,
               channels_per_group, height, width)

    x = torch.transpose(x, 1, 2).contiguous()

    x = x.view(batchsize, -1, height, width)

    return x

class InvertedResidual(nn.Module):
    def __init__(
        self,
        inp: int,
        oup: int,
        stride: int
    ) -> None:
        super(InvertedResidual, self).__init__()

        if not (1  stride  3):
            raise ValueError('illegal stride value')
        self.stride = stride

        branch_features = oup // 2
        assert (self.stride != 1) or (inp == branch_features << 1)

        if self.stride > 1:
            self.branch1 = nn.Sequential(
                self.depthwise_conv(inp, inp, kernel_size=3, stride=self.stride, padding=1),
                nn.BatchNorm2d(inp),
                nn.Conv2d(inp, branch_features, kernel_size=1, stride=1, padding=0, bias=False),
                nn.BatchNorm2d(branch_features),
                nn.ReLU(inplace=True),
            )
        else:
            self.branch1 = nn.Sequential()

        self.branch2 = nn.Sequential(
            nn.Conv2d(inp if (self.stride > 1) else branch_features,
                      branch_features, kernel_size=1, stride=1, padding=0, bias=False),
            nn.BatchNorm2d(branch_features),
            nn.ReLU(inplace=True),
            self.depthwise_conv(branch_features, branch_features, kernel_size=3, stride=self.stride, padding=1),
            nn.BatchNorm2d(branch_features),
            nn.Conv2d(branch_features, branch_features, kernel_size=1, stride=1, padding=0, bias=False),
            nn.BatchNorm2d(branch_features),
            nn.ReLU(inplace=True),
        )

    @staticmethod
    def depthwise_conv(
        i: int,
        o: int,
        kernel_size: int,
        stride: int = 1,
        padding: int = 0,
        bias: bool = False
    ) -> nn.Conv2d:
        return nn.Conv2d(i, o, kernel_size, stride, padding, bias=bias, groups=i)

    def forward(self, x: Tensor) -> Tensor:
        if self.stride == 1:
            x1, x2 = x.chunk(2, dim=1)
            out = torch.cat((x1, self.branch2(x2)), dim=1)
        else:
            out = torch.cat((self.branch1(x), self.branch2(x)), dim=1)

        out = channel_shuffle(out, 2)

        return out

第二步更改解析模块，告诉YOLOv5，我们加入了InvertedResidual模块

目录在models/yolo.py的parse_model函数

if m in [Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, DWConv, MixConv2d, Focus, CrossConv, BottleneckCSP,
            C3, C3TR,InvertedResidual]:

第三步配置

在目录models下新建yolov5-shufflenetv2-focus.yaml文件，配置如下


nc: 80
depth_multiple: 1.0
width_multiple: 0.5

anchors:
  - [4,5,  8,10,  13,16]
  - [23,29,  43,55,  73,105]
  - [146,217,  231,300,  335,433]

backbone:

  [[-1, 1, Focus, [64, 3]],
   [-1, 1, InvertedResidual, [128, 2]],
   [-1, 3, InvertedResidual, [128, 1]],
   [-1, 1, InvertedResidual, [256, 2]],
   [-1, 7, InvertedResidual, [256, 1]],
   [-1, 1, InvertedResidual, [512, 2]],
   [-1, 3, InvertedResidual, [512, 1]],
  ]

head:
  [[-1, 1, Conv, [128, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],
   [-1, 1, C3, [128, False]],

   [-1, 1, Conv, [128, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 2], 1, Concat, [1]],
   [-1, 1, C3, [128, False]],

   [-1, 1, Conv, [128, 3, 2]],
   [[-1, 11], 1, Concat, [1]],
   [-1, 1, C3, [128, False]],

   [-1, 1, Conv, [128, 3, 2]],
   [[-1, 7], 1, Concat, [1]],
   [-1, 1, C3, [128, False]],

   [[14, 17, 20], 1, Detect, [nc, anchors]],
  ]

配置的参数说明

在编写配置文件时，不需要定义输入通道，只需要定义输出通道和其他参数。
输入数据最初是3通道，定义输出通道，该通道也是其他层的输入，
例如

[[-1, 1, conv_bn_hswish,               [16, 2]],
 [-1, 1, MobileNetV3_InvertedResidual, [16,  16, 3, 2, 1, 0]],
 [-1, 1, MobileNetV3_InvertedResidual, [24,  72, 3, 2, 0, 0]],

代码会自动扩展

models.common.conv_bn_hswish                [3, 16, 2]
models.common.MobileNetV3_InvertedResidual  [16, 16, 16, 3, 2, 1, 0]
models.common.MobileNetV3_InvertedResidual  [24, 24, 88, 3, 1, 0, 0]

conv_bn_hswish的参数
self, c1, c2, stride
含义如下
输入通道是c1=3
输出通道是c2=16
stride=2

MobileNetV3_InvertedResidual的参数

self, inp, oup, hidden_dim, kernel_size, stride, use_se, use_hs

输入通道是inp=16,
输出通道是oup=16,
hidden_dim=16,
kernel_size=3,
stride=2,
use_se=1,
use_hs=0
use_se表示是否使用SELayer
use_hs表示使用h_swish还是ReLU

Original: https://blog.csdn.net/flyfish1986/article/details/117303291
Author: 西西弗Sisyphus
Title: 目标检测 YOLOv5 自定义网络结构

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/686954/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

股票因子扩展2（双神因子计算）——从零到实盘5

前文记录了涨停因子的实现，本文记录双神因子的实现。双神本质上就是间隔的两个涨停，网上也有人称之为双龙。 ; 主要代码分析新建源文件，命名为data_center_v4.py，全…

人工智能 2023年7月6日
00124
skywalking监控

3.在这里插入图片描述 ; 3.1 Skywalking架构 SkyWalking 逻辑上分为四部分: 探针, 平台后端, 存储和用户界面探针:用来采集app的请求，及服务请求第…

人工智能 2023年6月29日
0072
把显存用在刀刃上！17 种 pytorch 节约显存技巧

引导 * – + 1. 显存都用在哪儿了？ + 2. 技巧 1：使用就地操作 + 3. 技巧 2：避免中间变量 + 4. 技巧 3：优化网络模型 + 5. 技巧 4：减…

人工智能 2023年7月22日
00409
学生HTML个人网页作业作品 HTML+CSS+JavaScript环保页面设计与实现制作

🎀 精彩专栏推荐👇🏻👇🏻👇🏻✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战案…

人工智能 2023年6月26日
0095
XGBoost基本介绍（机器学习ML神器）

介绍： XGBoost整体思想就是直接把损失函数和正则项加起来合成一个整体的损失函数，对这个损失函数求二阶导，得到最终的obj，通过obj计算得到一个分数，这个分数越小越好，最终通…

人工智能 2023年6月26日
0084
python矩阵和向量乘法总结

向量之间的乘法 torch.dot 点乘，相同维度的两个向量对应元素相乘再相加 torch.mul 对应元素相乘，结果同a*b例子如下： ; 矩阵与向量的乘法要求：矩阵的列数=向…

人工智能 2023年7月21日
0087
SAR目标检测开源数据集汇总，及时更新，欢迎补充

MSTAR（1996）网上已经有很多介绍了。 MSTAR数据库作为SAR图像自动目标识别（SAR ATR）研究的一个通用库，被很多学者广泛采用。该实验数据采用美国国防高等研究计划…

人工智能 2023年6月17日
0083
1、生成对抗网络入门

GAN简介（Generative Adversarial Nets）小偷（Generator Network）通过随机变量（Random Vector）生成假钱（Fake Ima…

人工智能 2023年5月28日
00132
【机器学习】线性回归实战案例二：车辆零售价回归模型分析步骤详解

线性回归实战案例二：车辆零售价回归模型分析步骤详解 * – 案例二：车辆零售价回归模型 – + 2.2.1 模块加载与忽略警告设置 + 2.2.2 加载数据…

人工智能 2023年7月17日
0059
基于Matlab裂缝识别检测系统

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月18日
0075
甲板智慧-“AI语音垃圾分类机器人”拍了拍你

未来的城市垃圾去向？ F U T U R E U R B A N W A S T E 尝试一垃圾无人车法国的”海狮”垃圾桶这种垃圾无人车很酷炫对于行…

人工智能 2023年5月25日
0074
ros(23)：接收rviz中的2D Nav Goal、2D Pose Estimate消息

1 rviz 教程 1.1 2D Nav Goal This tool lets you set a goal sent on the “goal” ROS…

人工智能 2023年6月15日
0083
契约锁助力大型医院常用文件电子签：检验-诊疗-住院全程无纸化

患者整个就医过程中，从入院诊疗、住院到出院，伴随着大量病历材料需要医护签字或医院盖章。近年，随着电子病历的的普及应用，医院在门诊、住院服务中逐步启用电子签名、盖章，打造&#8221…

人工智能 2023年6月27日
0086
YOLOv5(6.1)安卓端部署记录

分享一下yolov5自己的模型部署到安卓端的踩坑记录，这里跳过yolov5训练部分（这部分网上很多教程），直接说重点。训练得到的为.PT模型，要部署到安卓端首先要转换为onnx模型…

人工智能 2023年6月17日
00123
（目标检测）基于opencv dnn模块的yolov5部署

这边文章将介绍基于dnn模块的yolov5 onnx模型的部署包括读取模型和数据处理和后处理先给出整个项目的源码 yolov5版本为4.0 opencv 为 4.5.2 使用的…

人工智能 2023年7月10日
0092
激光雷达：测距原理

激光雷达传感器常见的激光雷达主要有三角测距和TOF两大类型。 1.三角测距测量原理如图所示，为三角测距激光雷达的原理图。首先激光发射器（Laser）发射激光，打到物体（Obj…

人工智能 2023年6月2日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

目标检测 YOLOv5 自定义网络结构

第一步：加入模块代码

第二步 更改解析模块，告诉YOLOv5，我们加入了InvertedResidual模块

第三步配置

配置的参数说明

大家都在看

第二步更改解析模块，告诉YOLOv5，我们加入了InvertedResidual模块