改进YOLOv7系列：25.YOLOv7 加入RepVGG模型结构，重参数化极简架构

2023年6月16日下午3:46 • 人工智能 • 阅读 110

本篇是《RepVGG结构🚀》的修改演示

使用YOLOv7网络🚀作为示范，可以无缝加入到 YOLOv7、YOLOX、YOLOR、YOLOv4、Scaled_YOLOv4、YOLOv3等一系列YOLO算法模块

文章目录

1.RepVGG模型理论部分

论文参考：最新RepVGG结构: Paper

改进YOLOv7系列：25.YOLOv7 加入RepVGG模型结构，重参数化极简架构

; 模型定义

我们所说的”VGG式”指的是：

没有任何分支结构。即通常所说的plain或feed-forward架构。
仅使用3×3卷积。
仅使用ReLU作为激活函数。

结构重参数化让VGG再次伟大

相比于各种多分支架构（如ResNet，Inception，DenseNet，各种NAS架构），近年来VGG式模型鲜有关注，主要自然是因为性能差。例如，有研究[1]认为，ResNet性能好的一种解释是ResNet的分支结构（shortcut）产生了一个大量子模型的隐式ensemble（因为每遇到一次分支，总的路径就变成两倍），单路架构显然不具备这种特点。

; 2.在YOLOv7中加入RepVGG模块🚀

使用YOLOv7算法🚀作为演示，模块可以无缝插入到YOLOv7、YOLOv5、YOLOv4、Scaled_YOLOv4、YOLOv3、YOLOR等一系列YOLO算法中

新增YOLOv7的yaml配置文件

首先增加以下yolov7_RepVGG.yaml文件,作为改进演示

&#x4EE3;&#x7801;
YOLOv7 &#x1F680;, GPL-3.0 license
parameters
nc: 80  # number of classes
depth_multiple: 0.33  # model depth multiple
width_multiple: 1.0  # layer channel multiple

anchors
anchors:
  - [12,16, 19,36, 40,28]  # P3/8
  - [36,75, 76,55, 72,146]  # P4/16
  - [142,110, 192,243, 459,401]  # P5/32

yolov7 backbone by yoloair
backbone:
  # [from, number, module, args]
  [[-1, 1, Conv, [32, 3, 1]],  # 0
   [-1, 1, Conv, [64, 3, 2]],  # 1-P1/2
   [-1, 1, Conv, [64, 3, 1]],
   [-1, 1, Conv, [128, 3, 2]],  # 3-P2/4
   [-1, 1, RepVGGBlock, [128, 3, 2]], # 5-P4/16
   [-1, 1, Conv, [256, 3, 2]],
   [-1, 1, MP, []],
   [-1, 1, Conv, [128, 1, 1]],
   [-3, 1, Conv, [128, 1, 1]],
   [-1, 1, Conv, [128, 3, 2]],
   [[-1, -3], 1, Concat, [1]],  # 16-P3/8
   [-1, 1, Conv, [128, 1, 1]],
   [-2, 1, Conv, [128, 1, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [-1, 1, Conv, [128, 3, 1]],
   [[-1, -3, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [512, 1, 1]],
   [-1, 1, MP, []],
   [-1, 1, Conv, [256, 1, 1]],
   [-3, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [256, 3, 2]],
   [[-1, -3], 1, Concat, [1]],
   [-1, 1, Conv, [256, 1, 1]],
   [-2, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [-1, 1, Conv, [256, 3, 1]],
   [[-1, -3, -5, -6], 1, Concat, [1]],
   [-1, 1, Conv, [1024, 1, 1]],
   [-1, 1, MP, []],
   [-1, 1, Conv, [512, 1, 1]],
   [-3, 1, Conv, [512, 1, 1]],
   [-1, 1, Conv, [512, 3, 2]],
   [[-1, -3], 1, Concat, [1]],
   [-1, 1, C3C2, [1024]],
   [-1, 1, Conv, [256, 3, 1]],
  ]

yolov7 head by yoloair
head:
  [[-1, 1, SPPCSPC, [512]],
   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [31, 1, Conv, [256, 1, 1]],
   [[-1, -2], 1, Concat, [1]],
   [-1, 1, C3C2, [128]],
   [-1, 1, Conv, [128, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [18, 1, Conv, [128, 1, 1]],
   [[-1, -2], 1, Concat, [1]],
   [-1, 1, C3C2, [128]],
   [-1, 1, MP, []],
   [-1, 1, Conv, [128, 1, 1]],
   [-3, 1, Conv, [128, 1, 1]],
   [-1, 1, Conv, [128, 3, 2]],
   [[-1, -3, 44], 1, Concat, [1]],
   [-1, 1, C3C2, [256]],
   [-1, 1, MP, []],
   [-1, 1, Conv, [256, 1, 1]],
   [-3, 1, Conv, [256, 1, 1]],
   [-1, 1, Conv, [256, 3, 2]],
   [[-1, -3, 39], 1, Concat, [1]],
   [-1, 3, C3C2, [512]],

&#x68C0;&#x6D4B;&#x5934; -----------------------------
   [49, 1, RepConv, [256, 3, 1]],
   [55, 1, RepConv, [512, 3, 1]],
   [61, 1, RepConv, [1024, 3, 1]],

   [[62,63,64], 1, IDetect, [nc, anchors]],   # Detect(P3, P4, P5)
  ]

当需要修改yaml配置文件，将xx模块加到你想加入的位置（层数）；
首先基于一个可以成功运行的.yaml模型配置文件，进行新增或者减少层数之后，那么该层网络后续的层的编号都会发生改变，对应的一些层都需要针对性的修改，以匹配通道和层数的关系

common.py配置

在./models/common.py文件中增加以下模块，直接复制即可

class RepVGGBlock(nn.Module):
    def __init__(self, in_channels, out_channels, kernel_size=3,
                 stride=1, padding=1, dilation=1, groups=1, padding_mode='zeros', deploy=False, use_se=False):
        super(RepVGGBlock, self).__init__()
        self.deploy = deploy
        self.groups = groups
        self.in_channels = in_channels
        padding_11 = padding - kernel_size // 2
        self.nonlinearity = nn.SiLU()
        # self.nonlinearity = nn.ReLU()
        if use_se:
            self.se = SEBlock(out_channels, internal_neurons=out_channels // 16)
        else:
            self.se = nn.Identity()
        if deploy:
            self.rbr_reparam = nn.Conv2d(in_channels=in_channels, out_channels=out_channels, kernel_size=kernel_size,
                                         stride=stride,
                                         padding=padding, dilation=dilation, groups=groups, bias=True,
                                         padding_mode=padding_mode)

        else:
            self.rbr_identity = nn.BatchNorm2d(
                num_features=in_channels) if out_channels == in_channels and stride == 1 else None
            self.rbr_dense = conv_bn(in_channels=in_channels, out_channels=out_channels, kernel_size=kernel_size,
                                     stride=stride, padding=padding, groups=groups)
            self.rbr_1x1 = conv_bn(in_channels=in_channels, out_channels=out_channels, kernel_size=1, stride=stride,
                                   padding=padding_11, groups=groups)
            # print('RepVGG Block, identity = ', self.rbr_identity)
def switch_to_deploy(self):
        if hasattr(self, 'rbr_1x1'):
            kernel, bias = self.get_equivalent_kernel_bias()
            self.rbr_reparam = nn.Conv2d(in_channels=self.rbr_dense.conv.in_channels, out_channels=self.rbr_dense.conv.out_channels,
                                    kernel_size=self.rbr_dense.conv.kernel_size, stride=self.rbr_dense.conv.stride,
                                    padding=self.rbr_dense.conv.padding, dilation=self.rbr_dense.conv.dilation, groups=self.rbr_dense.conv.groups, bias=True)
            self.rbr_reparam.weight.data = kernel
            self.rbr_reparam.bias.data = bias
            for para in self.parameters():
                para.detach_()
            self.rbr_dense = self.rbr_reparam
            # self.__delattr__('rbr_dense')
            self.__delattr__('rbr_1x1')
            if hasattr(self, 'rbr_identity'):
                self.__delattr__('rbr_identity')
            if hasattr(self, 'id_tensor'):
                self.__delattr__('id_tensor')
            self.deploy = True

    def get_equivalent_kernel_bias(self):
        kernel3x3, bias3x3 = self._fuse_bn_tensor(self.rbr_dense)
        kernel1x1, bias1x1 = self._fuse_bn_tensor(self.rbr_1x1)
        kernelid, biasid = self._fuse_bn_tensor(self.rbr_identity)
        return kernel3x3 + self._pad_1x1_to_3x3_tensor(kernel1x1) + kernelid, bias3x3 + bias1x1 + biasid

    def _pad_1x1_to_3x3_tensor(self, kernel1x1):
        if kernel1x1 is None:
            return 0
        else:
            return torch.nn.functional.pad(kernel1x1, [1, 1, 1, 1])

    def _fuse_bn_tensor(self, branch):
        if branch is None:
            return 0, 0
        if isinstance(branch, nn.Sequential):
            kernel = branch.conv.weight
            running_mean = branch.bn.running_mean
            running_var = branch.bn.running_var
            gamma = branch.bn.weight
            beta = branch.bn.bias
            eps = branch.bn.eps
        else:
            assert isinstance(branch, nn.BatchNorm2d)
            if not hasattr(self, 'id_tensor'):
                input_dim = self.in_channels // self.groups
                kernel_value = np.zeros((self.in_channels, input_dim, 3, 3), dtype=np.float32)
                for i in range(self.in_channels):
                    kernel_value[i, i % input_dim, 1, 1] = 1
                self.id_tensor = torch.from_numpy(kernel_value).to(branch.weight.device)
            kernel = self.id_tensor
            running_mean = branch.running_mean
            running_var = branch.running_var
            gamma = branch.weight
            beta = branch.bias
            eps = branch.eps
        std = (running_var + eps).sqrt()
        t = (gamma / std).reshape(-1, 1, 1, 1)
        return kernel * t, beta - running_mean * gamma / std

    def forward(self, inputs):
        if self.deploy:
            return self.nonlinearity(self.rbr_dense(inputs))
        if hasattr(self, 'rbr_reparam'):
            return self.nonlinearity(self.se(self.rbr_reparam(inputs)))

        if self.rbr_identity is None:
            id_out = 0
        else:
            id_out = self.rbr_identity(inputs)

        return self.nonlinearity(self.se(self.rbr_dense(inputs) + self.rbr_1x1(inputs) + id_out))

其中缺少的C3C2模块需要补充，在Git中

yolo.py配置

然后找到./models/yolo.py文件下里的parse_model函数，将类名加入进去
在 models/yolo.py文件夹下

parse_model函数中
for i, (f, n, m, args) in enumerate(d['backbone'] + d['head']):内部
对应位置下方只需要增加 RepVGGBlock模块

参考代码

elif m is RepVGGBlock:
            c1, c2 = ch[f], args[0]
            if c2 != no:  # if not output
                c2 = make_divisible(c2 * gw, 8)
            args = [c1, c2, *args[1:]]

训练yolov7_RepVGGBlock模型

python train.py --cfg yolov7_RepVGGBlock.yaml

推理过程效果

以下使用单独测试的RepVGG模块(基于v5)作为参考：

训练的时候代码
Model Summary: 375 layers, 5574845 parameters, 5574845 gradients, 16.2 GFLOPs

推理时候的代码
Model Summary: 284 layers, 5390365 parameters, 1567680 gradients, 15.7 GFLOPs

推理模型的数据相比于训练模型的数据

参数量、计算量、推理时间均有所减少

参考文献: 理论部分来自RepVGG作者的知乎文章：https://zhuanlan.zhihu.com/p/344324470

Original: https://blog.csdn.net/qq_38668236/article/details/126715391
Author: 芒果汁没有芒果
Title: 改进YOLOv7系列：25.YOLOv7 加入RepVGG模型结构，重参数化极简架构

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/625146/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

图像去雾学习总结

前言：本来题目想作为如何学习图像去雾，去雾字如其名，而学习是学会去雾方面相关的知识。但是后来一想，每个研究方向均是一片海洋，而自己是半瓶不满的杯水，如何教别人呢，因此本文只能算作…

人工智能 2023年6月24日
0096
多层感知机分类器–MLPClassifier

sklearn.neural_network.MLPClassifier(hidden_layer_sizes=(100,), activation=’relu’, *, solv…

人工智能 2023年7月5日
0067
图像分割模型——segmentation_models_pytorch和albumentations 组合实现多类别分割

文章目录摘要项目结构训练测试完成代码：摘要 segmentation_models_pytorch是一款非常优秀的图像分割库，albumentations 是一款非常优…

人工智能 2023年5月26日
0078
目标检测模型——One stage（YOLO v5的模型解析及应用）

简介目标检测分为Two stage和One stage,只使用一个网络同时产生候选区域并预测出物体的类别和位置，所以它们通常被叫做单阶段检测算法（One stage）。本篇文章只…

人工智能 2023年7月9日
00102
Hive时间日期函数一文详解+代码实例

目录前言一、HiveSQL运行过程二、Hive时间函数 1.获取当前时间 1.current_date() 2. current_timestamp() 3. unix_ti…

人工智能 2023年6月19日
0071
【Vue】webpack的基本使用

✍️ 作者简介: 前端新手学习中。 💂 作者主页: 作者主页查看更多前端教学 🎓 专栏分享：css重难点教学 Node.js教学从头开始学习 ajax学习文章目录 webpac…

人工智能 2023年7月31日
00136
基于深度学习的车辆检测系统（MATLAB代码，含GUI界面）

摘要：当前深度学习在目标检测领域的影响日益显著，本文主要基于深度学习的目标检测算法实现车辆检测，为大家介绍如何利用(\color{#4285f4}{M}\color{#ea4335…

人工智能 2023年6月4日
0092
高斯过程回归(Gaussian Processes Regression, GPR)简介

高斯过程回归（Gaussian Processes Regression, GPR）简介 * – 一、高斯过程简介 – 二、高斯分布 – + 1…

人工智能 2023年6月16日
0089
解决 JanusGraph – but mismatched timestamps； no lock column contained our timestamp (2020-10-12T02:09:

1. 问题描述启动Apache Atlas时，报错信息如下 Caused by: org.janusgraph.diskstorage.PermanentBackendExcep…

人工智能 2023年6月10日
00110
基于顺承关系的事理图谱的构建

目录前言一.数据获取二.顺承事件的抽取三.顺承关系图谱的构建四.顺承关系图谱的展示五.总结前言事理图谱中一般认为主要包含四种逻辑，本文主要讨论了基于顺承关系的事理图…

人工智能 2023年6月10日
0073
如何使用ricequant量化平台进行落单和回测

如何使用ricequant量化平台进行落单和回测： def init(context):：context.s1 = “000001.XSHE”update_…

人工智能 2023年7月29日
0077
【手把手反内卷】开创全新AI多模态任务一视听分割：代码实践、优化教程（二）

前言理论部分请看上一篇文章：简要概述：我们要知道图像中哪个物体在发声如下视频演示： gif 不能发出声音，大家脑补一下场景中有很多车，只有这辆120在发出声音，所以分割出发出声…

人工智能 2023年7月1日
0083
基于改进麻雀算法优化变分模态分解（IAMSSA—VMD）的信号分解方法

0、前言前期博文提出了融合Cat混沌映射+精英反向策略+tent扰动+柯西变异的改进麻雀优化算法（IAMSSA），本期博文将IAMSSA应用于VMD模态数K与惩罚因子（也称平衡…

人工智能 2023年7月28日
0090
人工智能的未来———因果推理：Causal Inference: What If chapter2 A Randomized experiments 文章解读

目录 Chapter 2 ; RANDOMIZED EXPERIMENTS 2.1 Randomization 1、为什么随机实验可以将现实中的数据使用到实验当中去推导因果效应？…

人工智能 2023年6月23日
0078
Transformer结构详解

Transformer结构详解 * – 1.ransformer整体结构 – 2.Transformer的输入 – + 2.1单词Embeddi…

人工智能 2023年5月27日
00120
利用pytorch来深入理解CELoss、BCELoss和NLLLoss之间的关系

损失函数为为计算预测值与真实值之间差异的函数，损失函数越小，预测值与真实值间的差异越小，证明网络效果越好。对于神经网络而言，损失函数决定了神经网络学习的走向，至关重要。 pytor…

人工智能 2023年7月21日
0055

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

改进YOLOv7系列：25.YOLOv7 加入RepVGG模型结构，重参数化 极简架构

最新创新点改进推荐

本篇是《RepVGG结构🚀》的修改 演示