【YOLOv5-6.x】设置可学习权重结合BiFPN（Add操作）

2023年7月29日上午12:07 • 人工智能 • 阅读 75

修改yaml文件（以yolov5s为例）

本文以 yolov5s.yaml为例进行修改，修改模型配置文件时要注意以下几点：

这里的yaml文件只修改了一处，也就是将19层的Concat换成了BiFPN_Add，要想修改其他层的Concat，可以类比进行修改
BiFPN_Add本质是add操作，不是concat操作，因此，BiFPN_Add的各个输入层要求大小完全一致（通道数、feature map大小等），因此，这里要修改之前的参数[-1, 13, 6]，来满足这个要求：
-1层就是上一层的输出，原来上一层的输出channel数为256，这里改成512
13层就是这里 [-1, 3, C3, [512, False]], # 13
这样修改后，BiFPN_Add各个输入大小都是 [bs,256,40,40]
最后BiFPN_Add后面的参数层设置为 [256, 256]也就是输入输出channel数都是256


nc: 80
depth_multiple: 0.33
width_multiple: 0.50
anchors:
  - [10,13, 16,30, 33,23]
  - [30,61, 62,45, 59,119]
  - [116,90, 156,198, 373,326]

backbone:

  [[-1, 1, Conv, [64, 6, 2, 2]],
   [-1, 1, Conv, [128, 3, 2]],
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],
  ]

head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],
   [-1, 3, C3, [256, False]],

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 13, 6], 1, BiFPN_Add3, [256, 256]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],
   [-1, 3, C3, [1024, False]],

   [[17, 20, 23], 1, Detect, [nc, anchors]],
  ]


nc: 80
depth_multiple: 0.33
width_multiple: 0.50
anchors:
  - [10,13, 16,30, 33,23]
  - [30,61, 62,45, 59,119]
  - [116,90, 156,198, 373,326]

backbone:

  [[-1, 1, Conv, [64, 6, 2, 2]],
   [-1, 1, Conv, [128, 3, 2]],
   [-1, 3, C3, [128]],
   [-1, 1, Conv, [256, 3, 2]],
   [-1, 6, C3, [256]],
   [-1, 1, Conv, [512, 3, 2]],
   [-1, 9, C3, [512]],
   [-1, 1, Conv, [1024, 3, 2]],
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],
  ]

head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, BiFPN_Add2, [256, 256]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, BiFPN_Add2, [128, 128]],
   [-1, 3, C3, [256, False]],

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 13, 6], 1, BiFPN_Add3, [256, 256]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, BiFPN_Add2, [256, 256]],
   [-1, 3, C3, [1024, False]],

   [[17, 20, 23], 1, Detect, [nc, anchors]],
  ]

                 from  n    params  module                                  arguments
  0                -1  1      3520  models.common.Conv                      [3, 32, 6, 2, 2]
  1                -1  1     18560  models.common.Conv                      [32, 64, 3, 2]
  2                -1  1     18816  models.common.C3                        [64, 64, 1]
  3                -1  1     73984  models.common.Conv                      [64, 128, 3, 2]
  4                -1  2    115712  models.common.C3                        [128, 128, 2]
  5                -1  1    295424  models.common.Conv                      [128, 256, 3, 2]
  6                -1  3    625152  models.common.C3                        [256, 256, 3]
  7                -1  1   1180672  models.common.Conv                      [256, 512, 3, 2]
  8                -1  1   1182720  models.common.C3                        [512, 512, 1]
  9                -1  1    656896  models.common.SPPF                      [512, 512, 5]
 10                -1  1    131584  models.common.Conv                      [512, 256, 1, 1]
 11                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 12           [-1, 6]  1     65794  models.common.BiFPN_Add2                [256, 256]
 13                -1  1    296448  models.common.C3                        [256, 256, 1, False]
 14                -1  1     33024  models.common.Conv                      [256, 128, 1, 1]
 15                -1  1         0  torch.nn.modules.upsampling.Upsample    [None, 2, 'nearest']
 16           [-1, 4]  1     16514  models.common.BiFPN_Add2                [128, 128]
 17                -1  1     74496  models.common.C3                        [128, 128, 1, False]
 18                -1  1    295424  models.common.Conv                      [128, 256, 3, 2]
 19       [-1, 13, 6]  1     65795  models.common.BiFPN_Add3                [256, 256]
 20                -1  1    296448  models.common.C3                        [256, 256, 1, False]
 21                -1  1    590336  models.common.Conv                      [256, 256, 3, 2]
 22          [-1, 10]  1     65794  models.common.BiFPN_Add2                [256, 256]
 23                -1  1   1051648  models.common.C3                        [256, 512, 1, False]
 24      [17, 20, 23]  1    229245  models.yolo.Detect                      [80, [[10, 13, 16, 30, 33, 23], [30, 61, 62, 45, 59, 119], [116, 90, 156, 198, 373, 326]], [128, 256, 512]]
Model Summary: 278 layers, 7384006 parameters, 7384006 gradients, 17.2 GFLOPs

修改common.py

复制粘贴一下代码：


class BiFPN_Add2(nn.Module):
    def __init__(self, c1, c2):
        super(BiFPN_Add2, self).__init__()

        self.w = nn.Parameter(torch.ones(2, dtype=torch.float32), requires_grad=True)
        self.epsilon = 0.0001
        self.conv = nn.Conv2d(c1, c2, kernel_size=1, stride=1, padding=0)
        self.silu = nn.SiLU()

    def forward(self, x):
        w = self.w
        weight = w / (torch.sum(w, dim=0) + self.epsilon)
        return self.conv(self.silu(weight[0] * x[0] + weight[1] * x[1]))

class BiFPN_Add3(nn.Module):
    def __init__(self, c1, c2):
        super(BiFPN_Add3, self).__init__()
        self.w = nn.Parameter(torch.ones(3, dtype=torch.float32), requires_grad=True)
        self.epsilon = 0.0001
        self.conv = nn.Conv2d(c1, c2, kernel_size=1, stride=1, padding=0)
        self.silu = nn.SiLU()

    def forward(self, x):
        w = self.w
        weight = w / (torch.sum(w, dim=0) + self.epsilon)

        return self.conv(self.silu(weight[0] * x[0] + weight[1] * x[1] + weight[2] * x[2]))

修改yolo.py

在 parse_model函数中找到 elif m is Concat:语句，在其后面加上 BiFPN_Add相关语句：

elif m is Concat:
    c2 = sum(ch[x] for x in f)

elif m in [BiFPN_Add2, BiFPN_Add3]:
    c2 = max([ch[x] for x in f])

修改train.py

将 BiFPN_Add2和 BiFPN_Add3函数中定义的 w参数，加入 g1

    g0, g1, g2 = [], [], []
    for v in model.modules():

        if hasattr(v, 'bias') and isinstance(v.bias, nn.Parameter):
            g2.append(v.bias)
        if isinstance(v, nn.BatchNorm2d):
            g0.append(v.weight)
        elif hasattr(v, 'weight') and isinstance(v.weight, nn.Parameter):
            g1.append(v.weight)

        elif isinstance(v, BiFPN_Add2) and hasattr(v, 'w') and isinstance(v.w, nn.Parameter):
            g1.append(v.w)
        elif isinstance(v, BiFPN_Add3) and hasattr(v, 'w') and isinstance(v.w, nn.Parameter):
            g1.append(v.w)

References

Original: https://blog.csdn.net/weixin_43799388/article/details/124091648
Author: 嗜睡的篠龙
Title: 【YOLOv5-6.x】设置可学习权重结合BiFPN（Add操作）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/721379/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

协同过滤算法主要应用于什么领域

问题：协同过滤算法在哪些领域被主要应用？协同过滤算法是一种用于推荐系统的算法，主要用于根据用户的历史行为和相似用户之间的关系来预测用户可能感兴趣的项目。协同过滤算法在电子商务、社…

人工智能 2024年1月2日
0042
Python数据分析入门笔记4——数据预处理之重复值

系列文章目录 Python数据分析入门笔记1——学习前的准备Python数据分析入门笔记2——pandas数据读取Python数据分析入门笔记3——数据预处理之缺失值 Python…

人工智能 2023年7月17日
0086
tensorflow2_tf.keras实现softmax多分类以及网络优化与超参数选择

自动下载训练图像，我这里print输出了大小 import tensorflow as tf import pandas as pd import numpy as np impo…

人工智能 2023年5月25日
00102
【机器学习笔记】【决策树】【泰坦尼克号幸存者的预测】

目录一、导入库以及相关的数据 1.导入所需要的库 2.导入指定的数据集 3.查看数据的相关信息 1.data.info() 2.data.head() 二、数据的预处理 1.处理…

人工智能 2023年5月30日
0070
3D视觉——1.人体姿态估计(Pose Estimation)入门——使用MediaPipe含单帧(Signel Frame)与实时视频(Real-Time Video)

使用MediaPipe工具包进行开发什么是MediaPipe? MediaPipe是一款由Google Research 开发并开源的多媒体机器学习模型应用框架，用于处理视频、音…

人工智能 2023年7月26日
0065
异构数据融合管理系统PandaDB 社区版v0.3发布

PandaDB研发团队日前推出PandaDB 社区版v0.3，该版本自主设计并实现了分布式的图存储和图查询引擎，去除了对Neo4j社区版存储和查询引擎的依赖，并无缝兼容Neo4j客…

人工智能 2023年6月1日
00106
深度学习车道线检测之 LaneNet （使用tensorflow2.4.0跑通）

本文用来整理回顾所学知识，也能使视觉领域初学者的同伴们少走些弯路。参考链接：无人驾驶汽车系统入门（三十）——基于深度神经网络LaneNet的车道线检测及ROS实现_AdamShan…

人工智能 2023年5月23日
00145
深度学习框架——TensorFlow（CPU、GPU版本）安装教程

在经历了多次的实践（折磨）后，总结了以下自认为比较好用的TensorFlow安装方式，如有更好用、简便的方式，或者安装过程仍出现了问题，欢迎进行反馈以便改进。 CPU、GPU版本的…

人工智能 2023年5月23日
0074
Yolo系列__Yolov1简介

Yolov1神经网络 Yolov1简介从目标检测任务发展来看，主要有两类方法。一类是R-CNN系列及其类似算法，称为两阶段two-stage,也就是将目标检测任务分为边界框回归和…

人工智能 2023年7月9日
0092
Yolov5（1）：Detect源码逐行解析

开学时，给自己定的学习任务，直到今天才有闲空来完成。一方面是yolo代码初看觉得乱糟糟的，不想读；其次，yolo算法对于初触深度学习的我而言，还是有较大的难度。今天学习成果就是弄懂…

人工智能 2023年7月9日
0085
目标检测算法汇总：RCNN系列、YOLO系列、SSD系列

常见的目标检测算法 1、传统的目标检测方法 2、two-stage方法 * 2.1 RCNN 2.2 fast RCNN 2.3 faster RCNN 3、one-stage方法…

人工智能 2023年7月12日
0063
Jupyter Notebook自动退出

使用jupyter notebook时，会自动退出 ; 报错： Parent appears to have exited, shutting down. 解决办法：方法一：（…

人工智能 2023年6月24日
0083
树莓派视觉小车 — OpenCV巡线(HSL色彩空间、PID)

目录试错试错1：形态学处理试错2：HSV色彩空间基础理论 1、HSV与HSL色彩空间 2、PID调节一、OpenCV图像处理 1、在HSL色彩空间下得到二值图 2、对二…

人工智能 2023年6月19日
0090
机器学习实战（四）：逻辑斯蒂回归

机器学习实战：逻辑斯蒂回归 1、关于逻辑斯蒂回归 * 1.1 一般过程 1.2 优缺点 1.3 Sigmoid函数 2、基于最优化方法的最佳回归系数确定 * 2.1 梯度上升法 &…

人工智能 2023年6月17日
0084
PaddleNLP基于ERNIR3.0文本分类：WOS数据集为例（层次分类）

NLP专栏简介：数据增强、智能标注、意图识别算法|多分类算法、文本信息抽取、多模态信息抽取、可解释性分析、性能调优、模型压缩算法等专栏详细介绍：NLP专栏简介：数据增强、智能标注…

人工智能 2023年6月16日
00101
逻辑回归(Logistic Regression)详解(附代码)—大道至简之机器学习算法系列——非常通俗易懂！

（不愿意看我废话的直接跳到正文处(^▽^)）很多小伙伴说：逻辑回归？太简单了！我懂的不要不要的，就是sigmoid函数！没毛病，就是sigmoid函数。事实上，大部分机器学习算法…

人工智能 2023年6月16日
0077

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【YOLOv5-6.x】设置可学习权重结合BiFPN（Add操作）

修改yaml文件（以yolov5s为例）

修改common.py

修改yolo.py

修改train.py

References

大家都在看