【yolov5s中加入DCNv2（可变形卷积v2）】

2023年9月30日下午1:11 • Python • 阅读 47

yolov5s中加入DCNv2（可变形卷积v2）

Requirement

torch>=1.8.1
torchvision>=0.9.1

实现步骤

1.测试环境是否满足要求

import torch
import torchvision.ops
from torch import nn
import math

class DCNv2(nn.Module):
    def __init__(self,
                 in_channels,
                 out_channels,
                 kernel_size=3,
                 stride=1,
                 padding=1):

        super(DCNv2, self).__init__()
        self.in_channels = in_channels
        self.out_channels = out_channels
        self.kernel_size = kernel_size
        self.stride = stride if type(stride) == tuple else (stride, stride)
        self.padding = padding

        self.weight = nn.Parameter(torch.Tensor(out_channels, in_channels, kernel_size, kernel_size))
        self.bias = nn.Parameter(torch.Tensor(out_channels))

        self.conv_offset_mask = nn.Conv2d(in_channels,
                                          3 * kernel_size * kernel_size,
                                          kernel_size=kernel_size,
                                          stride=stride,
                                          padding=self.padding,
                                          bias=True)

        self.reset_parameters()
        self._init_weight()

    def reset_parameters(self):
        n = self.in_channels * (self.kernel_size**2)
        stdv = 1. / math.sqrt(n)
        self.weight.data.uniform_(-stdv, stdv)
        self.bias.data.zero_()

    def _init_weight(self):

        nn.init.constant_(self.conv_offset_mask.weight, 0.)
        nn.init.constant_(self.conv_offset_mask.bias, 0.)

    def forward(self, x):
        out = self.conv_offset_mask(x)
        o1, o2, mask = torch.chunk(out, 3, dim=1)
        offset = torch.cat((o1, o2), dim=1)
        mask = torch.sigmoid(mask)

        x = torchvision.ops.deform_conv2d(input=x,
                                          offset=offset,
                                          weight=self.weight,
                                          bias=self.bias,
                                          padding=self.padding,
                                          mask=mask,
                                          stride=self.stride)
        return x

model = nn.Sequential(
    DCNv2(3, 32, kernel_size=3, stride=1, padding=1),
    nn.ReLU(inplace=True),
    nn.MaxPool2d(2, 2),
    DCNv2(32, 32, kernel_size=3, stride=1, padding=1),
    DCNv2(32, 64, kernel_size=3, stride=1, padding=1),
    nn.ReLU(inplace=True),
    nn.MaxPool2d(2, 2),
    DCNv2(64, 64, kernel_size=3, stride=1, padding=1),
    DCNv2(64, 128, kernel_size=3, stride=1, padding=1),
    nn.ReLU(inplace=True),
    nn.MaxPool2d(2, 2),
    DCNv2(128, 128, kernel_size=3, stride=1, padding=1),
    DCNv2(128, 256, kernel_size=3, stride=1, padding=1),
    nn.ReLU(inplace=True),
    nn.MaxPool2d(2, 2)
)
x = torch.randn(2, 3, 64, 64)
y = model(x)
print(x.size())
print(y.size())
"""
torch.Size([2, 3, 64, 64])
torch.Size([2, 256, 4, 4])
"""

如果能输出，则说明环境适配。

2.修改models/yolov5s.yaml


nc: 1
depth_multiple: 0.33
width_multiple: 0.50
anchors:

    - [10,13, 16,30, 33,23]
    - [30,61, 62,45, 59,119]
    - [116,90, 156,198, 373,326]

backbone:

  [[-1, 1, Conv, [64, 6, 2, 2]],
   [-1, 1, DCNv2, [128, 3, 2]],
   [-1, 3, C3, [128]],
   [-1, 1, DCNv2, [256, 3, 2]],
   [-1, 6, C3, [256]],
   [-1, 1, DCNv2, [512, 3, 2]],
   [-1, 9, C3, [512]],
   [-1, 1, DCNv2, [1024, 3, 2]],
   [-1, 3, C3, [1024]],
   [-1, 1, SPPF, [1024, 5]],
  ]

head:
  [[-1, 1, Conv, [512, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 6], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [256, 1, 1]],
   [-1, 1, nn.Upsample, [None, 2, 'nearest']],
   [[-1, 4], 1, Concat, [1]],
   [-1, 3, C3, [256, False]],

   [-1, 1, Conv, [256, 3, 2]],
   [[-1, 14], 1, Concat, [1]],
   [-1, 3, C3, [512, False]],

   [-1, 1, Conv, [512, 3, 2]],
   [[-1, 10], 1, Concat, [1]],
   [-1, 3, C3, [1024, False]],

   [[17, 20, 23], 1, Detect, [nc, anchors]],
  ]

3.修改models/common.py


class DCNv2(nn.Module):
    def __init__(self,
                 in_channels,
                 out_channels,
                 kernel_size=3,
                 stride=1,
                 padding=1):

        super(DCNv2, self).__init__()
        self.in_channels = in_channels
        self.out_channels = out_channels
        self.kernel_size = kernel_size
        self.stride = stride if type(stride) == tuple else (stride, stride)
        self.padding = padding

        self.weight = nn.Parameter(torch.Tensor(out_channels, in_channels, kernel_size, kernel_size))
        self.bias = nn.Parameter(torch.Tensor(out_channels))

        self.conv_offset_mask = nn.Conv2d(in_channels,
                                          3 * kernel_size * kernel_size,
                                          kernel_size=kernel_size,
                                          stride=stride,
                                          padding=self.padding,
                                          bias=True)

        self.reset_parameters()
        self._init_weight()

    def reset_parameters(self):
        n = self.in_channels * (self.kernel_size**2)
        stdv = 1. / math.sqrt(n)
        self.weight.data.uniform_(-stdv, stdv)
        self.bias.data.zero_()

    def _init_weight(self):

        nn.init.constant_(self.conv_offset_mask.weight, 0.)
        nn.init.constant_(self.conv_offset_mask.bias, 0.)

    def forward(self, x):
        out = self.conv_offset_mask(x)
        o1, o2, mask = torch.chunk(out, 3, dim=1)
        offset = torch.cat((o1, o2), dim=1)
        mask = torch.sigmoid(mask)

        x = torchvision.ops.deform_conv2d(input=x,
                                          offset=offset,
                                          weight=self.weight,
                                          bias=self.bias,
                                          padding=self.padding,
                                          mask=mask,
                                          stride=self.stride)
        return x

4.修改models/yolo.py

if m in [Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3]:

if m in [Conv, GhostConv, Bottleneck, GhostBottleneck, SPP, SPPF, DWConv, MixConv2d, Focus, CrossConv,BottleneckCSP, C3, DCNv2]:

完成以上操作后，在train.py中导入对应的yaml文件和确认参数，即可开始训练。

参考

【1】 https://blog.csdn.net/shuaijieer/article/details/126249088
【2】 https://github.com/yjh0410/PyTorch_DCNv2

Original: https://blog.csdn.net/weixin_42550418/article/details/128037557
Author: just f
Title: 【yolov5s中加入DCNv2（可变形卷积v2）】

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/787996/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python经典案例（2）

本文通过案例可以学习到，string.upper()函数，raw_input()函数， sorted()函数的用法。我们可以清晰的明白如何使用string.upper()函数，ra…

Python 2023年8月24日
0053
springboot自动配置原理以及手动实现配置类

springboot自动配置原理以及手动实现配置类 1、原理 spring有一个思想是”约定大于配置”。配置类自动配置可以帮助开发人员更加专注于业务逻辑开…

Python 2023年10月20日
0048
Sympy简单教程(7)

SymPy – 作图 SymPy 使用 Matplotlib 库作为后端来渲染2维和3维数学函数图像. 要确保在当前安装的Python 中Matplotlib 库是可用…

Python 2023年9月4日
0056
聊聊如何让办公网络直连Kubernetes集群PodIP/ClusterIP/Service DNS等

想象一下，如果您日常使用的研发测试Kubernetes集群，能够有以下效果: 在办公网络下直接访问Pod IP 在办公网络下直接访问Service Cluster IP 在办公网络…

Python 2023年10月14日
0056
边缘计算 | 在移动设备上部署深度学习模型的思路与注意点 ⛵

💡 作者：韩信子@ShowMeAI📘 深度学习◉技能提升系列：https://www.showmeai.tech/tutorials/35📘 深度学习实战系列：https://ww…

Python 2023年10月28日
0028
ElementUI + Vue + Django 上传文件

但其它方法也有可借鉴的地方，特此记录首先安装相应的包 Django == 3.1.5 djangorestframework == 3.11.1 django-cors-head…

Python 2023年8月5日
0037
Python运维（五）–Jinja2、word模板及Excel

模版：/root/main/index.docx {{ title_pic1 }} {{ title_pic2 }} {{ title_pic3 }} 渲染函数 import sy…

Python 2023年8月14日
0047
配置 Kali 的 apt 命令在线安装包的源为国内源

配置 Kali 的 apt 命令在线安装包的源为国内源因为 Kali 自带的源是国外的，经常会因为网络问题，而无法安装或更新软件包。而且国外的源速度很慢。所以我们直接使用国内的源…

Python 2023年6月12日
0087
python dataframe drop null值_删除Pandas数据框中的NaN/NULL列？

下面是一个简单的函数，您可以通过传递dataframe和threshold直接使用它df ”’ pets location owner id 0 cat S…

Python 2023年8月8日
0053
Dreamweaver网页作业——紫罗兰永恒花园动漫价绍网页 7页，含有table表格，js表单验证还有首页视频。以及列表页。浮动布局。div+css+js

HTML实例网页代码, 本实例适合于初学HTML的同学。该实例里面有设置了css的样式设置，有div的样式格局，这个实例比较全面，有助于同学的学习,本文将介绍如何通过从头开始设计个…

Python 2023年9月16日
0049
MySQL进阶实战5，为什么查询速度会慢

一、先了解一下MySQL查询的执行过程 MySQL在查询时，它是由很多子任务组成的，每个子任务都会消耗一定的时间，如果要想优化查询，实际上要优化其子任务，可以消除一些子任务、减少子…

Python 2023年10月13日
0028
Numpy概述(学习笔记)

Numpy概述一、Numpy概述 * 1. 引入 2. 查看版本 3.创建别名二、创建数组 * 1.一维数组 2.np.arange() 3.np.linspace() 三、二…

Python 2023年8月28日
0042
Python深浅拷贝的理解

1.拷贝拷贝实际上其实就是在赋值，比如我们有一个列表L1，定义另一个列表L2引用列表L1，实际上就是在拷贝列表L1的值，由于由于L1列表是可变的数据类型，所以当L1的值变的时候，…

Python 2023年10月30日
0015
C C++内功心法-基础篇

大家好，今天给大家讲讲C C++的一些基础语法，小编整理了一些简单入门基础知识，对于我们编程也有很多的帮助。 C++中的cin是一个 istream对象，从标准输入中读取数据，在i…

Python 2023年5月24日
0054
【python游戏制作】僵尸来袭 ~ 快来一起创造植物叭~

前言哈喽！大家好，我是魔王呐~ 看到下面这一段话，大家是不是会想起你在某种时候玩过的一款游戏呐~ 一魅惑菇晃着脑袋生产阳光的向日葵，突突突吐着子弹的豌豆射手！行动迟缓种类丰…

Python 2023年8月2日
0045
python之pandas批量画平行坐标系图（附图例legend参数设置）

数据 ; 代码 import matplotlib.pyplot as plt import pandas as pd from pandas.plotting import pa…

Python 2023年8月31日
0041

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30