可变形卷积：Deformable Convolutional Networks

2023年5月28日下午4:40 • 人工智能 • 阅读 88

文章提出了一种通过在模块中增加额外偏移量的空间采样位置和从目标任务中学习到偏移量且不需要额外的监督的方法来增强CNN的变换建模能力。基于这种思想提出了两个新模块：可变形卷积和可变形RoI池化。新模块可以很容易地取代现有CNN中的普通模块，并且可以通过标准反向传播轻松地进行端到端训练。

Deformable Convolutional Networks

参考目录
可变形卷积

; 参考目录

可变形卷积原文：Deformable Convolutional Networks

学习DCN时我看了很多别人的文章，都写得很好，我把对我有帮助的罗列在下面。
1、这篇非常直白，可以先了解个大概：可变形卷积从概念到实现过程
2、这篇可以先看前面的解析增加了解，后面还有代码：deformable convolution（可变形卷积）算法解析及代码分析
3、这篇比较生动活泼：更灵活、有个性的卷积——可变形卷积（Deformable Conv）
4、最后这两篇写的比较细致完整，我最后还是看这两篇最多：
目标检测之Deformable Convolutional Networks(2017）
Deformable Convolution 关于可变形卷积
当然别忘记看原文，最后知乎的那篇评论有各路神仙发言，可以帮助理解。

下面仅记录我自己的一些理解。

可变形卷积

整个过程：

输入图片经过一个普通卷积得到input feature map 。
将input feature map先由一路（上图粉色部分）卷积得到偏移量Δ p n Δp_n Δp n 。
偏移量可能是浮点数，而图像位置都是整数，所以使用双线性插值来表示偏移位置。其次也是为了方便梯度反传。
将获得偏移量加到input feature map 得到新的采样位置，然后使用一个3×3卷积核提取特征（蓝色部分）得到output feature map。

其实非常简单，有几个注意点：

粉色虚线部分： 通过conv（与图中对应）得到整张input feature map图的偏移量（offset field）大小为h ∗ w ∗ 2 N hw2N h ∗w ∗2 N 。偏移的是input feature map图像位置而不是卷积。

2N是什么：2 是指x和y两个方向。N是k×k卷积核大小，具体到这张图就是3×3。也就是说offset field的维度2N=18是每个位置上xy两个方向分别九个偏移量的展开。得到两个offsets（x、y）刚好可以加到二维图像input feature map 的每个位置上。
Offset field对应整个input feature map的大小，所以一次求得了每个像素位置的偏移量。
Input feature map应该有C个通道，粉色中实现的是每个通道的偏移量，所以应该有对应的C个粉色虚线部分。

蓝色部分：：

每个3×3的卷积核和特征图像做卷积前，先从粉色一路获取特征图像偏移量，得到偏移位置，用偏移位置的特征值做卷积。
形象表达一下，可以帮助理解，但是是错的！！！！！：就好像蓝色一路的卷积核做了一个形变然后印在特征图像上，和特征图像对应位置的特征值做卷积。
实际上卷积核是不动的，改变的是对应特征图像的位置。

最后再说一点：这个网络学习的不是偏移offset本身，而是如何从原图学习产生offsets的核的过程

最后祝各位科研顺利，身体健康，万事胜意~

Original: https://blog.csdn.net/qq_45122568/article/details/124190576
Author: 暖风️
Title: 可变形卷积：Deformable Convolutional Networks

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/532585/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【阅读笔记】HOW DO VISION TRANSFORMERS WORK?

原论文地址：https://arxiv.org/abs/2202.06709 目录 Abstract 1.Introduction 1.1 Realted Work 1.2 Con…

人工智能 2023年7月14日
00102
BERT 预训练模型及文本分类

来源蓝桥购买的课程，试验记录BERT 预训练模型及文本分类介绍如果你关注自然语言处理技术的发展，那你一定听说过 BERT，它的诞生对自然语言处理领域具有着里程碑式的意义。本次试验…

人工智能 2023年7月2日
0089
MultinomialNB

贝叶斯之多项式朴素贝叶斯概要：贝叶斯定理是关于随机事件A和B的条件概率（或边缘概率）的一则定理。其中P(A|B)是在B发生的情况下A发生的可能性。多项式朴素贝叶斯多用于高维度向量…

人工智能 2023年6月16日
0071
使用Bert预训练模型进行中文文本分类（基于pytorch）

前言最近在做一个关于图书系统的项目，需要先对图书进行分类，想到Bert模型是有中文文本分类功能的，于是打算使用Bert模型进行预训练和实现下游文本分类任务数据预处理 2.1 输…

人工智能 2023年6月30日
00118
torch.cuda.is_available()返回false——解决办法

Original: https://blog.csdn.net/qq_46126258/article/details/112708781Author: Nefu_lyhTitle…

人工智能 2023年7月21日
0051
无人机+强化学习开源项目、工具包汇总

写在最前：科研小废物一枚，在搞强化学习+无人机，以下内容均为我的导师在github上给我找到的开源项目/工具包，仅供参考。P.s：目前只是做一个汇总，并没有按个安装与尝试，DDDD…

人工智能 2023年6月16日
0094
neo4j构建郑州2022-年前疫情知识图谱

neo4j构建知识图谱（python编程疫情知识图谱）一、知识图谱简介历史由来什么虚头八脑的咱就直接跳过了，说一说我自己对知识图谱的理解吧。知识图谱理解起来很简单，知识+图谱…

人工智能 2023年6月1日
0092
蚁群算法求解TSP问题（Python实现）

算法简介蚁群系统(Ant System或Ant Colony System)是由意大利学者Dorigo、Maniezzo等人于20世纪90年代首先提出来的。他们在研究蚂蚁觅食的过…

人工智能 2023年7月28日
0072
Halcon边缘检测Sobel、Laplace和Canny算子

提示：文章参考了网络上其他作者的文章，以及相关书籍，如有侵权，请联系作者。文章目录前言一、像素级边缘提取 * 1.经典的边缘检测算子 2.边缘检测的一般流程 3.sobel＿…

人工智能 2023年6月24日
0057
注意力机制(Attention)原理详解

文章结构 1. 为什么需要Attention 2. Attention的基本原理 3.自注意力机制（Self-Attention） 4.总结为什么需要Attention 在了解A…

人工智能 2023年5月30日
00100
python线性回归

一.理论基础 1.回归公式对于单元的线性回归，我们有：f(x) = kx + b 的方程(k代表权重，b代表截距）。对于多元线性回归，我们有：或者为了简化，干脆将b视为k0·x0,…

人工智能 2023年6月18日
0099
10.26 要尝试让自己安静下来，去做该做的事而不是让内心烦躁，焦虑，毁掉你本就不多的热情和定力

要尝试让自己安静下来，去做该做的事而不是让内心烦躁，焦虑，毁掉你本就不多的热情和定力 ; 复习 import torch import torch.nn as nn import …

人工智能 2023年7月23日
0044
2021电赛F题数字识别和巡线部分

文章之前12月发了一次，但是我后来申请的免毕设后，用到了一些文字，所以删了这篇文章，但是还是查重了，于是我把一些程序讲解先删了，等毕设结束后再编辑加上。这次电赛我没有准备多少东西…

人工智能 2023年6月16日
0073
PyTorch 入门：训练一个深度神经网络(DNN)

准备知识 1. NumPy 为什么要学 NumPy？弄懂了 NumPy 的 array，可以轻松上手 PyTorch 的 tensor。请看这个对比：torch v.s. nump…

人工智能 2023年6月16日
00106
深度学习地震勘探入门

深度学习地震勘探入门简介我们在论文中提供了一个例子，但由于数据不容易下载，许多学生没有通过测试。在这篇文章中，我们详细诠释了这个例子，提供手把手教学，并将数据上传到百度网盘。如…

人工智能 2023年5月25日
0078
Python、Pycharm、Pytorch、Anaconda之间的安装、关系；深度学习环境配置

Python：人与计算机交流的一种语言。 Pycharm：集成开发环境（编写代码的软件）。下载pycharm后右键菜单变宽：win+R，输入regedit，找到HKEY_CLAS…

人工智能 2023年7月21日
0065

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

可变形卷积：Deformable Convolutional Networks

Deformable Convolutional Networks

大家都在看