[DeFRCN] Decouple Faster R-CNN for Few-Shot Object Detection(ICCV 2021)

2023年7月12日下午2:28 • 人工智能 • 阅读 94

[DeFRCN] Decouple Faster R-CNN for Few-Shot Object Detection(ICCV 2021)

; 1. Motivation

本文基于Transfer-Learning Based 以及 Faster R-CNN进行改进。

本文针对分类和回归任务中存在的矛盾点进行分析：

In this paper, we look closely into the conventional Faster R-CNN and analyze its contradictions from two orthogonal perspectives, namely multi-stage (RPN vs. RCNN) and multi-task (classification vs. localization).
Contribution

本文关于网络结构的2个创新点， Gradient Decoupled Layer用于多阶段的解耦，Prototypical Calibration Block用于多任务的解耦。

其中GDL是针对backbone，来解耦之前层和后面层；而PCB则是offline的prototype的分类层，用于boost原有的分类层。

We look closely into the conventional Faster R-CNN and propose a simple yet effective architecture for few-shot detection, named Decoupled Faster R-CNN, which can be learned end-to-end via straightforward fine-tuning.
To deal with the data-scarce scenario, we further present two novel modules, i.e. GDL and PCB, to perform de- coupling among multiple components of Faster R-CNN and boost classification performance respectively.
DeFRCN is remarkably superior to SOTAs on various benchmarks, revealing the effectiveness of our approach.
Method

Backbone、RPN、Box Classifier以及Regressor在fine-tune阶段是trainable，而RCNN是frozen的。

; Problem of multi-task learning

作者认为对于多任务学习来说，子网络的优化目标存在不一致性。

RPN是where to look, RCNN是what to look

classification head需要translation invariant features，而localization head 需要translation covariant features。

因此，可能导致一个suboptimal solution

Problem of shared backbone

由于Backbone的梯度回传和RCNN以及 RPN有关，但是这2者有一定的矛盾性，因此，作者认为这可能会导致FSOD性能的下降。并且在FSOD中，第二阶段的RPN会受到更多的前景-背景的混淆问题foreground-background confusion。因此可能造成对于base classes过拟合梯度的传播，到backbone以及RCNN

which means a pro- posal that belongs to background in the base training phase is likely to be foreground in the novel fine-tuning phase

3.1 Gradient Decoupled Layer

Perform Decoupling with GDL
Optimization with GDL

; 3.2 Prototypical Calibration Block

对于PCB提出的动机：

本文注意到few shot 分类分支产生了很大部分低质量的分数，这驱使我们来消除高得分的FP以及修正低分数的正样本。

We notice that the under-explored few-shot classification branch generates a large amount of low-quality scores, which motivates us to eliminate high-scored false positives and remedy low-scored missing samples by introducing a Prototypical Calibration Block (PCB) for score refinement.

PCB的组成是classifier、RoIAlign、prototype bank。

给定M-way K-shot 任务的support set S，PCB提取了原始的图片特征图，然后直接使用对于GTbox的RoIAlign操作（类似Attention RPN那篇的操作），这样就可以得到对于MK instance的特征表示。这样我们构建一个prototype bank P = p c c = 1 M P= {p_c}^M_{c=1}P =p c c =1 M ，其中对于每一个类别c的prototype的公式如下：

其中subset S只包含某一个类别的所有instance的集合。

给定一个proposal y ^ = ( c i , s i , b i ) \hat y =(c_i, s_i, b_i)y ^=(c i ,s i ,b i ) ，这个proposal就是Faster R-CNN原有分支中fine-tune阶段得到的特征，c是label，s是score，b是box；PCB首先使用RoIAlign在b i b_i b i 上，接着对应x i x_i x i 以及p c i p_{c_i}p c i 应用余弦相似度。

然后使用weight aggregation进行加权：

由于PCB是offline的结构，因此它即插即用，并不会对网络的训练造成很大的开销。并且PCB和proposal的分类分支不贡献参数。

Further- more, since the PCB module is offline without any further training, it can be plug-and-play and easily equipped to any other architectures to build stronger few-shot detectors.

因此，我认为总体而言，这篇DEFRCN，它是对于meta-learning以及transfer-learning的融合，使用Transfer-Learning的总体框架，但是对于分类任务的问题上，他们使用support set 进行一个weight reweighting的融合的操作；不过它还对于backbone的特征的反向进行了修改，尽可能区分分类中的平移不变性以及回归问题的平移协变(covariance)性质。

Experiment

4.1.1 VOC

; 4.1.2 COCO

4.1.3 COCO to VOC

; 4.2 Ablation Study

4.2.1 Effectiveness of different modules

; 4.2.2 Effectiveness of the degree of decoupling

This observation prompts us to perform stop-gradient for RPN and scale-gradient for RCNN in DeFRCN

4.2.3 Can GDL boost conventional detection？

Original: https://blog.csdn.net/weixin_43823854/article/details/120071759
Author: Ah丶Weii
Title: [DeFRCN] Decouple Faster R-CNN for Few-Shot Object Detection(ICCV 2021)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/687818/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

二手车估价问题浅析

问题一：通过给定的二手车交易样本数据”附件1：估价训练数据.txt”文件，选用合适的估价方法，构建相应的数据模型，来对二手车的零售交易价格进行预测，并且数据…

人工智能 2023年7月17日
0061
深度学习算法工程师面试知识点总结（四）

这是算法工程师面试知识点总结的第四篇，有兴趣的朋友可以看看前三篇的内容：深度学习算法工程师面试知识点总结（一）深度学习算法工程师面试知识点总结（二）深度学习算法工程师面试知识点总结…

人工智能 2023年5月26日
00114
LaneATT调试笔记

首先说这个Label,因为input肯定是一张图片,这个毫无疑问,这个Label的构建主要是在LaneDataset中,该类首先构建一个dataset,比如我这里是TuSimple…

人工智能 2023年6月11日
0075
数据分析师必备的python包

1. numpy numpy提供大量数值编程工具，可以方便处理向量矩阵等运算。是科学计算方面的利器。 2. scipy 统计就是在做宏观分析的工作。拿到一组数据，分析数据的特征，具…

人工智能 2023年7月8日
0048
手把手教你使用LabVIEW人工智能视觉工具包快速实现传统Opencv算子的调用(含源码)

文章目录前言一、图像滤波与增强二、图像灰度处理三、阈值处理与设定四、二值化处理五、边缘提取六、角点检测 * 1.使用cornerMinEigenVal算子 2.使用c…

人工智能 2023年6月20日
0080
多模态文档理解：基础概念-数据-模型

文档理解最近在看layoutlm相关的内容，之前没有接触过，顺便把遇到的一些新概念总结一下。基础知识命名实体识别命名实体识别（Named Entity Recognitio…

人工智能 2023年5月30日
0074
onnx转TensorRT使用的三种方式（最终在Python运行）

背景记录下onnx转成TensorRT加速的三种方式 1. 直接使用onnxruntime 在onnxruntime的session初始化的时候第一个provider加入Tens…

人工智能 2023年7月5日
00123
超越前作，实现动漫风格迁移——AnimeGANv2

前言之前一直在研究如何将图像动漫化，尝试了阿里云api和百度api，效果都不尽如人意。结果发现了一个宝藏github项目——AnimeGANv2，能够将现实世界场景照片进行动漫风…

人工智能 2023年6月17日
0072
蓝牙耳机性价比，盘点2021性价比高音质好的蓝牙耳机

随着近年来的发展，蓝牙耳机在我们的生活中已经变得无处不在。蓝牙耳机作为休闲和商务工作的重要配件，但随着它的普及，市面上蓝牙耳机的产品也越来越多，这也让很多刚接触蓝牙耳机的朋友，作为…

人工智能 2023年5月25日
0049
【Python计量】自相关性（序列相关性）的检验

文章目录一、图示法 * （一）滞后图（二）自相关图（三）自相关图和偏自相关图二、DW检验法三、Breusch-Godfrey检验 * （一）手动编制函数进行BG检验（…

人工智能 2023年6月15日
0083
OpenCV：Mat类型与数组的相互转换（16位或8位图像）

1.通过数组生成Mat 有时我们在工程中会接受数组类型的图像，处理起来不太方便，如果将它转化成Mat类型就可以使用opencv庞大的函数库了。对此，Mat本身提供了很方便的构造函数…

人工智能 2023年7月19日
0054
Pytorch中Tensor数据类型转换

Pytorch中Tensor数据类型转换： 1）Tensor的int、float数据类型转换: 在Tensor后加 .long(), .int(), .float(), .doub…

人工智能 2023年7月22日
0052
Google Data Analytics Certification 笔记 1

Contents Prepare data for exploration * 1. Selecting the right data 2. Data formats in pra…

人工智能 2023年7月15日
0070
一文带你了解python opencv中霍夫变换(Hough transform)的常用操作

文章目录前言 * 霍夫直线变换 – cv2.HoughLines cv2.HoughLinesP skimage.transform.hough_line 霍夫直线检…

人工智能 2023年6月18日
00103
halcon 代码注释 print_check.hdev

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月21日
0063
机器学习笔记 – 自动编码器autoencoder

一、什么是自动编码器？自编码器是开发无监督学习模型的主要方式之一。但什么是自动编码器？简而言之，自动编码器通过接收数据、压缩和编码数据，然后从编码表示中重构数据来进行操作。对模…

人工智能 2023年6月13日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31