DiffusionDet: Diffusion Model for Object Detection

2023年10月8日上午3:51 • Python • 阅读 59

paper: https://arxiv.org/abs/2211.09788

code：https://github.com/ShoufaChen/DiffusionDet

探索了扩散模型在非生成类任务（目标检测）中的应用。相较于传统Coarse-to-fine方法，基于扩散思路训练有两个特点：1）随机性：结果具有一定的随机性，可用于Ensemble；2）迭代次数：不受训练时迭代次数限制。
比较遗憾的是提升较为有限。对第一个特性：300 bboxes -> 4000 bboxes，提升1.1 AP；对第二个特性：1 step -> 9 steps，提升1.2 AP。
比较惊喜的是增加bboxes数量，对推理速度影响不大。

Motivation

对于目标检测，如何设计候选目标至关重要。现有方法包括：1）Empirical object priors，特点是候选目标的形状和数量是固定的，例如：sliding windows，region proposals，anchors等；2）Learnable object quires，特点是候选目标是需要学习的，且数量固定，例如：DETR。
本文考虑能否进一步简化候选目标，例如不需要Learnable quires。进一步，本文提出noise-to-box paradigm，即从随即框中逐步恢复出目标框。

DiffusionDet: Diffusion Model for Object Detection

Method

Architecture

由于去噪过程存在多步采样，为了节省推理时间，将模型解耦为Image Encoder和Detection Decoder。

Image Encoder. 目标是提取图片特征，结构包括：ResNet + FPN / Swin + FPN。
Detection Decoder.目标是基于随机框得到的RoI特征，计算目标框和分类结果，结构式类似DETR的decoder。RoI特征的提取参考了Faster R-CNN系列，通过随即框大小，选择对应FPN层提取特征。

Training

Ground truth boxes padding. 目标是将GT框数量填充到固定数量，例如100/300等。最佳策略是填充基于高斯分布随机生成的框；
Box Corruption. 目标是基于GT框和随机扩散时间t生成噪声框。其中为了增大信噪比，会先放大GT框的值。然后基于扩散规则加噪：

Training Losses. 和DETR类似的匹配损失：set prediction loss。

Inference

Sampling step. 目标是基于DDIM的采样规则，更新结果。DDIM相较于DDPM：1）新增参数σ控制去噪过程。在特殊情况下，DDIM可以等价于DDPM，同时，当σ=0时，扩散结果和初始高斯噪声一一对应。2）加速采样：采样步数可以是完整步数的子集。DiffusionDet基于DDIM进行采样，使得DiffusionDet的预测结果由初始随即框决定，同时推理时，可使用任意采样步数。
Box Renewal. 目标是去除与训练数据分布不一致的预测结果。具体来说，会将低于阈值的预测结果替换为基于高斯分布的随机框。
*Once-for-all. DiffusionDet的特点在于仅需一次训练，模型即适用于多种测试设定：1）任意数量的预测框；2）任意数量的采样步数。

Experiment

Setting

Datasets. 1）MS-COCO：118K训练数据，5K测试数据，80类目标；2）LVIS v1.0：100K训练数据，20K测试数据，1203类目标。
Inference details. MS-COCO选择分数前100的预测；LVIS选择分数前300的预测；后处理：集成每个采样步的结果，经过NMS处理后作为最终输出。

Main Properties

测试once training for all inference cases的两个应用

Dynamic boxes. 增加测试框数量，可以提高检测效果；对于DETR：1）当N_eval < N_train，选择前N_eval个作为输出；2）当N_eval > N_train，其余结果来自随机queries；

Progressive refinement. 增加采样步数，可以提高检测效果。

Benchmarking

Ablation Study

1. Signal scale：考虑到框数据维度低，远小于image-to-image任务，因此需要增大信噪比；
1. GT boxes padding：基于高斯分布的随机框效果最佳；
1. Sampling strategy：DDIM和box renewal效果近似，同时使用效果最佳；
1. Matching between：N_eval = N_train时效果最佳；
1. Accuracy vs. speed：框数量从100增加到300，FPS仅减少了0.3；但是step从1增加到4，FPS减少了18.9；
1. Random seed：训练了5个模型，并基于10组随机种子测试。实验发现：1）随机种子对测试结果影响较小，震荡范围在0.1-0.3之间；2）随机种子对模型训练结果影响小，均值在45.0附近。

Original: https://blog.csdn.net/qq_40731332/article/details/127978374
Author: zzl_1998
Title: DiffusionDet: Diffusion Model for Object Detection

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/793827/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

win10系统下使用openvino部署yolov5模型

文章目录前言一、环境 * 1、硬件 2、软件二、YOLO模型三、新建Qt项目 * 1、pro文件 2、main.cpp 四、效果五、后记前言上一篇介绍过使用onnxr…

Python 2023年10月9日
0081
Java安全之Mojarra JSF反序列化

Java安全之Mojarra JSF反序列化 About JSF JavaServer Faces，新一代的Java Web应用技术标准，吸收了很多Java Servlet以及其他…

Python 2023年10月15日
0035
Django 企业级接口自动化测试平台实战（一）

一、Django简介 Python的WEB框架有Django、Tornado、Flask 等多种，Django是重量级选手中最有代表性的一位，它的优势为：大而全，框架本身集成了OR…

Python 2023年11月8日
0041
conda 命令、Jupyter安装、CUDA版本查看、CUDA设备检测、CUDA设备带宽检测方法

常用的Conda 命令参看conda信息 conda info 查看已安装的环境 conda info –envs 设置清华源 conda config –add chann…

Python 2023年9月9日
0060
MySQL根据指定字段值判断，给字段拼接指定字符

如上，主要用到两个SQL函数 1、字符串拼接函数： CONCAT(str1,str2,…) 2、CASE WHEN判断函数： CASE sex WHEN ‘1’ THEN ‘男…

Python 2023年6月12日
0065
python series 标准差_Python中pandas数据分析实战（数据创建、清洗）

最近在学习pandas数据分析与实战，将笔记整理如下：学习目标：熟练掌握pandas一维数组Series结构熟练掌握pandas二维数组DataFrame结构和创建方法熟练…

Python 2023年8月21日
0052
跌跌撞撞尝试Scrapy+Selenium+MySQL爬取与存储东方财富网股票数据

目录网页信息爬虫框架 * stock_spider.py(爬虫文件) items.py (爬取字段命名) middlewares.py(Selenium中间件) pipelin…

Python 2023年10月3日
0050
2流高手速成记（之二）：SpringBoot之基础Web开发

接上回现在，我们已经能自行完成SpringBoot的初级项目搭建了，接下来看如何实现一些Web开发中的基础功能。先看项目完整的目录结构： 1. 返回Json数据创建model…

Python 2023年10月21日
0045
flask框架基础

自定义转化器 from werkzeug.routing import BaseConverter class RegexConverter(BaseConverter): def…

Python 2023年8月15日
0045
Scrapy 实践指南1——常用配置

本文基于scrapy 2.6版本说明前言经历了半个月的调参，整理了一些Scrapy中常用的配置和实践方式(都是血和泪的教训TAT) 配置说明 settings.py 常用配置 …

Python 2023年10月4日
0045
python测试框架之Pytest(二) : 测试用例的前置setup&后置teardown用法

目录 pytest中的前置和后置 * 类内外执行：方法细化级setup/teardown 类外执行：模块级（setup_module/teardown_module) 类外执行：函…

Python 2023年9月11日
00110
Python中for语句的使用方法

Python中的for语句用于遍历序列（sequence）中的所有元素，这里的序列可以是列表（list）或者字符串（string）。Python中列表和字符串的使用方法请参考《Py…

Python 2023年10月27日
0033
基于Django Web框架(Python)实现简单的学生管理系统 ——-学习笔记

学生管理系统Web开发 Python之Django笔记作者:bug智造者-小刘我把程序代码运行在云服务器上了，这里献上网址项目地址：首页注意：点击”欢迎使用学生…

Python 2023年8月1日
0063
Lua 支持虚函数的解决方案

概述 2023-02 据实际开发情况，对原来的方案优化，放在了后面 lua的__index元方法本身没有提供类似C++虚函数机制，调用的父类方法调用虚函数可能会出现问题。问题分析…

Python 2023年10月22日
0037
Python数据挖掘Pandas

目录 1 DataFrame * 1.1 构造dataframe 利用DataFrame函数 1.2 常用操作（设置索引） 1.3 MultiIndex与Panel 1.4 Ser…

Python 2023年8月6日
0047
攻防世界-宜兴网信办-inget

题目访问题目路径这个题目的意思就是请输入ID，然后尝试绕过，那应该就是SQL注入，但是呢，我是个懒狗，我直接跑sqlmap 先跑数据库名 sqlmap "http:/…

Python 2023年9月27日
0041

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

DiffusionDet: Diffusion Model for Object Detection

Motivation

Method

Architecture

Training

Inference

Experiment

Setting

Main Properties

Benchmarking

Ablation Study

大家都在看