【论文笔记】EfficientDet（BiFPN）（2020）

2023年6月17日上午8:03 • 人工智能 • 阅读 68

最早的Neck部分（特征融合）最经典的就是从backbone中提取高层金字塔特征直接预测，如下图 a、b、c 三个模块，但是这种结构没有进行特征融合所有精度都比较低；
而后就提出了基于特征融合思想的FPN，如图 d , 在FPN中建立一条自上而下的通路，进行特征融合，用融合后的具有更高语义信息的 feature map 进行预测，可以提高一定的精度。但是经过我们研究发现这种自顶向下的FPN网络受到单向信息流的限制，精度还是不行（YOLO V3中使用）；
而近年来使用最多的当属PANet，在YOLOV4和V5中都是以它为Neck。它是在FPN的基础上再建立一条自下而上的通路，这么做的思路是：高层的feature map具有更强的语义信息（有利于物体分类），底层的feature map具有更强的位置信息（有利于物体定位），虽然FPN结构使得预测 feature map提高了语义信息但是理论上肯定丢失了很多的位置信息，所以再新建一条从下往上的通路，将位置信息也传到预测 feature map中，使得预测 feature map同时具备较高的语义信息和位置信息（有利于目标检测）。这样做可以大大的提高目标检测任务精度。具体结构如下图 b 所示；
还有今年来提出的NAS-FPN结构。使用近年比较热门的neural architecture search(NAS)技术搜索最佳的网络结构。虽然这种结构的效果最好，但是搜索得到的网络不规则、难以解释和修改，而且使用NAS技术非常耗时耗力，所有并不推荐。具体结构如下图 c所示；
基于此，我们提出了新型的Neck（特征融合）网络结构 BiFPN，如下图 d所示，详细的设计思路我们在下一张再慢慢探讨。

; 二、新型Neck结构：BiFPN

BiFPN 全称 Bidirectional Feature Pyramid Network 加权双向（自顶向下 + 自低向上）特征金字塔网络。

相比较于PANet，BiFPN在设计上的改变：

总结下图：
图d 蓝色部分为自顶向下的通路，传递的是高层特征的语义信息；红色部分是自底向上的通路，传递的是低层特征的位置信息；紫色部分是上述第二点提到的同一层在输入节点和输入节点间新加的一条边。

我们删除那些只有一条输入边的节点。这么做的思路很简单：如果一个节点只有一条输入边而没有特征融合，那么它对旨在融合不同特征的特征网络的贡献就会很小。删除它对我们的网络影响不大，同时简化了双向网络；如上图d 的 P7右边第一个节点
如果原始输入节点和输出节点处于同一层，我们会在原始输入节点和输出节点之间添加一条额外的边。思路：以在不增加太多成本的情况下融合更多的特性；
与只有一个自顶向下和一个自底向上路径的PANet不同，我们处理每个双向路径(自顶向下和自底而上)路径作为一个特征网络层，并重复同一层多次，以实现更高层次的特征融合。如下图EfficientNet 的网络结构所示，我们对BiFPN是重复使用多次的。而这个使用次数也不是我们认为设定的，而是作为参数一起加入网络的设计当中，使用NAS技术算出来的。
Weighted Feature Fusion 带权特征融合：学习不同输入特征的重要性，对不同输入特征有区分的融合。
设计思路：传统的特征融合往往只是简单的 feature map 叠加/相加 (sum them up)，比如使用concat或者shortcut连接，而不对同时加进来的 feature map 进行区分。然而，不同的输入 feature map 具有不同的分辨率，它们对融合输入 feature map 的贡献也是不同的，因此简单的对他们进行相加或叠加处理并不是最佳的操作。所以这里我们提出了一种简单而高效的加权特融合的机制。
常见的带权特征融合有三种方法，分别是：
Unbounded fusion:O = ∑ i w i ∗ I i O = \sum_{i} w_i * I_i O =∑i w i ∗I i 这种方法比较简单，直接加一个可学习的权重。但是由于这个权重不受限制，所有可能引起训练的不稳定，所有并不推荐。
Softmax-based fusion:O = ∑ i e w i ∗ I i ϵ + ∑ j e w j O = \sum_{i} \frac{e^{w_i} * I_i}{ \epsilon+\sum_{j}e^{w_j}}O =∑i ϵ+∑j e w j e w i ∗I i 使用这种方法可以将范围放缩到[ 0 , 1 ] [0, 1][0 ,1 ] 之间，训练稳定，但是训练很慢，所有也不推荐。
Fast normalized fusion:O = ∑ i w i ∗ I i ϵ + ∑ j w j O = \sum_{i} \frac{w_i * I_i}{ \epsilon+\sum_{j}w_j}O =∑i ϵ+∑j w j w i ∗I i 这种方法类似于Softmax也是将范围放缩到[ 0 , 1 ] [0, 1][0 ,1 ] 之间，而且训练速度快效率高，所以我们使用这种带权特征融合方法。下面简单的举个例子，看看我们是如何使用这个带权特征融合方法的，以计算如下图的 P6层输出为例：

计算表达式为：

其中 Resize操作通常是下采样或上采样操作；w 是我们学习到的参数，用于区分特征融合过程中不同特征的重要程度，有点类似于注意力机制。

总结BiFPN = 新型加强版的PANet(重复双向跨尺度连接) + 带权重的特征融合机制

三、EfficientDet的网络结构

Backbone: EfficientNet
Neck: BiFPN = 新型加强版的PANet（重复双向跨尺度连接）+ 带权重的特征融合机制
head: shared class and box network

; 四、PyTorch实现model

待更新

Original: https://blog.csdn.net/qq_38253797/article/details/118439965
Author: 满船清梦压星河HK
Title: 【论文笔记】EfficientDet（BiFPN）（2020）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/629278/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

西瓜书第三章阅读笔记

西瓜书第三章阅读笔记第三章线性模型 * 1、机器学习三要素 2、基本形式 3、线性回归 – 3.1 模型 3.2 策略 3.3 求解算法 4、对数几率回归 &#82…

人工智能 2023年6月18日
0080
图神经网络对抗攻击的综述

摘要最近的研究发现，图神经网络（GNN）容易受到对抗攻击。通过对原始图做修改，可以使得GNN最后得到错误的预测结果。GNN的这种脆弱性使得很多对于安全性要求很高的应用场景都开始产…

人工智能 2023年6月1日
0049
Python学习 | 2021-11-05 Scipy聚类色彩提取

目录一、聚类分析 1、聚类 2、Scipy中的聚类算法（K-Means） 3、聚类示例完整代码：运行结果：函数使用：二、图像色彩聚类操作步骤：完整代码：运行结果： …

人工智能 2023年5月31日
0080
第二节-戴师兄数据分析学习笔记-重新认识数据分析

目录具体内容：两个问题从不需要数据分析道需要数据分析，中间发生了什么？建数仓 1、数据分析的工程技术 2、传输存储 3、提取回流 4、清洗处理： 5、连接导入 6、分析建模…

人工智能 2023年7月16日
0042
图像四则运算（加减乘除）

图像的代数运算实验目的： 1．了解图像的算术运算在数字图像处理中的初步应用。 2．体会图像算术运算处理的过程和处理前后图像的变化。 3.能够实现简单的图像处理实验原理：图像的…

人工智能 2023年6月17日
0060
双目相机标定

一.运行环境 opencv2、windows、vs 二.图像获取、分割、保存参考博客opencv打开双目摄像头、图像切割保存_scutqq的博客-CSDN博客_双目图像分割#in…

人工智能 2023年7月18日
0053
超七成阅读APP都借百度语音技术促用户增长

全国十多亿人在这个春节集体”关门闭户”与手机和网络作伴，除了手游和短视频流量飞涨，在线阅读也迎来”高光时刻”，特别是当手机阅读APP…

人工智能 2023年5月25日
0068
UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xff in position 41: invalid start byte

在代码再现过程中，笔者在读取数据时遇到错误： [En] In the process of code reproduction, the author encountered an…

人工智能 2023年5月27日
0082
python2 安装tensorflow 报错 descriptor 文件报错 Syntax Error: invalid syntax 解决办法

百度很久，当时怀疑tensorflow 不支持python2 ，因为确实在查到了这个说法。前前后后卸载重装tensorflow 1.4.0 、1.13.0、 2.0等多个版本最…

人工智能 2023年5月26日
0077
WARNING: Retrying (Retry(total=4, connect=None, read=None, redirect=None, status=None))

没想到换个地方配置环境还能解锁新的报错！不愧是你Anaconda！ WARNING: Retrying (Retry(total=4, connect=None, read=Non…

人工智能 2023年5月25日
00192
基于知识图谱的对话系统

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0058
简单的小复习(一)

这里写目录标题 * – 冒泡排序 – 选择排序 – 插入排序 – 快速排序 – 双边循环 – 什么是面向对象…

人工智能 2023年6月26日
0054
【推荐实践】阿里文娱面向用户增长的信息流分发机制

今天给大家带来阿里文娱-人工智能部-信息流推荐的天师所做的分享《阿里文娱面向用户增长的信息流分发机制》,关注推荐算法、信息流分发、用户增长的伙伴们别错过啦！（到小程序：省时查报告 …

人工智能 2023年6月10日
0081
torch.load()加载模型及其map_location参数

函数格式为： torch.load(f, map_location=None, pickle_module=pickle, **pickle_load_args)，一般我们使用的时…

人工智能 2023年6月16日
0088
[VOT6](2022CVPR)ToMP：Transforming Model Prediction for Tracking（未完+质量差）

Abstract 背景：基于优化的跟踪方法通过集成目标模型预测模块获得了广泛的成功，其通过最小化目标函数提供有效的全局推理。虽然这种归纳偏差整合了宝贵的领域知识，但它也限制了跟踪…

人工智能 2023年5月28日
0079
【Python数据分析学习实例】对学生成绩单和信息进行整合以及数据分析

问题描述自建EXCEL文件，分为2个工作区，分别存放学生信息表（不少于30人）和班级职务表（不少于4种职务）。如信息表：学号姓名性别数学英语Python通信技术1001张…

人工智能 2023年7月8日
0081

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【论文笔记】EfficientDet（BiFPN）（2020）

目录

大家都在看