EfficientNet系列(1): EfficientNetV2网络详解

2023年6月25日下午12:17 • 人工智能 • 阅读 72

EfficicentNet网络简介

EfficientNet:Rethinking Model Scaling for Convolutional Neural Networks,这篇论文是Google在2019年发表的文章。

EfficientNet这篇论文，作者同时关于 输入分辨率，网络深度，宽度对准确率的影响，在之前的文章中是 单独增加图像分辨率或增加网络深度或单独增加网络的宽度，来试着提升网络的准确率。在EfficientNet这篇论文中，作者使用了 网络搜索技术NAS去同时探索输入分辨率，网络深度、宽度的影响。

EfficientNet的效果究竟如何呢?

这幅图是原论文作者给出的关于Efficient以及当时主流的一系列分类网络的 Top-1的准确率，我们发现

EfficientNet&#x4E0D;&#x4EC5;&#x5728;&#x53C2;&#x6570;&#x6570;&#x91CF;&#x4E0A;&#x6BD4;&#x5F88;&#x591A;&#x4E3B;&#x6D41;&#x6A21;&#x578B;&#x8981;&#x5C0F;&#x4EE5;&#x5916;&#xFF0C;&#x51C6;&#x786E;&#x7387;&#x660E;&#x663E;&#x4E5F;&#x8981;&#x66F4;&#x597D;

。

论文中提到，本文提出的 EfficientNet-B7在ImageNet top-1达到了当年最高的准确率 84.3%，与之前准确率最高的GPipe相比，参数数量仅为其1/8.4，推理速度提升了 6.1倍

; 网络对比（宽度、深度、分辨率）

图b,在图a的基础上单独增加了网络的 宽度(宽度代表的是 特征层的channel)
图c,在图a的基础上单独增加了网络的 深度，明显可以看到相对于图a，它的 layers明显更多了，网络会变得更加深
图d，在图a基准网络的基础上对图像的 分辨率进行了增加，提升图像的分辨率我们得到的每个特征矩阵 高和宽会相应的增加
图e, 对网络同时增加网络的宽度、深度以及输入图像的分辨率
根据以往的经验，增加网络的深度depth能够得到更加丰富、复杂的特征并且能够很好的应用到其他任务中。 但网络的深度过深会面临梯度消失，训练困难的问题。
增加网络的 width能够获得更细粒度的特征并且也更容易训练，但对于 width很大而且深度较浅的网络往往很难学习到更深层次的特征。
增加输入网络的 图像分辨率能够潜在得获得 更高细粒度的特征模板，但对于非常高的输入分辨率，准确度的增益也会减少。并且大分辨率图像会增加计算量。

从上图可以看出， scale by width, scale by depth, scale by resolution,发现这三条虚线基本上在准确率达到 80%以后基本上就饱和了不在增加了。对于红色的线，我们同时增加网络的 宽度、深度、分辨率，我们发现它达到了 80%的准确率后并没有出现饱和的现象，并且还可以继续增长上去。这就说明了我们同时增加网络的 深度、宽度、分辨率的话，我们是可以得到一个更好的结果的.

并且当理论的计算量相同时，我们同时增加网络的深度、宽度、分辨率的话，网络的效果会更好。

EfficientNet-B0 Network

EfficientNet-B0网络，也是作者通过 网络搜索技术得到的，它的详细网络参数如下表

EfficientNet-B0 网络结构

我们发现在 Efficient中 stage一共有 1~9个stage。 stage 1是一个 3x3的卷积层。对于 stage2~stage8我们能够发现，它是在重复堆叠 MBConv，这里的 MBConv就是 MobienetConv ，后续会讲到。Stage 9 是由3部分构成:Conv 1×1 和Pooling 和FC`层。
这里的分辨率(Resolution),对应的是输入每个 Stage的高度和宽度
Channels，对应我们每个 Stage输出特征矩阵的 channel个数，
Layers: 将我们对应的 Operator重复多少次，比如 stage3对应的 Layers为 2,就会对 MBConv6重复两次
这里的 stride对应的 Layers对应的第一层的 stride,其他的步距都等于1的。

; EfficientNet-B0 Network

MBConv 模块

论文中其实也说了，MBConv其实和MobileNet v3使用的Block是一样的。我们来简单看下在 Efficient中我们使用的MBConv它的结构。

首先对我们的主分支而言，是一个 1x1的卷积一般是用来升维的，然后通过BN以及 Swish激活函数
紧接着通过一个 DW卷积，它的卷积核是 k x k，k可能是 3也可能是 5,这里的步距可能是 1也可能是 2.
紧接着将 DW卷积的输出通过 BN和 Swish激活函数之后，在通过一个 SE模块。
紧接着在通过一个 1x1的卷积，这里的 1x1卷积启动一个降维的作用，注意这里只有一个 BN,没有 swish激活函数。
紧接着在通过一个 dropout操作
然后将我们输入特征矩阵，从我们 捷径分支引过来，直接与我们主分支得到的 输出特征矩阵进行 相加得到我们对应的 输出。

这里需要注意几个点：

第一个升维的卷积层，它的卷积核个数是输入特征矩阵 channel的n倍，这里的n对应的是多少呢，就是我们 Operator对应的MBCov对应的数字,就是我们的倍率因子n
对于MBConv最后一个降维的卷积层，它的卷积核个数等于多少呢，它就是对应我们上图表格中对应的 Channels来进行设置的。这里 Channels等于多少，我们这里 1x1卷积核个数就等于多少。
第2个注意点就是当MBConv1时，即此时n=1的时候，我们是不需要 1x1的卷积层的，因为我们知道第一个 1x1卷积主要起到升维作用，那么当n=1的时候相当于并没有升维。对应的就是表格中的 Stage2中对应的 operator是 MBConv1,它这里的MBConv是没有 1x1的卷积层的
关于 shortcut连接，仅当输入 MBConv结构特征矩阵与输出的特征矩阵shape相同的时才存在

SE模块

首先对输入特征矩阵的 feature map的每一个 channel进行平均池化操作
，然后在分别通过两个全连接层。
注意的是第一个全连接层的激活函数是 Swish激活函数，第二个全连接层的激活函数使 sigmoid激活函数。
-第一个全连接层的节点个数是输入该 MBConv特征矩阵 channels的1/4，第二个全连接层的节点个数等于 feature_map的 channels个数,这里的 feature_map就 MBConv中 DW输出的特征矩阵。

EfficientNet-B0~ EfficientNet-B7网络参数

EfficientNet-B0~ EfficientNet-B7网络的结构都是一样的，就是网络的 input_size, width_coefficient, depth_coefficient等参数设置存在差异。
width_coefficient代表channel维度上的倍率因子，比如在 EfficientNetB0中的Stage1的3×3卷积层所使用的卷积核个数是32，那么在B6中就是 32 x 1.8=57.6接着取整到离它最近的8倍整数即56，其他stage同理。
depth_coefficient代表 depth维度上的倍率因子（仅针对 Stage2到 Stage8），比如在 EfficientNetB0中Stage7的 L=4,那么在 B6中就是 4 x 2.6 =10.4，接着向上取整即11
drop_connect_rate它对应的就是MBConv当中的dropout层的随机失活比例，注意并不是所有MBConv层的dropout都等于0.2.在源码实现中，将所有的MBConv结构中dropout层的随机失活比率从0一直慢慢增长到所给定的 drop_connect_rate,
最后一个 dropout_rate对应的是 EfficientNet最后全连接层之前对应的dropout失活比率

; 性能对比

EfficientNet-B0对比的是我们ResNet-50以及我们DenseNet-169,我们可以看到它的准确率是最高的，参数量是最少的，它的理论上的计算量是最低的。同样B1~B7都对一系列网络进行了对比
不过在实际使用过程中， 首先它的准确率确实是挺高的，然后它的参数个数确实也很少，这是毋庸置疑的。但是有个问题网络训练时 非常占GPU的显存，因为在我们EfficientNet中像 B4,B5,B6,B7这些模型，它的输入图片的分辨率非常大导致我们每一个层结构输出特征矩阵的高和宽都要相应的增加。所以对于我们显存的占用也会增加。
而且对于速度直接对比 Flops是不完全对的， 真实情况下我们所关注的速度其实是在设备上的推理的速度;真实的推理速度和Flops其实不是直接相关的，它还有很多其他因素的影响， 所以如果你能给出在某些设备上它的推理时间的话会更加有意义

Original: https://blog.csdn.net/weixin_38346042/article/details/125813186
Author: @BangBang
Title: EfficientNet系列(1): EfficientNetV2网络详解

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/650893/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

PyTorch环境配置及安装

环境配置温馨提示：为了更好的教程体验，提供视频、阅读地址 Github: Original: https://blog.csdn.net/qq_43328166/article/…

人工智能 2023年7月21日
0048
图解数据分析(15) | Pandas – 数据分组与操作（数据科学家入门·完结）

作者：韩信子@ShowMeAI 教程地址：https://www.showmeai.tech/tutorials/33 本文地址：https://www.showmeai.tech…

人工智能 2023年7月7日
0055
基础篇：一文讲懂树莓派命令行文本编辑工具Vim的使用

简介众所周知，在Linux系统下的命令行调试界面，经常会遇到需要文本编辑的情况，而树莓派官方系统默认自带了Nano编辑器，Nano的操作门槛更低，但却不如Vim编辑器方便。Vim…

人工智能 2023年6月12日
0062
【强化学习】深入浅出强化学习–机器人找金币

定义和初始化首先自定义环境，自定义的环境将继承 gym.env环境。在初始化的时候，可以指定环境支持的渲染模式（例如 human, rgb_array, ansi)以及渲染环境的…

人工智能 2023年6月30日
0078
Gabor滤波器特征提取原理讲解及c++实现

文章目录 Gabor滤波器 * 复正弦载波高斯滤波参数解释 gabor滤波核实现效果： Gabor滤波器 1946年,Dennis Gabor于在”Theory …

人工智能 2023年6月20日
00128
手把手教你安装CUDA（一看就会）

1.背景学习深度学习的话,肯定需要安装PyTorch和TensorFlow,安装这两个深度学习框架之前得安装CUDA. CUDA是什么? CUDA是一个并行计算平台和编程模型，能…

人工智能 2023年6月16日
0090
xgboost自定义损失函数&评估函数

xgb.train()中的两个参数：obj => 自定义目标/损失函数，模型优化的目标，用来衡量真实值与模型预测值之间的差距feval => 自定义评估函数，评价函数用…

人工智能 2023年6月19日
00100
python-数据描述与分析（利用Pandas处理数据）

2.利用Pandas处理数据2.1 汇总计算当我们知道如何加载数据后，接下来就是如何处理数据，虽然之前的赋值计算也是一种计算，但是如果Pandas的作用就停留在此，那我们也许只是看…

人工智能 2023年7月8日
0072
M1 安装tensorflow python3.8.2

py3.8.2 尝试的方法1： Tensorflow installation in Mac M1 (from source): 1) open Terminal Get Info…

人工智能 2023年5月24日
0071
PyTorch到底好用在哪里?

一、全面性随着PyTorch逐渐成熟，我预计这部分的差距会趋近于零。但目前，TensorFlow还是有一些PyTorch不支持的功能。它们是：沿维翻转张量（np.flip, n…

人工智能 2023年5月25日
0086
【Qt&OpenCV QGraphicsView显示OpenCV读入的图片】

文章目录前言一、新建Qt项目[ProjCV] * 1. Qt–如下7图所示建立新项目，命名：ProjCV，Detials页面内容采用默认，可以自己规划命名。 2. …

人工智能 2023年6月20日
0089
目标检测中的损失函数IoU、GIoU、DIoU、CIoU、SIoU

IoU损失函数 IoU损失是目标检测中最常见的损失函数，表示的就是真实框和预测框的交并比，数学公式如下：I o U = ∣ A ∩ B ∣ ∣ A ∪ B ∣ IoU =\frac…

人工智能 2023年5月26日
0094
什么蓝牙耳机佩戴舒适？佩戴舒适的蓝牙耳机推荐

很多人长时间佩戴蓝牙耳机会有耳鸣的症状，对于耳朵比较敏感的人，最好是选择耳机体积比较小，重量也比较轻的蓝牙耳机。有些蓝牙耳机还会使用亲肤液态硅胶之类的”非塑胶材料&#8…

人工智能 2023年6月28日
0080
人工智能基础 | Python实现洗衣机模糊推理系统

运行环境 Pycharm + Anaconda3 已知一组污泥和油脂两个参数的 模糊集合，以…

人工智能 2023年6月24日
0084
解决 JanusGraph – but mismatched timestamps； no lock column contained our timestamp (2020-10-12T02:09:

1. 问题描述启动Apache Atlas时，报错信息如下 Caused by: org.janusgraph.diskstorage.PermanentBackendExcep…

人工智能 2023年6月10日
00108
pytorch学习笔记八：nn网络层——激活函数层

结合pytorch中的激活函数，来总结一下深度学习中的激活函数一、激活函数的概念和作用概念：在神经网络中每个神经元节点接受上一层神经元的输出作为本神经元的输入，并将输出值传入到…

人工智能 2023年7月13日
0044

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31