Inception V3

2023年6月17日上午1:55 • 人工智能 • 阅读 56

Inception V1：主要提出了多分支（多分辨率的filter组合）的网络
Inception V2：主要提出了BN层，提高网络性能（减少梯度消失和爆炸、防止过拟合、代替dropout层、使初始化学习参数更大）
Inception V3：主要提出了分解卷积，把大卷积因式分解成小卷积和非对称卷积、

; 1 介绍

通过大量使用 Inception 模块的降维和并行结构实现的，允许减轻结构变化对附近组件的影响。使Inception更有灵活性。

2 设计原则

避免代表性（表现上）瓶颈，尤其是在网络早期。
通常，在达到任务的最终表示之前，表示 大小应该从输入到输出逐渐减小。
维度信息仅提供对信息内容的粗略估计
更高维的表示更容易在网络内本地处理。
增加卷积网络中每个图块的激活次数可以实现更多解开的特征。由此产生的网络将训练得更快。
空间聚合可以在较低维度的嵌入上完成，而不会损失太多或任何表示能力。
例如， 在执行更分散（例如 3 × 3）卷积之前，可以在空间聚合之前减少输入表示的维度，而不会产生严重的不利影响。
我们假设其原因是相邻单元之间的强相关性导致降维期间信息丢失少得多，如果输出用于空间聚合上下文。
鉴于这些信号应该很容易压缩，降维甚至可以促进更快的学习。

（所以在卷积之前都用1*1卷积进行降维？）
4. 平衡网络的宽度和深度。

3 大filter size卷积的分解

GoogLeNet &#x7684;&#x5927;&#x90E8;&#x5206;&#x539F;&#x59CB;&#x6536;&#x76CA;&#x6765;&#x81EA;&#x4E8E;&#x975E;&#x5E38;&#x6177;&#x6168;&#x5730;**&#x4F7F;&#x7528;&#x964D;&#x7EF4;**&#x3002;
&#x8FD9;&#x53EF;&#x4EE5;&#x770B;&#x4F5C;&#x662F;&#x4EE5;&#x8BA1;&#x7B97;&#x6548;&#x7387;&#x9AD8;&#x7684;&#x65B9;&#x5F0F;&#x5206;&#x89E3;&#x5377;&#x79EF;&#x7684;&#x7279;&#x4F8B;&#x3002;
&#x4F8B;&#x5982;&#xFF0C;&#x8003;&#x8651; 1 &#xD7; 1 &#x5377;&#x79EF;&#x5C42;&#x540E;&#x8DDF; 3 &#xD7; 3

3.1 分解为小卷积

比如用两个3 *3的卷积可以代替5 * 5的卷积

&#x95EE;&#x9898;&#xFF1A;&#x8FD9;&#x6837;&#x4F1A;&#x635F;&#x5931;&#x5377;&#x79EF;&#x5C42;&#x7684;&#x8868;&#x793A;&#x80FD;&#x529B;&#x5417;&#xFF1F;
    &#x662F;&#x5426;&#x6709;&#x5FC5;&#x8981;&#x5728;&#x5206;&#x89E3;&#x540E;&#x7684;&#x7B2C;&#x4E00;&#x5C42;&#x540E;&#x4F7F;&#x7528;&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#xFF1F;
&#x56DE;&#x7B54;&#xFF1A;&#x5206;&#x89E3;&#x4E0D;&#x4F1A;&#x964D;&#x4F4E;representation&#x80FD;&#x529B;
    &#x7B2C;&#x4E00;&#x5C42;&#x540E;&#x4F7F;&#x7528;&#x6FC0;&#x6D3B;&#x51FD;&#x6570;&#x80FD;&#x589E;&#x5F3A;&#x975E;&#x7EBF;&#x6027;&#x80FD;&#x529B;

所以：两个3×3卷积比一个5×5卷积的representation能力更强。减少参数量。另外，分解后多使用了一个激活函数，增加了分线性能力。

3.2 分解为非对称卷积

&#x6211;&#x4EEC;&#x4ECD;&#x7136;&#x53EF;&#x4EE5;&#x95EE;&#x662F;&#x5426;&#x5E94;&#x8BE5;&#x5C06;&#x5B83;&#x4EEC;&#x5206;&#x89E3;&#x4E3A;&#x66F4;&#x5C0F;&#x7684;&#x95EE;&#x9898;&#xFF0C;&#x4F8B;&#x5982; 2&#xD7;2 &#x5377;&#x79EF;&#x3002;
&#x7136;&#x800C;&#xFF0C;&#x4E8B;&#x5B9E;&#x8BC1;&#x660E;&#xFF0C;&#x901A;&#x8FC7;&#x4F7F;&#x7528;&#x975E;&#x5BF9;&#x79F0;&#x5377;&#x79EF;&#xFF0C;&#x53EF;&#x4EE5;&#x505A;&#x5F97;&#x6BD4; 2 &#xD7; 2 &#x66F4;&#x597D;&#xFF0C;&#x4F8B;&#x5982;n &#xD7; 1&#x3002;
&#x4F8B;&#x5982;&#xFF0C;&#x4F7F;&#x7528; 3 &#xD7; 1 &#x5377;&#x79EF;&#x540E;&#x63A5; 1 &#xD7; 3 &#x5377;&#x79EF;&#x7B49;&#x6548;&#x4E8E;&#x6ED1;&#x52A8;&#x5177;&#x6709;&#x4E0E; 3 &#xD7; 3 &#x5377;&#x79EF;&#x76F8;&#x540C;&#x7684;&#x611F;&#x53D7;&#x91CE;&#x7684;&#x4E24;&#x5C42;&#x7F51;&#x7EDC;&#xFF08;&#x89C1;&#x56FE; 3&#xFF09;&#x3002;

在理论上我们可以认为任何n* n的卷积都可以分解为一个n _1的卷积接上一个1_n的卷积，n越大越节约计算资源。
我们只在最粗糙的网格（网格最少）上使用这个解决方案，因为这是产生高维稀疏表示最关键的地方，因为与空间聚合相比，局部处理的比率（通过 1 × 1 卷积）增加了。

4 辅助分类器的效用

我们发现 辅助分类器在训练早期并没有提高收敛性：在两个模型达到高精度之前，有和没有侧头的网络的训练进程看起来几乎相同。
接近训练结束时，有辅助分支的网络开始超越没有任何辅助分支的网络的准确率
因此可以去除较低的辅助分支。
我们认为辅助分类器充当正则化器。：如果侧分支是批量归一化的 [7] 或具有 dropout 层，则网络的主分类器性能更好

; 5 feature map的size的高效减小

一般来说，卷积神经网络使用一些pooling操作来减少grid size of the feature maps。为了避免representation瓶颈，在应用maximum或者average pooling之前需要将activation的维度进行增加。例如，有一个k 通道的d × d的feature maps，如果我们想要得到一个2 k通道的d/ 2× d /2的 feature maps，我们首先需要去进行一个stride为1的2 k 个通道的卷积，然后另外应用一个pooling。

&#x5DE6;&#x56FE;&#xFF1A;&#x5148;&#x8FDB;&#x884C;pooling&#xFF0C;&#x51CF;&#x5C11;&#x8BA1;&#x7B97;&#x91CF;&#xFF0C;&#x4F46;&#x662F;&#x5E26;&#x6765;&#x4E86;representation&#x74F6;&#x9888;&#x3002;
&#x53F3;&#x56FE;&#xFF1A;&#x6B63;&#x5E38;&#x60C5;&#x51B5;&#x4E0B;&#x7684;&#x5377;&#x79EF;&#x6C60;&#x5316;&#xFF0C;&#x4F46;&#x662F;&#x8BA1;&#x7B97;&#x91CF;&#x6BD4;&#x5DE6;&#x56FE;&#x9AD8;&#x4E86;&#x4E09;&#x500D;&#x3002;

我们可以使用两个并行的 stride 为2 模块：P 和 C。 P 是一个池化层（平均或最大池化）激活，它们都是 stride 2，它们的过滤器组如图 10 所示。

6 Inception v3

注意，和Inception v2不同的是，作者将7×7卷积分解成了三个3×3卷积（这个分解在3.1节进行了描述）。网络中有三个Inception模组，三个模组的结构分别采用图5、6、7三种结构。inception模块中的gird size reduction方法采用的是图10结构。
我们可以看到，网络的质量与第二节说的准则有很大关系。尽管我们的网络深达42层，但我们的计算量仅仅是GoogLeNet的2.5倍，并且，它比VGG更高效。

; 7. Label Smoothing模型正则

作者提出了一个正则分类器的机制：消除训练过程中标签丢失的边缘效应。
太难。略

在低分辨率输入情况下的性能

研究分辨率的影响是为了搞清楚：高分辨率是否有助于性能的提升，能提高多少？

一个简单方法是在较低分辨率输入的情况下减少前两层的步幅，或者简单地删除网络的第一个池化层。
作者采用了三种分辨率的图像作为输入。三种情况的计算量是几乎相同的。
此外，表 2 的这些结果表明，可以考虑在 R-CNN [5] 上下文中为较小的对象使用专用的高成本低分辨率网络。

; 9. 实验中的结果和对比

10.结论

作者表明，低输入分辨率的情况下也可以达到近乎高分辨率输入的准确率。这可能有助于小物体的探测。
降低参数量、附加BN或Dropout的辅助分类器、label-smoothing三大技术可以训练出高质量的网络（适当的训练集）

参考文献

Original: https://blog.csdn.net/chairon/article/details/119445971
Author: chairon
Title: Inception V3

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627859/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Git命令快速入门（建议收藏）

目录一、简介二、基本场景Git用法三、工作区、暂存区、本地仓库、远程仓库四、常用命令用法 * git clone git add git commit git status…

人工智能 2023年6月26日
0068
猫狗识别与分类

猫狗识别与分类文章目录猫狗识别与分类 * 一、前言二、环境配置三、源码以及数据集四、基础猫狗识别程序如下 – 1、train.py + train.py程序结…

人工智能 2023年7月1日
0091
时间序列分析的模型应用 – 股价预测

©作者 |董叶时间序列是一种特殊类型的数据集，其中随时间测量一个或多个变量。例如天气变化，股票价格变动，时间序列分析即是通过构建模型反映时间序列中包含的动态依存关系，并借以对…

人工智能 2023年6月16日
0087
【Python刷题篇】——Python入门 011面向对象（二）

🤵‍♂️ 个人主页: @北极的三哈个人主页 👨‍💻 作者简介： Python领域新星创作者。 📒 系列专栏：《牛客刷题-Python篇》《牛客刷题-SQL篇》 🌐推荐《牛客网》—…

人工智能 2023年7月31日
0073
去除Matlab复制图窗到word里时白边

左边Figure1为imshow()结果，右边为改进之后效果。此时再”编辑->复制图窗”就不会有白边了。对于图像来说，竖直往下是x ,水平相右是y。…

人工智能 2023年6月22日
00138
一文详解PnP算法原理

PnP(Perspective-n-Point)问题的几何结构如图1所示，给定3D点的坐标、对应2D点坐标以及内参矩阵，求解相机的位姿。数学语言描述如下：图1.PnP几何结构 …

人工智能 2023年6月16日
00113
Spark与Pandas中DataFrame对比（详细）

工作方式单机single machine tool，没有并行机制parallelism 不支持Hadoop，处理大量数据有瓶颈分布式并行计算框架，内建并行机制paralleli…

人工智能 2023年6月2日
00108
python安装cv2包报错解决方法

1.在pycharm中安装cv2包报错 ERROR: Could not find a version that satisfies the requirement cv2 (fr…

人工智能 2023年6月19日
0076
python遗传算法（应用篇1）–求解一元函数极值

目录遗传算法求解过程 * 算法参数构建初始化种群解码（二进制>十进制）自然选择交叉变异解码（新种群>十进制）计算新种群的适应度完整代码及其可视化版本 …

人工智能 2023年6月30日
00116
用python编写录音机——记录一定时间的声音

先看代码👇 import pyaudio import wave def get_wav(sec): #创建对象 pa = pyaudio.PyAudio() #创建流：采样位，声…

人工智能 2023年5月25日
0096
R语言两个dataframe纵向合并或者为dataframe添加数据行实战

R语言两个dataframe纵向合并或者为dataframe添加数据行实战目录 R语言两个dataframe纵向合并或者为dataframe添加数据行实战 Original: h…

人工智能 2023年5月31日
0077
【图像压缩】自回归模型《Joint Autoregressive and Hierarchical Priors for Learned Image Compression》

1. 绪论第一个在PSNR和MS-SSIM都优于BPG的学习模型。引入自回归模型改善熵模型，虽然自回归模型计算很慢，但作者发现在图像压缩领域，自回归模型与多层先验模型互补，能够比…

人工智能 2023年6月17日
0073
(一) KNN和Kmeans分析

KNN、Kmeans是常用机器学习算法，但也经常弄混。本文将详细介绍这两种算法含义、实现过程、用途、区别等方面进行详细讲解。 1、KNN 属于监督学习，属于分类学习（需要进行训练）…

人工智能 2023年5月31日
00157
高效使用Vscode（C++&Python）

1.关于vscode 下载地址： https://code.visualstudio.com/download (linux / win)建议：拥有一个 微&…

人工智能 2023年7月5日
0096
TextCNN代码解读及实战

摘要这几天使用TextCNN做文本分类，记录一下学习过程，数据集使用cnews，代码参考github上的代码，地址：https://github.com/BeHappyForMe…

人工智能 2023年7月21日
0052
尚硅谷Promise笔记

文章目录一、Promise介绍与基本使用 * 1-1.初体验之promise封装ajax请求 1-2.Promise对象状态属性PromiseState的值有三个 1-3.Pro…

人工智能 2023年7月31日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Inception V3

目录

3.1 分解为小卷积

3.2 分解为非对称卷积

大家都在看