深度学习-inception模块介绍

本文简单对inception模块的改进进行了简单介绍,包括inception v1、inception v2、inception v3和inception v4。参考了相关博客:详解Inception结构:从Inception v1到XceptionInception模块
一、inception模块的发展历程
首先引入一张图

深度学习-inception模块介绍
2012年AlexNet做出历史突破以来,直到GoogLeNet出来之前,主流的网络结构突破大致是网络更深(层数),网络更宽(神经元数)。所以大家调侃深度学习为”深度调参”,但是纯粹的增大网络的缺点:

1.参数太多,容易过拟合,若训练数据集有限;

2.网络越大计算复杂度越大,难以应用;

3.网络越深,梯度越往后穿越容易消失(梯度弥散),难以优化模型。

那么解决上述问题的方法当然就是增加网络深度和宽度的同时减少参数,Inception就是在这样的情况下应运而生。
二、Inception v1模型
下图中展示了原始Inception(native inception)结构和GoogLeNet中使用的Inception v1结构,使用Inception v1 Module的GoogleNet不仅比Alex深,而且参数比AlexNet足足减少了12倍,网络大小约是VGGNet的1/20。
左图事inception的原始版,右图事inception改进版,通过对模块改进,使用1×1的卷积可以减少参数的积累,故这里提高了深度的同时又提高了宽度且减少了模型参数。

深度学习-inception模块介绍
特点:
1、深度拼接。减少参数
2、1×1卷积。进一步减少参数
三、inception v2
inception v2 基于v1版本进一步改进,引入了BN层,使每一层的输出均进行归一化处理。同时采用两个3×3卷积代替一个5×5的卷积,在此基础上再次优化参数数量并提高运算速度。
深度学习-inception模块介绍
特点:
1、Batch Normalization。这样能够加速网络的收敛。
2、小卷积核替代大卷积核。这样的连接方式在保持感受野范围的同时又减少了参数量,并且可以避免表达瓶颈,加深非线性表达能力。
四、inception v3
卷积分解,将一个n×n卷积更改为1×n和n×1两个卷积
深度学习-inception模块介绍
特点
1、非对称卷积分解
五、inception v4
在残差卷积的基础上进行改进,引入inception v3
深度学习-inception模块介绍
将残差模块的卷积结构替换为Inception结构,即得到Inception Residual结构。除了上述右图中的结构外,作者通过20个类似的模块进行组合,最后形成了InceptionV4的网络结构。
六、总结
(一)深度网络的通用设计原则

1、避免表达瓶颈。特征图应逐渐变小,不能变小幅度过大,造成大量信息丢失。
2、高维特征更易处理。 高维特征更易区分,会加快训练。
3、多汇集。在低维空间进行空间宽度扩展,然后采用深度拼接的方式汇集到一处。
4、底层降维。随着特征图的尺寸减小,可以对其维度继续降低,减少channels数量,采用1×1 conv 不仅不会影响模型精度,反而还能使其收敛速度加快。
上述的这些并不能直接用来提高网络质量,而仅用来在大环境下作指导。

(二)卷积分解(Factorizing Convolutions)

对称卷积分解,多个小卷积替代大卷积
非对称卷积分解,将一个n×n卷积更改为1×n和n×1两个卷积

涉及到的网络模型的相关论文以及下载地址:

[v1] Going Deeper with Convolutions, 6.67% test error : Going Deeper with Convolutions

[v2] Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift, 4.8% test error : http://arxiv.org/abs/1502.03167

[v3] Rethinking the Inception Architecture for Computer Vision, 3.5% test error : Rethinking the Inception Architecture for Computer Vision

[v4] Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning, 3.08% test error : Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning

Original: https://blog.csdn.net/self_Name_/article/details/126447229
Author: 未来,心
Title: 深度学习-inception模块介绍

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/649817/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • Keras入门教程 3.波士顿房价回归 (MPL)

    Keras入门教程 1.线性回归建模(快速入门) 2.线性模型的优化 3.波士顿房价回归 (MPL) 4.卷积神经网络(CNN) 5.使用LSTM RNN 进行时间序列预测 6.K…

    人工智能 2023年6月17日
    0126
  • 【模型训练】YOLOv7行人摔倒检测

    YOLOv7&YOLOv5行人摔倒检测 * – 1、YOLOv7行人摔倒检测模型训练 – 2、模型评估 – 3、模型和数据集下载网盘链接…

    人工智能 2023年7月28日
    066
  • Ubuntu下CUDA和cudnn的安装

    1、安装CUDA 1、下载 https://developer.nvidia.com/cuda-downloads (1)大概是下面这个样子,按照自己的平台来选,然后下载那个.ru…

    人工智能 2023年7月21日
    088
  • 回归模型 第5篇:knn回归

    基于最邻近算法的分类,本质上是对离散的数据标签进行预测,实际上,最邻近算法也可以用于对连续的数据标签进行预测,这种方法叫做基于最邻近数据的回归,预测的值(即数据的标签)是连续值,通…

    人工智能 2023年6月18日
    079
  • mysql实现知识图谱_知识图谱的技术概述

    知识图谱是Google公司2012年为了支撑其语义搜索而建立的知识库;是一种大规模语义网络,包括实体(Entity)、概念(Concept)事件(Event)以及之间的各种语义关系…

    人工智能 2023年6月10日
    062
  • Paper Reading – 综述系列 – 计算机视觉领域中目标检测任务常见问题与解决方案

    目录 小目标检测 数据方面 Label Smoothing 模型方面 样本不均衡 目标遮挡 More 更多可见计算机视觉-Paper&Code – 知乎 小目标…

    人工智能 2023年5月26日
    0112
  • 【深度学习】第一章:深度学习概述

    ### 回答1: 深度学习框架pytorch是一种开源的机器学习框架,它提供了一种灵活、高效、易于使用的方式来构建深度学习模型。本书《深度学习框架pytorch:入门与实践》介绍了…

    人工智能 2023年6月28日
    076
  • Layer Normalization解析

    原论文名称:Layer Normalization原论文地址: https://arxiv.org/abs/1607.06450 之前有讲过Batch Normalization的…

    人工智能 2023年6月24日
    0112
  • 语义分割、实例分割

    在cv领域,会经常见到”语义分割”、”实例分割”这两个名词,本文就来解释下他们分别是什么意思,又有什么区别。 以下的图部分借用自知乎…

    人工智能 2023年5月28日
    094
  • MySQL进阶-覆盖索引

    前文我们讲解了索引失效的原则。已经索引要遵循最左前缀法则。 覆盖索引 原则: 尽量使用覆盖索引, 减少select *的使用。 那么什么是覆盖索引呢? 覆盖索引是指查询使用了索引,…

    人工智能 2023年6月27日
    061
  • 计算机视觉项目-文档扫描OCR识别

    😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识🎉 作者简介:⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉pyt…

    人工智能 2023年6月23日
    061
  • Python数据分析详解

    Python数据分析详解 python在数据分析方面有哪些优势 数据分析的流程是什么? Excel格式 import pandas as pd data = pd.read_exc…

    人工智能 2023年7月8日
    068
  • pandas基础操作

    pandas数据结构series: Series类似与表格中的列,类似于一维数组,可以保存任意数据类型。 Series由索引index和列组成 生成series: pandas.S…

    人工智能 2023年7月7日
    066
  • Backtrader解决多股回测时跳过日期的问题

    股票的上市日期各不相同,有些也退市了。在回测时,Backtrader会遍历所有的数据,选择有效期的 交集开始执行 next()。 这时我们的选股策略就会因为数据的问题出现一段时间的…

    人工智能 2023年7月7日
    063
  • 机器学习笔记–2.1文本分类

    从分类算法层面来看,各类语言的文本分类技术大同小异,但从整个流程来考察,不同语言的文本处理所用到的技术还是有差别的。下面给出中文语言的文本分类技术和流程,主要包括以下几个步骤: (…

    人工智能 2023年7月1日
    0121
  • 【机器视觉】二维码检测(QR 码)

    这里写自定义目录标题 二维码检测(QR 码) 代码 二维码检测(QR 码) 读取 QR 码,可以自动定位 QR 码,并允许 QR 图像旋转任意角度。 分割设置阈值:设置二值图像的分…

    人工智能 2023年6月20日
    091
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球