深度学习——day39 综述——（2019 计算机学报）深度卷积神经网络的发展及其在计算机视觉领域的应用_张顺

2023年6月17日上午1:04 • 人工智能 • 阅读 91

深度卷积神经网络的发展及其在计算机视觉领域的应用

原文pdf和笔记下载
chap1 引言
*
1.1 Deep CNN 发展史
chap2 卷积神经网络及其相关技术
*
2.1 什么是CNN
–
2.2 各种技术手段对神经网络图像分类精度的提升效果
–
3 卷积神经网络的应用
4 视觉认知的理论启示
5 展望

原文pdf和笔记下载

点击跳转

chap1 引言

1.1 Deep CNN 发展史

Ｈｕｂｅｌ和Ｗｉｅｓｅｌ在１９６２年通过对猫的视觉皮层细胞进行深入研究，提出了高级动物视觉系统的认知机理模型。该模型提出高级动物视觉神经网络由 简单细胞和 复杂细胞构成（如图１所示）．
神经网络底层的简单细胞的感受野只对应视网膜的某个特定区域，并只对该区域中特定方向的边界线产生反应．复杂细胞通过对特定取向性的简单细胞进行聚类，拥有较大感受野，并获得具有一定不变性的特征．
1984 年日本学者Fukushima在Ｈｕｂｅｌ和Ｗｉｅｓｅｌ的感受野概念基础上，提出了神经认知机（Ｎｅｏｃｏｇ－ｎｉｔｒｏｎ）模型：Ｓ细胞的功能是提取局部特征（如边缘或角等）;．Ｃ细胞对应Ｈｕｂｅｌ－Ｗｉｅｓｅｌ模型的复杂细胞，对Ｓ细胞的输入进行一些处理，如图像较小的位移或轻微变形等．
２０世纪９０年代初期，纽约大学的ＬｅＣｕｎ等人提出了多层卷积神经网络并成功应用于手写数字识别中，所提出的ＬｅＮｅｔ系列都达到商用水平
2012 年，Hinton 团队在ImageNet 图像分类比赛中获得压倒性胜利，将1000类图像的 TOP-5 分类错误率从26.172％降低到15.315％．在这一年， Deep CNN还被用于解决Drug Activity 预测问题，并获得当时最好成绩．至此，神经网络的研究进入了一个崭新的时代，开启了神经网络研究的热潮．
当前，Deep CNN相对传统机器学习算法的优势不断扩大，传统学习方法在多个领域无法与深度学习抗衡，比如手写体识别、图像分类、图像语义理解、语音识别和自然语言理解等技术领域．
为了改进神经网络的训练，研究人员提出了深层结构的优化和训练学习方法的改进，包括使用 ＲｅＬＵ激活函数，使用 dropout 进行网络训练，使用 batch normalization技术归一化特征的数据分布等．

; chap2 卷积神经网络及其相关技术

2.1 什么是CNN

这里是我之前的关于神经网络的笔记
卷积神经网络是由用于特征提取的卷积层和用于特征处理的亚采样层交叠组成的多层神经网络．典型的卷积神经网络结构如图２所示：

深度学习——day39 综述——（2019 计算机学报）深度卷积神经网络的发展及其在计算机视觉领域的应用_张顺

其实我很推荐吴恩达教授的NN课程，b站上有

; 2.1.1 卷积层

第ｌ层的第ｊ个特征图矩阵可能由前一层若干个特征图卷积加权得到，一般可以表示为（式1）

常用的神经元激活函数有ｓｉｇｍｏｉｄ函数、ｔａｎｈ函数、ＲｅＬＵ函数等

2.1.2 采样层

也称为”池化”层，其作用是基于局部相关性原理进行池化采样，从而在减少数据量的同时保留有用信息．采样过程可以表示为（式2）

; 2.1.3 全连接层

卷积神经网络在卷积层和采样层后，通常会连接一个或多个全连接层．全连接层的结构和全连接神经网络的隐层结构相同，全连接层的每个神经元都会与下一层的每个神经元相连。

2.2 各种技术手段对神经网络图像分类精度的提升效果

2.2.1 增加网络层数

在给定带标签数据集的前提下，提升深度神经网络识别精度的一种直接方法是增加网络层数。
2012的 AlexNet：模型结构如图3

2014的 VGG(Visual Geometry Group) 网络获得了定位任务第一名和分类任务第二名，图4

2019年定级深度神经网络：表1

; 2.2.2 增加训练数据集规模

图7，过拟合示意图：

2.2.3 正则化

训练大型卷积神经网络除了增大训练数据集外，还经常使用正则化方法来防止过拟合问题．发生过拟合的模型一般在某些很小的区间里，函数值的变化很剧烈．这就意味着函数的参数值偏大，使某些小区间里的导数值（绝对值）非常大．正则化是通过约束参数的范数使其不要过大，以此降低模型的复杂度，从而减小噪声输入的扰动，可以在一定程度上减少过拟合情况．

L_2 正则化是最常用的一种正则化技术，又称 权重衰减（weight decay ），它是在原始的损失函数Ｃ０后面再加上一个正则化项：式7
L_2 正则化是通过修改代价函数来实现的，而 Dropout 则是通过修改神经网络本身来实现的，它是训练网络时常用的一种技巧。

; 2.2.4 其他改进训练学习方法

卷积神经网络中改进训练学习的方法除了使用正则化外，还有改进激活函数、定义不同损失函数、使用 batch normalization等常用技术

2.2.4.1 激活函数

Sigmoid函数（非线性）(x)= 1/1+e^{-x}
Tannh函数 f(x)=e^x – e^{-x} / e^x + e^{-x}
以上两种激活函数君存在梯度消失问题，会导致训练销量低下
ＲｅＬＵ（Rectified Linear Units ，修正线性单元）f(x)=max(0,x)，函数曲线如图11（a）
LReLU：为了避免ＲｅＬＵ神经单元在训练时可能会”死亡” 现象.LReLU(Leaky Rectified Linear Unit)激活函数使神经元在整个训练过程中能持续得到更新
PReLU(Parametric Rectified Linear Unit )
α是个随机变量，训练时它在给定范围随机取值，α=0时，ＰＲｅＬＵ相当于ＲｅＬＵ；当α取一个很小的值时，相当于ＬＲｅＬＵ．

2.2.4.2 损失函数

面对特定的任务，选择合适的损失函数非常关键．常用的损失函数有ｓｏｆｔｍａｘ函数、ｈｉｎｇｅ损失函数、ｃｏｎｔｒａｓｔｉｖｅ损失函数、ｔｒｉｐｌｅｔ损失函数等．在本节开头已介绍过ｓｏｆｔｍａｘ函数，这里重点介绍其他三种损失函数

; 2.2.4.3 batch normalization 基本思想

batch normalization的基本思想，通过预处理操作，让每个隐层的所有节点的激活输入分布归一化到均值为０方差为１的标准正态分布，并且均值和方差都在当前迭代的 mini- batch 样本中计算得到

3 卷积神经网络的应用

卷积神经网络是近十几年来类脑计算领域取得的一个重大研究成果，它在计算机视觉、语音识别、自然语言处理、多媒体等诸多领域都取得了巨大成
功．在计算机视觉领域的各类任务中，图像分类任务是根据图像信息中反映的不同特征，把不同类别的目标（如鸟、人、车、飞机等）区分开来，即给每幅图片分配一个语义类别标记，而目标检测是定位出某类目标在图像中出现的区域．与图像分类任务要建立图像级理解不同，图像语义理解要得到图像像素级别的目标分类结果．图片标题生成也是建立于图片的语义理解上，要求自动产生自然语言对图片的目标及目标间关系进行描述．相比于图像分类和目标检测关注于多类或单类物体目标的区分或定位，人脸识别和行人再识别任务则分别聚焦于人脸和行人的身份辨识．另外一种任务———图像超分辨率，能够提供更清晰的图像以及更多的图像细节，为高层视觉任务提供更好的输入．
本节将重点介绍卷积神经网络在图像分类、目标检测、人脸识别、行人再识别、超分辨率、人体动作识别以及图像检索的最新研究进展．

4 视觉认知的理论启示

人类视觉系统是至今为止所知的功能最强大和完善的生物视觉系统，是人脑感知外部环境的最主要方式，人类获取外部世界的信息约７０％来源于视
觉．利用非凡的脑信息处理能力，人类能够快速高效地从客观世界的杂乱场景中抽取有效信息，分析感兴趣的目标或区域，形成对视觉场景内容的高度理解和认知．神经网络的研究与人类视觉的研究密切相关，借鉴人类视觉认知机制的相关计算理论，是未来研究提升神经网络性能的一个方向．

5 展望

人工神经网络是由基本的数学计算单元及其交互联接构成的一种网络计算结构，用来模拟人脑中信息的处理过程，让机器通过学习训练机制主动获取数据中所蕴含的规律．本文围绕其中的一种学习模型———深度卷积神经网路，介绍了现阶段提升深度卷积网络性能的技术方法和在计算机视觉领域内的应用，并分析了人脑视觉机制的特点和对当前计算模型的一些理论启示．尽管当前深度卷积网络较传统机器学习方法有了很大的提高，但不可忽略的是，它们与人脑视觉系统还是有非常大的差距，从根本上并没有解决视觉认知的根本问题．未来基于深度卷积神经网络的类脑智能研究仍有许多亟待解决的问题与挑战：

借鉴视觉认知的研究成果，改进神经网络
的模型结构
基于无监督式特征学习的研究
利用海量增加的数据进一步提高卷积神经网络的特征学习能力
优化神经网络模型，降低计算复杂度
研究卷积神经网络的迁移和泛化能力

Original: https://blog.csdn.net/qq_43537420/article/details/127239605
Author: 想太多!
Title: 深度学习——day39 综述——（2019 计算机学报）深度卷积神经网络的发展及其在计算机视觉领域的应用_张顺

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627671/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

机器学习——基于概率论的分类方法：朴素贝叶斯

参考教材：机器学习实战（人民邮电出版社）Peter Harrington【美】著语言：python 软件：VS code 基于贝叶斯决策理论的分类方法 “朴素&#82…

人工智能 2023年7月2日
0099
ES实战快速学习

回答1：当你使用 Spring Boot 和时，你可以使用 Spring Data 来连接。首先，你需要在 pom.xml 文件中添加 Spring Data 的依赖： x…

人工智能 2023年6月30日
0059
图像处理：U-Net中的重叠-切片(Overlap-tile)

深蓝学院是专注于人工智能的在线教育平台，已有数万名伙伴在深蓝学院平台学习，很多都来自于国内外知名院校，比如清华、北大等。最开始接触 U-Net 的时候并不知道原作使用了 Over…

人工智能 2023年6月30日
0085
超分辨率代码运行

本篇文章将详细讲述新手小白初次运行超分辨率代码，以亚像素卷积（ESPCN）这篇文章为例。（1）首先从github上下载ESPCN的代码（代码地址：https://github.co…

人工智能 2023年7月22日
0057
基于BP神经网络的交通安全预警模型及代码实例

文章目录前言一、BP神经网络是什么？二、模型构建 * 1.模型输入输出指标的选取 2.模型结构设计 3.层数的确定 4.各层神经元个数的确定 5.激活函数及输出层的确定 6….

人工智能 2023年7月13日
00104
描述性统计分析

概要描述性统计，是指运用制表和分类，图形以及计算概括性数据来描述数据特征的各项活动。描述性统计分析要对调查总体所有变量的有关数据进行统计性描述，主要包括数据的频数分析、集中趋势分…

人工智能 2023年7月15日
0052
python 查看程序的GPU显存占用

显示GPU显存占用方法引言一、nvidia-smi 二、windows下的任务管理器三、pynvml库四、显存不够用又没钱怎么办引言主要针对显卡：nvidia初衷：想要…

人工智能 2023年7月27日
0091
【机器学习】逻辑回归案例二：鸢尾花数据分类，决策边界绘制逐步代码讲解

逻辑回归案例二：鸢尾花数据分类，决策边界绘制逐步代码讲解 1 数据加载 2 数据EDA 3 模型创建及应用 * 3.1 数据切分 3.2 创建模型与分类 3.3 决策边界绘制 &#…

人工智能 2023年6月16日
0078
基于ASP.NET CORE MVC 3.1 打造百度AI智能体验平台：从人脸/手势识别到语音识别控制

前言停更太久了，倒也不是多忙，主要是学习的热情降低了，又比较懒，因此，即使有做出新的玩意或者有所收获，也懒得去码字。最近做了一个百度AI的web端玩具，可以人脸识别/注册/颜值打…

人工智能 2023年5月27日
00114
python解决每隔几行取数据的问题并使用drop函数删除dataframe中指定索引列表对应位置的数据行

《精通SQ:结构化查询语言详解》全面讲解SQL语言，提供317个典型应用，读者可以随查随用，针对SQL Server和Oracle进行_讲解，很有代表性。全书共包括大小实例31…

人工智能 2023年7月6日
0062
【墨染】找特有姿态！基于【灵茶山艾府】题解的补充图解

脑筋急转弯补充证明灵茶山艾府找不到规律？请看图！（Python/Java/C++/Go）一定要看链接里的图！本题为看图的形象证明！！定义: d p [ n ] dp[n]d …

人工智能 2023年6月27日
0072
[Python从零到壹] 三十七.图像处理基础篇之图像融合处理和ROI区域绘制

欢迎大家来到”Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合…

人工智能 2023年6月18日
0048
SQL语句复习整理

SQL语句SQL 是用于访问和处理数据库的标准的计算机语言，SQL 指结构化查询语言可以把 SQL 分为两个部分：数据操作语言 (DML) 和数据定义语言 (DDL)。 SQL…

人工智能 2023年6月4日
0093
python Kmeans聚类 – CPU or GPU?

Kmeans聚类 – CPU or GPU 引言一、时间对比二、代码三、推荐博文引言 k均值聚类算法1，一种经典的聚类算法，被广泛应用于机器学习领域。本文主要对…

人工智能 2023年6月2日
0088
关于我装的GPU版tensorflow然后却是cpu在跑这件事

神经网络的层数越来越多，程序跑的也是越来越慢，打开任务管理器发现我的GPU根本没用到，白瞎我买的电脑，和费那劲装的tensorflowGPU版首先看一下GPU是否可用 impor…

人工智能 2023年5月26日
0090
组织创新丨传统企业敏捷变革的组织基础

在传统组织管理中，平衡思维是一个很常见的理念。但当变革来临，组织要求变得更为敏捷时，对平衡的追求就成为最大的障碍。耗散理论与自组织理论告诉我们，系统应该保持开放、保持不平衡、并且持…

人工智能 2023年6月4日
00102

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31