主流深度学习算法简介

**

深度学习算法简介**

1、 深度学习主流算法包括:

1.1 CNN (卷积神经网络)
卷积神经网络(CNN)是最常见的深度学习方法之 一。自20 世纪80 年代后期以来,CNN 已应用于视觉识别与分类任务,特别是LeCun 等在1998 年提出了LeNet-5,基于CNN 的相关研究随即成为研究热点,伴随图形处理(Graphical Processing Unit,GPU)计算能力的发展和大量标记数据集的出现,CNN 在算法和架构上不断改进,在各个应用场景取得了突破。
图像分类是计算机视觉中的基本问题,通常使用特征提取和分类器判别的技术架构来解决图像的分类问题。传统图像分类方法的准确性在很大程度上取决于所提取的特征,往往存在特征设计困难、面向复杂任务具有局限性、特征间的层次关系设计困难进而导致算法的泛化性能较弱等弊端。近年来的研究表明,随着数据获取方式的简化和大数据集的出现,在GPU 等芯片技术的快速发展,深度学习可以有效解决上述瓶颈问题。2012年,Krizhevsky 等使用扩展了深度的CNN 架构在ImageNet大规模视觉识别挑战竞赛中取得了最佳的分类效果,随即CNN 受到研究者们的重视,一系列网络模型的提出进一步推动了CNN 的深入研究与广泛应用。目前,CNN 已经成为大多数图像识别、分类和检测任务的领先架构,越来越多的网络架构也相继问世,包括AlexNet、Clarifai、SPP、VGG、GoogleNet、FCN、U-Net等。同时,梯度下降、参数优化策略、权重共享以及近年来神经网络架构优化(Neural ArchitectureOptimization,NAO)和元学习(meta-learning)等理论的迅速发展,使得CNN 在复杂应用场景中的优势更加明显。新型的CNN 神经网络架构表现出以多个网络或多种网络级联组合应用的新态势,神经网络形态的快速进化为纷繁复杂的科研领域提供了智能高效的数据分析手段。

1.2 RBM (受限玻尔兹曼机)
受限玻尔兹曼机(RBM)是由Hinton 和Sejnowski[16]在1986 年提出的神经网络模型,具备两层结构、层间全连接和层内无连接的特点,适用于有效地提取数据特征以及预训练传统的前馈神经网络,可明显提高网络的判别能力。其可见层所描述的是观察数据一个方面或一个特征,约束条件是可见单元和隐藏单元必须构成二分图。这种机制可用于组建更加有效的训练算法,特别是基于梯度的对比发散算法。用RBM 可以组成以下深层模型:深度置信网络(Deep Belief Network,DBN)、深度玻尔兹曼机(Deep Boltzmann Machines,DBM)和深能模型(Deep Energy Models,DEM),适用于特征提取、数据编码、构建用于监督学习的分类或回归学习模型,以及初始化神经网络等场景。

1.3 AE (自动编码器)
自动编码器是一种特殊类型的人工神经网络,用于从数据中学习有效的特征。最初也是由Hinton在2006年提出。自动编码器的几个重要变体包括:稀疏自动编码器(Sparse Auto Encoder,SAE)、去噪自动编码器(Denoising Auto Encoder,DAE)和收缩自动编码器(Contractive Auto Encoder,CAE)。在图像处理领域,原始图像像素值作为初级特征表达通常维度很高,且大多情况下存在数据冗余,因此需要采用合适的方法对图像数据进行降维或特征提取等预处理,进而得到更加简洁而有效的特征表达,以提高数据分析效率和精度,自动编码器多用于高维数据的降维处理和特征提取。

1.4 SC (稀疏编码)
稀疏编码(Sparse Coding,SC)最早由Olshausen 和Field 于1996 年提出,用于解释大脑中的初期视觉处理(比如边缘检测)。稀疏编码通过训练和学习来构建对输入数据的描述函数,通过训练来找到一组”超完备基向量(an over-complete set of basis vectors)”来表示输入数据的算法,超完备基向量能更有效地找出隐含在输入数据内部的结构与模式来重构原数据。稀疏编码的优点主要体现在:
1)可以使用高维特征,对不同类别的特
征更加易于分类;
2)稀疏性可以捕获图像的显著特性;
3)具备与生物视觉系统类似的认知方式。稀疏编码算法被广泛应用于语音信号分离、视觉图像处理、生物DNA(DeoxyriboNucleic Acid)微阵列数据分类和模式识别等领域。

1.5 RNN (循环神经网络)
循环神经网络(Recurrent Neural Network,RNN)是一类用于处理序列数据的神经网络,与”人的认知是基于过往的经验和记忆”类似,通过使用特定形式的存储器来模拟基于时间的动态变化,RNN 不仅能考虑当前的输入,而且赋予了网络对前序内容的一种”记忆”功能。这种网络结构能够直接地反映系统动态变化过程中的高度非线性和不确定性,因此适用于对时序数据规律的学
习与未来变化趋势的预测,但该方法存在梯度消失与梯度爆炸问题[。1997 年,Hochreiter 和Schmidhuber提出了长短期记忆(Long Short-Term Memory,LSTM)网络,成功解决了这一问题。LSTM 可以保持前序信息的长期存储,在语音识别、信息检索、文本分类等应用中被广泛使用,现已成为实际应用中最有效的序列模型。

2 不同算法的特点
5 种常见的深度学习算法均具备一定的泛化能力,CNN 和SC 支持数据增强,可通过对训练数据进行旋转等处理来减少一定数据采集和标记的工作量。在无监督学习、特征学习和支持生物学解释方面,各算法表现各异。不同类型的深度学习算法表现出各自不同的特点,在实际应用场景中,研究人员需要根据特定科学问题及应用场景,选择合适的算法来构建相关模型。

主流深度学习算法简介
理论上,深度学习算法是通过海量数据来解决复杂问题的机器学习方法,通常在海量数据的支持下,深度学习方法的潜力才被充分释放和发挥出来,在数据量相对较小情况下,普通的机器学习方法即可满足数据建模与预测的应用需求,因而在具体应用中通常需要根据特定研究目标的数据量与应用需求来选取合适的算法。

内容来源:[1]岑海燕,朱月明,孙大伟,翟莉,万亮,麻志宏,刘子毅,何勇.深度学习在植物表型研究中的应用现状与展望[J].农业工程学报,2020,36(09):1-16.

Original: https://blog.csdn.net/FJHJIUSHINIUBI/article/details/123234101
Author: 差不多冬至~
Title: 主流深度学习算法简介

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/520410/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球