卷积神经网络发展现状,卷积神经网络发展历程

2023年7月13日上午3:12 • 人工智能 • 阅读 104

神经网络的历史是什么？

沃伦·麦卡洛克和沃尔特·皮茨（1943）基于数学和一种称为阈值逻辑的算法创造了一种神经网络的计算模型。这种模型使得神经网络的研究分裂为两种不同研究思路。

一种主要关注大脑中的生物学过程，另一种主要关注神经网络在人工智能里的应用。一、赫布型学习二十世纪40年代后期，心理学家唐纳德·赫布根据神经可塑性的机制创造了一种对学习的假说，现在称作赫布型学习。

赫布型学习被认为是一种典型的非监督式学习规则，它后来的变种是长期增强作用的早期模型。从1948年开始，研究人员将这种计算模型的思想应用到B型图灵机上。

法利和韦斯利·A·克拉克（1954）首次使用计算机，当时称作计算器，在MIT模拟了一个赫布网络。纳撒尼尔·罗切斯特（1956）等人模拟了一台IBM704计算机上的抽象神经网络的行为。

弗兰克·罗森布拉特创造了感知机。这是一种模式识别算法，用简单的加减法实现了两层的计算机学习网络。罗森布拉特也用数学符号描述了基本感知机里没有的回路，例如异或回路。

这种回路一直无法被神经网络处理，直到保罗·韦伯斯(1975)创造了反向传播算法。在马文·明斯基和西摩尔·派普特（1969）发表了一项关于机器学习的研究以后，神经网络的研究停滞不前。

他们发现了神经网络的两个关键问题。第一是基本感知机无法处理异或回路。第二个重要的问题是电脑没有足够的能力来处理大型神经网络所需要的很长的计算时间。

直到计算机具有更强的计算能力之前，神经网络的研究进展缓慢。二、反向传播算法与复兴后来出现的一个关键的进展是保罗·韦伯斯发明的反向传播算法（Werbos1975）。

这个算法有效地解决了异或的问题，还有更普遍的训练多层神经网络的问题。在二十世纪80年代中期，分布式并行处理（当时称作联结主义）流行起来。

戴维·鲁姆哈特和詹姆斯·麦克里兰德的教材对于联结主义在计算机模拟神经活动中的应用提供了全面的论述。神经网络传统上被认为是大脑中的神经活动的简化模型，虽然这个模型和大脑的生理结构之间的关联存在争议。

人们不清楚人工神经网络能多大程度地反映大脑的功能。

支持向量机和其他更简单的方法（例如线性分类器）在机器学习领域的流行度逐渐超过了神经网络，但是在2000年代后期出现的深度学习重新激发了人们对神经网络的兴趣。

三、2006年之后的进展人们用CMOS创造了用于生物物理模拟和神经形态计算的计算设备。最新的研究显示了用于大型主成分分析和卷积神经网络的纳米设备具有良好的前景。

如果成功的话，这会创造出一种新的神经计算设备，因为它依赖于学习而不是编程，并且它从根本上就是模拟的而不是数字化的，虽然它的第一个实例可能是数字化的CMOS设备。

在2009到2012年之间，JürgenSchmidhuber在SwissAILabIDSIA的研究小组研发的循环神经网络和深前馈神经网络赢得了8项关于模式识别和机器学习的国际比赛。

例如，AlexGravesetal.的双向、多维的LSTM赢得了2009年ICDAR的3项关于连笔字识别的比赛，而且之前并不知道关于将要学习的3种语言的信息。

IDSIA的DanCiresan和同事根据这个方法编写的基于GPU的实现赢得了多项模式识别的比赛，包括IJCNN2011交通标志识别比赛等等。

他们的神经网络也是第一个在重要的基准测试中（例如IJCNN2012交通标志识别和NYU的扬·勒丘恩（YannLeCun）的MNIST手写数字问题）能达到或超过人类水平的人工模式识别器。

类似1980年KunihikoFukushima发明的neocognitron和视觉标准结构（由DavidH.Hubel和TorstenWiesel在初级视皮层中发现的那些简单而又复杂的细胞启发）那样有深度的、高度非线性的神经结构可以被多伦多大学杰弗里·辛顿实验室的非监督式学习方法所训练。

2012年，神经网络出现了快速的发展，主要原因在于计算技术的提高，使得很多复杂的运算变得成本低廉。以AlexNet为标志，大量的深度网络开始出现。

2014年出现了残差神经网络，该网络极大解放了神经网络的深度限制，出现了深度学习的概念。

构成典型的人工神经网络具有以下三个部分：1、结构（Architecture）结构指定了网络中的变量和它们的拓扑关系。

例如，神经网络中的变量可以是神经元连接的权重（weights）和神经元的激励值（activitiesoftheneurons）。

2、激励函数（ActivationRule）大部分神经网络模型具有一个短时间尺度的动力学规则，来定义神经元如何根据其他神经元的活动来改变自己的激励值。

一般激励函数依赖于网络中的权重（即该网络的参数）。3、学习规则（LearningRule）学习规则指定了网络中的权重如何随着时间推进而调整。这一般被看做是一种长时间尺度的动力学规则。

一般情况下，学习规则依赖于神经元的激励值。它也可能依赖于监督者提供的目标值和当前权重的值。例如，用于手写识别的一个神经网络，有一组输入神经元。输入神经元会被输入图像的数据所激发。

在激励值被加权并通过一个函数（由网络的设计者确定）后，这些神经元的激励值被传递到其他神经元。这个过程不断重复，直到输出神经元被激发。最后，输出神经元的激励值决定了识别出来的是哪个字母。

CNN（卷积神经网络）是什么？

在数字图像处理的时候我们用卷积来滤波是因为我们用的卷积模版在频域上确实是高通低通带通等等物理意义上的滤波器 AI爱发猫 www.aifamao.com。

然而在神经网络中，模版的参数是训练出来的，我认为是纯数学意义的东西，很难理解为在频域上还有什么意义，所以我不认为神经网络里的卷积有滤波的作用。接着谈一下个人的理解。

首先不管是不是卷积神经网络，只要是神经网络，本质上就是在用一层层简单的函数（不管是sigmoid还是Relu）来拟合一个极其复杂的函数，而拟合的过程就是通过一次次backpropagation来调参从而使代价函数最小。

类脑和卷积神经网络什么关系

一、”类脑”概念1.在早期，类脑一般是指从软硬件上模拟生物神经系统的结构与信息加工方式。随着软硬件技术的进步，以及神经科学与各种工程技术的多方面融合发展，脑与机的界限被逐步打破。

尤其是脑机接口，在计算机与生物脑之间建立了一条直接交流的信息通道，这为实现脑与机的双向交互、协同工作及一体化奠定了基础。随之，”类脑”的概念逐步从信息域自然地延伸到生命域。

因此，以脑机互联这一独特方式实现计算或智能，也被归入”类脑研究”范畴。

2.类脑研究是以”人造超级大脑”为目标，借鉴人脑的信息处理方式，模拟大脑神经系统，构建以数值计算为基础的虚拟超级脑；或通过脑机交互，将计算与生命体融合，构建以虚拟脑与生物脑为物质基础的脑机一体化的超级大脑，最终建立新型的计算结构与智能形态。

我们不妨将类脑的英文称为Cybrain(CyberneticBrain)，即仿脑及融脑之意。

其主要特征包括：A.以信息为主要手段：用信息手段认识脑、模拟脑乃至融合脑；B.以人造超级大脑为核心目标：包括以计算仿脑为主的虚拟超级脑，以及虚拟脑与生物脑一体化的超级大脑这两种形态；C.以学科交叉会聚为突破方式：不单是计算机与神经科学交叉，还需要与微电子、材料、心理、物理、数学等大学科密切交叉会聚，才有更大机会取得突破。

3.类脑研究的主要内容：类脑研究要全面实现”懂脑、仿脑、连脑”，脑认知基础、类脑模拟、脑机互联三个方面缺一不可。

因此，我们将类脑研究主要内容归纳为三个方面：信息手段认识脑、计算方式模拟脑、脑机融合增强脑（见图1）。其中，信息技术贯穿始终。

二、卷积神经网络1.卷积神经网络（ConvolutionalNeuralNetworks,CNN）是一类包含卷积计算且具有深度结构的前馈神经网络（FeedforwardNeuralNetworks），是深度学习（deeplearning）的代表算法之一。

2.卷积神经网络具有表征学习（representationlearning）能力，能够按其阶层结构对输入信息进行平移不变分类（shift-invariantclassification），因此也被称为”平移不变人工神经网络（Shift-InvariantArtificialNeuralNetworks,SIANN）” 。

3.对卷积神经网络的研究始于二十世纪80至90年代，时间延迟网络和LeNet-5是最早出现的卷积神经网络。

在二十一世纪后，随着深度学习理论的提出和数值计算设备的改进，卷积神经网络得到了快速发展，并被应用于计算机视觉、自然语言处理等领域。

4.卷积神经网络仿造生物的视知觉（visualperception）机制构建，可以进行监督学习和非监督学习，其隐含层内的卷积核参数共享和层间连接的稀疏性使得卷积神经网络能够以较小的计算量对格点化（grid-liketopology）特征，例如像素和音频进行学习、有稳定的效果且对数据没有额外的特征工程（featureengineering）要求。

三、二者关系人工智能时代的到来，大数据可以提供给计算机对人脑的模拟训练，强大的算力可以支撑计算机能够充分利用大数据获得更多规律，进行知识的学习。

类脑智能做的面比较广，出发点是开发一个与人脑具有类似功能的模拟大脑出来，达到人类的智慧，深度学习只是其中的一个小小的分支，是对人脑研究的一个小成果，而类脑智能相对研究的比较宽泛和深入。

而卷积神经网络只是深度学习的代表算法之一。

深度学习中的卷积网络到底怎么回事

。

这两个概念实际上是互相交叉的，例如，卷积神经网络（Convolutionalneuralnetworks，简称CNNs）就是一种深度的监督学习下的机器学习模型，而深度置信网（DeepBeliefNets，简称DBNs）就是一种无监督学习下的机器学习模型。

深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征，以发现数据的分布式特征表示。

深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法，为解决深层结构相关的优化难题带来希望，随后提出多层自动编码器深层结构。

此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法，它利用空间相对关系减少参数数目以提高训练性能。

卷积神经网络只适用于图像处理么

卷积神经网络（ConvolutionalNeuralNetwork,CNN）是一种前馈神经网络，它的人工神经元可以响应一部分覆盖范围内的周围单元，对于大型图像处理有出色表现。

[1] 它包括卷积层(alternatingconvolutionallayer)和池层(poolinglayer)。卷积神经网络是近年发展起来，并引起广泛重视的一种高效识别方法。

20世纪60年代，Hubel和Wiesel在研究猫脑皮层中用于局部敏感和方向选择的神经元时发现其独特的网络结构可以有效地降低反馈神经网络的复杂性，继而提出了卷积神经网络（ConvolutionalNeuralNetworks-简称CNN）。

现在，CNN已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了更为广泛的应用。

K.Fukushima在1980年提出的新识别机是卷积神经网络的第一个实现网络。随后，更多的科研工作者对该网络进行了改进。

其中，具有代表性的研究成果是Alexander和Taylor提出的”改进认知机”，该方法综合了各种改进方法的优点并避免了耗时的误差反向传播。

前馈神经网络、BP神经网络、卷积神经网络的区别与联系

一、计算方法不同1、前馈神经网络：一种最简单的神经网络，各神经元分层排列。每个神经元只与前一层的神经元相连。接收前一层的输出，并输出给下一层．各层间没有反馈。

2、BP神经网络：是一种按照误差逆向传播算法训练的多层前馈神经网络。3、卷积神经网络：包含卷积计算且具有深度结构的前馈神经网络。

二、用途不同1、前馈神经网络：主要应用包括感知器网络、BP网络和RBF网络。

2、BP神经网络：（1）函数逼近：用输入向量和相应的输出向量训练一个网络逼近一个函数；（2）模式识别：用一个待定的输出向量将它与输入向量联系起来；（3）分类：把输入向量所定义的合适方式进行分类；（4）数据压缩：减少输出向量维数以便于传输或存储。

3、卷积神经网络：可应用于图像识别、物体识别等计算机视觉、自然语言处理、物理学和遥感科学等领域。联系：BP神经网络和卷积神经网络都属于前馈神经网络，三者都属于人工神经网络。因此，三者原理和结构相同。

三、作用不同1、前馈神经网络：结构简单，应用广泛，能够以任意精度逼近任意连续函数及平方可积函数．而且可以精确实现任意有限训练样本集。2、BP神经网络：具有很强的非线性映射能力和柔性的网络结构。

网络的中间层数、各层的神经元个数可根据具体情况任意设定，并且随着结构的差异其性能也有所不同。3、卷积神经网络：具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分类。

扩展资料：1、BP神经网络优劣势BP神经网络无论在网络理论还是在性能方面已比较成熟。其突出优点就是具有很强的非线性映射能力和柔性的网络结构。

网络的中间层数、各层的神经元个数可根据具体情况任意设定，并且随着结构的差异其性能也有所不同。但是BP神经网络也存在以下的一些主要缺陷。

①学习速度慢，即使是一个简单的问题，一般也需要几百次甚至上千次的学习才能收敛。②容易陷入局部极小值。③网络层数、神经元个数的选择没有相应的理论指导。④网络推广能力有限。

2、人工神经网络的特点和优越性，主要表现在以下三个方面①具有自学习功能。

例如实现图像识别时，只在先把许多不同的图像样板和对应的应识别的结果输入人工神经网络，网络就会通过自学习功能，慢慢学会识别类似的图像。自学习功能对于预测有特别重要的意义。

预期未来的人工神经网络计算机将为人类提供经济预测、效益预测，其应用前途是很远大的。②具有联想存储功能。用人工神经网络的反馈网络就可以实现这种联想。③具有高速寻找优化解的能力。

寻找一个复杂问题的优化解，往往需要很大的计算量，利用一个针对某问题而设计的反馈型人工神经网络，发挥计算机的高速运算能力，可能很快找到优化解。

参考资料：百度百科—前馈神经网络百度百科—BP神经网络百度百科—卷积神经网络百度百科—人工神经网络。

卷积神经网络cnn究竟是怎样一步一步工作的

用一个卷积核滑动图片来提取某种特征（比如某个方向的边），然后激活函数用ReLU来压制梯度弥散。

对得到的结果用另一个卷积核继续提取+reLU，然后池化（保留区域最大或者用区域平均来替换整个局部区域的值，保证平移不变性和一定程度上对过拟合的压制）之后”深度”的话，就会需要对池化后的结果继续用不同的卷积核进行”卷积+relu”再池化的工作。

最后得到的实质是一个图片的深度特征，然后实际分类需要另外加一层，一般是softmax。

（也就是说如果对一个现成的已经训练完毕的卷积神经网络模型，只保留除了最后一层之外的部分，然后输入训练图片，把网络的输出重新送入一个多类的SVM再训练，最后也能得到差不多的结果，取决于svm的参数。）

为什么有图卷积神经网络？

本质上说，世界上所有的数据都是拓扑结构，也就是网络结构，如果能够把这些网络数据真正的收集、融合起来，这确实是实现了AI智能的第一步。

所以，如何利用深度学习处理这些复杂的拓扑数据，如何开创新的处理图数据以及知识图谱的智能算法是AI的一个重要方向。

深度学习在多个领域的成功主要归功于计算资源的快速发展（如GPU）、大量训练数据的收集，还有深度学习从欧几里得数据（如图像、文本和视频）中提取潜在表征的有效性。

但是，尽管深度学习已经在欧几里得数据中取得了很大的成功，但从非欧几里得域生成的数据已经取得更广泛的应用，它们需要有效分析。

如在电子商务领域，一个基于图的学习系统能够利用用户和产品之间的交互以实现高度精准的推荐。在化学领域，分子被建模为图，新药研发需要测定其生物活性。

在论文引用网络中，论文之间通过引用关系互相连接，需要将它们分成不同的类别。自2012年以来，深度学习在计算机视觉以及自然语言处理两个领域取得了巨大的成功。

假设有一张图，要做分类，传统方法需要手动提取一些特征，比如纹理，颜色，或者一些更高级的特征。然后再把这些特征放到像随机森林等分类器，给到一个输出标签，告诉它是哪个类别。

而深度学习是输入一张图，经过神经网络，直接输出一个标签。特征提取和分类一步到位，避免了手工提取特征或者人工规则，从原始数据中自动化地去提取特征，是一种端到端（end-to-end）的学习。

相较于传统的方法，深度学习能够学习到更高效的特征与模式。图数据的复杂性对现有机器学习算法提出了重大挑战，因为图数据是不规则的。

每张图大小不同、节点无序，一张图中的每个节点都有不同数目的邻近节点，使得一些在图像中容易计算的重要运算（如卷积）不能再直接应用于图。此外，现有机器学习算法的核心假设是实例彼此独立。

然而，图数据中的每个实例都与周围的其它实例相关，含有一些复杂的连接信息，用于捕获数据之间的依赖关系，包括引用、朋友关系和相互作用。最近，越来越多的研究开始将深度学习方法应用到图数据领域。

受到深度学习领域进展的驱动，研究人员在设计图神经网络的架构时借鉴了卷积网络、循环网络和深度自编码器的思想。为了应对图数据的复杂性，重要运算的泛化和定义在过去几年中迅速发展。

Original: https://blog.csdn.net/aifamao6/article/details/126282474
Author: 幸福的小浣熊
Title: 卷积神经网络发展现状,卷积神经网络发展历程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/688955/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

分析1996~2015年人口数据特征间的关系并分析1996~2015年人口数据各个特征的分布分散状况

python数据分析与应用实训1 分析1996~2015年人口数据特征间的关系并分析1996~2015年人口数据各个特征的分布分散状况运行环境：jupyter noteboo…

人工智能 2023年7月16日
0089
数字图像处理复习提纲

数字图像处理第一章数字图像基础什么是数字图像（理解）数字图像是由图像数字化得到的、以像素为基本元素的可以用数字计算机或数字电路存储和处理的图像数字化的空间位置称为像素，数…

人工智能 2023年6月22日
00100
图像识别之Yolov5训练自己的模型

图像识别之Yolov5训练自己的模型文章目录 * – 图像识别之Yolov5训练自己的模型 – + 一、前言 + 二、对图像进行标注 + 三、数据集的划分…

人工智能 2023年5月23日
00133
语音识别系统代码

语音识别代码语言：Java / SpeechRecognitionDlg.cpp : implementation file // #include "stdafx.h&…

人工智能 2023年5月27日
0093
YOLOv3&YOLOv5输出结果说明

本文使用的yolov3和yolov5工程文件均为github上ultralytics基于pytorch的v3和v5代码，其训练集输出结果类型基本一致，主要介绍了其输出结果，本文是一…

人工智能 2023年6月12日
0094
PyTorch实战案例（一）——利用PyTorch实现线性回归算法（基础）

目录 * – 一、案例描述 – 二、代码详解 – + 2.1 根据直线方程构造数据集 + 2.2 构建数据迭代器 + 2.3 构建神经网络层并进…

人工智能 2023年7月23日
0081
vue10CRUD+表单验证

目录 1. 准备工作 2. 弹出窗口 3. 新增更新功能 4. 删除功能编辑 5. 表单验证 5. 接口文档准备工作后台服务接口，对书本的增删改查操作弹出窗口进入Ele…

人工智能 2023年6月30日
0090
翻译: 详细图解Transformer多头自注意力机制 Attention Is All You Need

前言 The Transformer——一个使用注意力来提高这些模型的训练速度的模型。Transformer 在特定任务中的表现优于谷歌神经机器翻译模型。然而，最大的好处来自于 T…

人工智能 2023年7月26日
0097
yolo系列论文阅读

YOLOv1 yolov1提出了一种新的识别方法，不同于RCNN系列将识别问题转化为对候选区域的分类，yolo使用回归方法直接预测目标的类别和位置。对输入的每幅图片，yolov1…

人工智能 2023年7月23日
00131
论文阅读笔记：图卷积网络

Cite: SEMI-SUPERVISED CLASSIFICATION WITH GRAPH CONVOLUTIONAL NETWORKS https://arxiv.org/a…

人工智能 2023年5月31日
00101
RDD与DataFrame的转换

RDD与DataFrame转换1. 通过反射的方式来推断RDD元素中的元数据。因为RDD本身一条数据本身是没有元数据的，例如Person，而Person有name,id等，而rec…

人工智能 2023年6月2日
0092
pycharm安装教程(2022)与使用

一、pycharm安装教程 1、进入官网下载pycharm官网下载地址：https://www.jetbrains.com/pycharm/download/#section=wi…

人工智能 2023年7月5日
0068
10.1 Python图像处理之边缘算子-Sobel算子、Roberts算子、拉普拉斯算子、Canny算子、Prewitt算子、高斯拉普拉斯算子

10.1 Python图像处理之边缘算子-Sobel算子、Roberts算子、拉普拉斯算子、Canny算子、Prewitt算子、高斯拉普拉斯算子文章目录 10.1 Python图…

人工智能 2023年6月18日
00108
目标检测算法——小目标检测

一、定义 1、以物体检测领域的通用数据集COCO物体定义为例，小目标是指小于32×32个像素点（中物体是指3232-9696，大物体是指大于96*96）。 2、在实际应用场景中，通…

人工智能 2023年7月9日
00107
JavaScript 2022 最新面试题【前端面试题】

1.对象属性绑定的事件，取消 <script> _btn.onclick = function() {} _btn.onclick = null </script…

人工智能 2023年7月31日
0078
基于三维激光点云的目标识别与跟踪研究

基于三维激光点云的目标识别与跟踪研究人工智能技术与咨询来源：《汽车工程》，作者徐国艳等［摘要］针对无人车环境感知中的障碍物检测问题，设计了一套基于车载激光雷达的目标识别与…

人工智能 2023年6月1日
0099

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31