卷积神经网络入门基础知识

2023年7月13日下午5:02 • 人工智能 • 阅读 74

一、卷积神经网络（CNN）定义

卷积神经网络（convolutional neural network, CNN），是一种专门用来处理具有类似网格结构的数据的神经网络。卷积网络是指那些至少在网络的一层中使用卷积运算来替代一般的矩阵乘法运算的神经网络。
经典神经网络的结构：
LeNet-5

AlexNet

VGG

; 二、DNN与CNN的区别

上图为DNN神经网络图，DNN内部的神经网络层可以分为三类，输入层，隐藏层和输出层，一般来说第一层是输出层，最后一层是输出层，而中间的层数都是隐藏层。

上图为CNN神经网络
【总结】
（1）DNN是一种最简单的神经网络。各个神经元分别属于不同的层，每个神经元和前一层的所有神经元相连接，信号从输入层向输出层单向传播。
（2）CNN是一种通过卷积计算的前馈神经网络，其是受生物学上的感受野机制提出的，具有平移不变性，使用卷积核，最大的应用了局部信息，保留了平面结构信息。
（3）DNN以向量形式输入，未考虑平面的结构信息，而在图像领域和自然语言处理领域，平面信息很重要，因此CNN比DNN处理结果更好。由于DNN、CNN的输入、输出长度固定，而自然语言处理中的语句长度通常不固定，所以DNN、CNN处理这种问题效率较低，且无法处理时序相关的序列问题.为了解决这些问题，出现了循环神经网络RNN。（RNN本文暂不讲解，后续文章会讲到）

三、CNN五种结构组成

1、输入层
在处理图像的CNN中，输入层一般代表了一张图片的像素矩阵。可以用三维矩阵代表一张图片。三维矩阵的长和宽代表了图像的大小，而三维矩阵的深度代表了图像的色彩通道。比如黑白图片的深度为1，而在RGB色彩模式下，图像的深度为3。

2、卷积层(Convolution Layer)
卷积层是CNN最重要的部分。它与传统全连接层不同，卷积层中每一个节点的输入只是上一层神经网络的一小块。卷积层被称为过滤器(filter)或者内核(kernel)，Tensorflow的官方文档中称这个部分为过滤器(filter)。
【注意】在一个卷积层中，过滤器(filter)所处理的节点矩阵的长和宽都是由人工指定的，这个节点矩阵的尺寸也被称为过滤器尺寸。常用的尺寸有3×3或5×5，而过滤层处理的矩阵深度和当前处理的神经层网络节点矩阵的深度一致。
下图为卷积过程

3、池化层(Pooling Layer)
池化层不会改变三维矩阵的深度，但是它可以缩小矩阵的大小。通过池化层，可以进一步缩小最后全连接层中节点的个数，从而达到减少整个神经网络参数的目的。使用池化层既可以加快计算速度也可以防止过拟合。池化层filter的计算不是节点的加权和，而是采用最大值或者平均值计算。使用最大值操作的池化层被称之为最大池化层（max pooling）（最大池化层是使用的最多的磁化层结构）。使用平均值操作的池化层被称之为平均池化层（mean pooling）。
下图分别表示不重叠的4个2×2区域的最大池化层（max pooling）、平均池化层（mean pooling）

4、全连接层
在经过多轮卷积层和池化层的处理之后，在CNN的最后一般会由1到2个全连接层来给出最后的分类结果。经过几轮卷积层和池化层的处理之后，可以认为图像中的信息已经被抽象成了信息含量更高的特征。我们可以将卷积层和池化层看成自动图像特征提取的过程。在提取完成之后，仍然需要使用全连接层来完成分类任务。
5、Softmax层
通过Softmax层，可以得到当前样例属于不同种类的概率分布问题。

; 四、卷积神经网络具体流程

1、边缘检测示例
如下图所示，原图是一个6 * 6的矩阵，卷积核是一个3 * 3的矩阵，经过卷积后得到一个4 * 的矩阵。

2、更多边缘检测例子
垂直边缘检测不仅可以检测垂直方向的边缘，还可以区分该边是从亮到暗(正边)还是从暗到亮(负边)。
卷积神经网络入门基础知识

3、Padding(在边缘是否填充)
对于之前介绍的卷积方式，其存在两个缺陷：
一是当一个6 * 6的图像经过3 * 3的卷积核卷积后会变成一个4 * 4的图像，这使图像经过卷积后变小了；
二是原矩阵边缘处只被运算一次，而中心处会被运算多次，导致边缘处大部分信息被丢失了。
下图是两种卷积方式：
Valid卷积是令padding为0；
Same卷积是通过添加padding使卷积前和卷积后图像的大小相同（p=(f-1)/2）。
引入padding后维数的公式为n+2p-f+1。
4、卷积步长stride(filer每次移动的长度)
当步长为2时，每进行一次运算后都要向左或者下移动两个像素点，如下图。
卷积神经网络入门基础知识

有步长的情况下维数的计算公式：
n×n * f×f =(n+2p-f)/s+1 × (n+2p-f)/s+1
4、镜像操作（mirroring operation）：
| 3 | 0 | 1 | | 2 | 8 | 1 |
| 1 | 5 | 8 | ========> | 7 | 5 | 0 |
| 2 | 7 | 2 | | 2 | 1 | 3 |
沿着对角线进行对称交换数值。
5、三维卷积
对三维图像进行卷积时，卷积核的通道数要与三维图像的通道数相等。当我们想对图像的多个边缘特征进行检测时，我们可以使用多个卷积核，这样卷积后生成图像的通道数为使用的卷积核的个数。
对于三维卷积具体运算的实例如下：如果使用的是下图3 * 3 3的卷积核，则一共有27个参数，进行卷积运算时让数值与相应的参数相乘后求和，这就是最后4 * 4 * 1矩阵中的一个值。
6、池化层
下图是最大池化，在每个作用区域内选择值最大的一个放在输出的方格上。当输入有多层时，对每一层都采用相同的操作，这样输入和输出的层数是相同的。最大池化的功能就是只要在任何一个象限内提取到某个特征，它都会保留在最大池化的输出里。最大池化运算的实际作用就是，如果在过滤器中提取到某个特征，那么保留其最大值，如果没有提取的这个特征，那么其最大值也是很小的。
7、Max pooling*

需要注意的是，池化过程中的参数都是静态的，不需要进行学习。并且，卷积过程中计算维数的公式也可以应用在池化过程中。池化层的主要作用是特征降维，提高模型的鲁棒性。
n_h[l] × n_w[l] × n_c[l]—-> (n_h-f)/s+1 × (n_w-f)/s+1

9、为什么使用卷积
与只使用全连接层相比，卷积层有两个优势：参数共享和稀疏连接。这样可以有效减少参数的数量。

对于激活函数，主要作用是防止线性化，因为每次卷积的目的就是为了是每次的输出结果不同，不同越深的卷积层那么输出的特征图也更加明显，但是如果没有激活函数，那么多次的输出特征图都可以用一层卷积来代替，那么这就与深度学习的思想相违背，为了非线性而选择出来了不同的激活函数，每个激活函数的作用也不相同。
1.Sigmoid
sigmoid函数也称为Logistic函数，因为Sigmoid函数可以从Logistic回归（LR）中推理得到，也是LR模型指定的激活函数。具体推理参考：Datartisan：机器学习系列-广义线性模型

sigmod函数的取值范围在（0, 1）之间，可以将网络的输出映射在这一范围，方便分析。

Sigmoid公式及导数：

Sigmoid作为激活函数的特点：

优点：平滑、易于求导。

缺点：

激活函数计算量大（在正向传播和反向传播中都包含幂运算和除法）；
反向传播求误差梯度时，求导涉及除法；
Sigmoid导数取值范围是[0, 0.25]，由于神经网络反向传播时的”链式反应”，很容易就会出现梯度消失的情况。例如对于一个10层的网络，根据[公式]，第10层的误差相对第一层卷积的参数[公式]的梯度将是一个非常小的值，这就是所谓的”梯度消失”。
Sigmoid的输出不是0均值（即zero-centered）；这会导致后一层的神经元将得到上一层输出的非0均值的信号作为输入，随着网络的加深，会改变数据的原始分布。
2. tanh
tanh为双曲正切函数，其英文读作Hyperbolic Tangent。tanh和 sigmoid 相似，都属于饱和激活函数，区别在于输出值范围由 (0,1) 变为了 (-1,1)，可以把 tanh 函数看做是 sigmoid 向下平移和拉伸后的结果。

tanh公式：

从第二个公式中，可以更加清晰看出tanh与sigmoid函数的关系（平移+拉伸）。

tanh作为激活函数的特点：
相比Sigmoid函数，

tanh的输出范围时(-1, 1)，解决了Sigmoid函数的不是zero-centered输出问题；
幂运算的问题仍然存在；
-tanh导数范围在(0, 1)之间，相比sigmoid的(0, 0.25)，梯度消失（gradient vanishing）问题会得到缓解，但仍然还会存在。
3.ReLU
Relu(Rectified Linear Unit)——修正线性单元函数：该函数形式比较简单，
公式：relu=max(0, x)
ReLU及其导数曲线：

从上图可知，ReLU的有效导数是常数1，解决了深层网络中出现的梯度消失问题，也就使得深层网络可训练。同时ReLU又是非线性函数，所谓非线性，就是一阶导数不为常数；对ReLU求导，在输入值分别为正和为负的情况下，导数是不同的，即ReLU的导数不是常数，所以ReLU是非线性的（只是不同于Sigmoid和tanh，relu的非线性不是光滑的）。

ReLU在x>0下，导数为常数1的特点：

导数为常数1的好处就是在”链式反应”中不会出现梯度消失，但梯度下降的强度就完全取决于权值的乘积，这样就可能会出现梯度爆炸问题。解决这类问题：一是控制权值，让它们在（0，1）范围内；二是做梯度裁剪，控制梯度下降强度，如ReLU(x)=min(6, max(0,x))

ReLU在x

Original: https://blog.csdn.net/WUHU648/article/details/121375933
Author: 无乎648
Title: 卷积神经网络入门基础知识

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690253/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

四轮驱动（SSMR）移动机器人运动模型及应用分析

混沌无形混沌系统是世界本质，无形之中存在规律。机器人智能化发展从线性过渡到混沌，本号将分享机器人全栈技术（感知、规划、控制；软件、机械、硬件等）。 43篇原创内容公众号（文末…

人工智能 2023年6月10日
0083
数据挖掘 | 实验二数据的可视化

文章目录一、目的与要求二、实验设备与环境、数据三、实验内容 * （1）数据获取（2）数据的清理（3）可视化技术 – a) 直方图展示各个维度的值分布情况；（2…

人工智能 2023年6月11日
0084
yolov5——train.py代码【注释、详解、使用教程】

yolov5——train.py代码【注释、详解、使用教程】 yolov5——train.py代码【注释、详解、使用教程】 yolov5——train.py代码【注释、详解、使用教…

人工智能 2023年7月20日
0067
最近大火的「元宇宙」是什么？

作者：腾讯技术工程特约撰稿人李佳华本文将介绍元宇宙的由来和底层技术，探讨海内外资本在这条赛道上的布局，元宇宙将会对哪些行业产生变革的影响，这些影响背后凸显了元宇宙的哪些价值，以…

人工智能 2023年7月30日
0062
pyecharts学习小总结——Bar（柱状图）、Pie（饼图）、Line（线图）、Page（页面组件）、Tab（分页组件）、Grid（组合组件）

目录 pyecharts常用模块总结 Bar（柱状图） * 1. 旋转x轴标签 2. 添加工具箱 3. 柱状图与折线图混合 4. 标注x轴名称 5. 设置垂直的一天时间线 6. 旋…

人工智能 2023年7月15日
0066
云原生|kubernetes|本地存储hostpath-provisioner部署以及无token密码方式登陆dashboard的部署

前言： kubernetes的存储类大家应该都知道，常用的有nfs-client-provisioner这样插件形式，其实还有一种本地存储类的插件，只是这个估计很冷门，生产上网络存…

人工智能 2023年6月30日
0064
OPENCV 寻找图形最大内接矩形

轮廓的最大外接矩形，Opencv有提供的现成的算法，最大内接圆也有提供的算法。但是没有现成的内接矩形的算法。本文使用C++实现了取轮廓最大内接矩形的方式，供大家参考。实现的基本思…

人工智能 2023年6月18日
0086
1元左右从零开始搭建自己的chatgpt微信机器人（含chaptgpt注册流程）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0080
PyTorch与Tensorflow的快速环境配置（有GPU版本）【从头到尾；无障碍】

摘要：本文参考前辈资料，并结合实际操作，记录深度学习的经典框架PyTorch与TensorFlow的实际环境配置所需操作。其中，操作1-2步为两个框架环境配置都需要执行的操作，第…

人工智能 2023年5月24日
00126
算法效果评估：均方根误差（RMSE）/ 标准误差

文章目录 1. 评估算法的效果 2. 方差（Variance） * 2.1 总体方差 – 2.1.1 在numpy中计算总体方差 2.1.2 在pandas中计算总体方…

人工智能 2023年6月15日
0083
02标准建模流程:样本定义与数据集构建

1 样本定义一般样本分为正样本和负样本，通常将响应变量称为负样本，比如贷款的用户为负样本，未贷款的用户为正样本。在营销场景中有以下几种定义方式，具体的定义方式应根据建模目标而定：…

人工智能 2023年5月31日
0091
YOLOv3学习——锚框和候选区域

R-CNN系列算法需要先产生候选区域，再对候选区域做分类和位置坐标的预测，这类算法被称为两阶段目标检测算法。近几年，很多研究人员相继提出一系列单阶段的检测算法，只需要一个网络即可同…

人工智能 2023年5月26日
0079
CV任务中如何解决图像光照度不均匀的问题

01 . 图像光照对于图像任务的影响在以图像视觉为主的CV任务当中，经常会遇到图像光照不均匀的情况，这种情况往往会影响到图像的对比度问题，从而影响到CV任务的最终结果。比如我们在…

人工智能 2023年6月17日
0080
Web3中文｜AI机器人ChatGPT如何看待DeFi？

如果还没有玩过OpenAI最新的聊天机器人ChatGPT，那您真的应该体验一下。从电影推介到编程查询，ChatGPT几乎可以对您向它提出的任何提示做出类似人类的逻辑响应。这种新奇…

人工智能 2023年7月31日
0085
Graph Neural Network自学笔记

Graph Neural Network自学笔记一、图 1.1图的表示每一个node、edge都会有attr。上图当中node有x0，x1两个attr，以及想要预测的y。edg…

人工智能 2023年7月14日
00105
【小程序从0到1】网络数据请求——request合法域名｜GET｜POST｜跨域？Ajax？

欢迎来到我的博客📔博主是一名大学在读本科生，主要学习方向是前端。 🍭目前已经更新了【Vue】、【React–从基础到实战】、【TypeScript】等等系列专栏 🛠目前正在学习的是…

人工智能 2023年7月1日
0085

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

卷积神经网络入门基础知识

大家都在看