一文读懂反向传播算法原理

2023年6月15日下午10:21 • 人工智能 • 阅读 81

1.前言

写这个文章主要是因为学习了 吴恩达老师的机器学习视频，在 神经网络的反向传播算法（Back Propagation）的公式推导有些模糊，所以自己也查阅了很多资料，才基本搞明白其中的原理。所以希望通过写一下文章来进行梳理一下。
因为本文的公式推导是 基于吴恩达老师的课程，课程里的神经网络部分主要讲述的是 神经网络在分类的应用，因此 激活函数采用的是 sigmoid函数，下面的公式推导也基于这个进行推导。
最后，因为自己是刚开始学习机器学习，所以可能理解上存在一些小的偏差。如果文章中有错误，欢迎大家指正。

2.前向传播

要 理解反向传播，那么就必须 先理解前向传播，下图以一个 三层神经网络为例。。

根据上图，我给大家罗列一下正向传播的步骤，前向传播还是比较好理解的。 通过输入层(Layer1)将数据输入（注意要加上偏执单元a0(l)=1），然后经过隐藏层（Layer2）加工处理，最后通过输出层（Layer3）进行输出结果。

1、输入层输入训练集
输入层其实就是对应上图中的 Layer1。
我们会有训练集(x,y)，训练集中会包含许多的 (x(i),y(i))样本，每一个x(i)中又会包含许多的特征 xj(i)，如x1(i)、x2(i)等等。
然后我们将x(i)中的xj(i)输入到神经网络中，就成为了输入层中的 aj(0)，其中x1(i)=a1(1)、x2(i)=a2(1)。
最后，为了计算方便，我们需要加上 偏置单元a0(1)=1

2、隐藏层计算zj(2)
第二步就是 通过权重矩阵计算出zj(2)，具体的计算方法如下图所示：

因为 权重w和参数θ代表的是一个意思，因此对于上图可以进行向量化表示，具体如下图所示(@代表矩阵的方式相乘)：

3、通过激活函数计算出aj(2)
通过上一步计算的zj(2)，经过 激活函数sigmoid，计算出aj(2)，具体如下图所示

4、计算输出层的aj(3)
原理和上面计算隐藏层的类似，这里就不再重复了，相类比就可以计算出aj(3)。

; 3.反向传播

还是老规矩，我们先上图，再一步一步进行解释。

反向传播的提出其实是为了解决偏导数计算量大的问题，利用反向传播算法可以快速计算任意一个偏导数。反向传播算法的思想和前向传播是一样的，只是一个反向的过程，推导过程中注意链式法则，一层扣一环即可求得结果。
大家在看下面的推导的时候，一定记得高数中的链式法则，逐步推导就可以了，其实是一个很简单的过程。

1、定义损失函数
首先，我们先定义这个神经网络的损失函数，如下图所示

2、定义误差δ
吴恩达老师在视频中将δ翻译为误差，其实这是一种广义上的误差。因为除了输出层之外，我们是无法直接得到每一层的误差的。
广义上定义这个误差是这样的，如下图所示：

因为偏导数其实就是表明了自变量对因变量产生了多大的影响。因此对于上面这个图中关于δ的定义，我们也就可以理解为zj(l)这个数对最终输出层的计算的误差J(θ)产生了多大的影响，也就是这个数对于这个误差做出了多大贡献。最理想的状态是δ=0，也就是偏导数等于0，没有对误差最终的误差产生影响。然后我们就将把这个”贡献”称为误差。
后面的公式计算每一层的δj(l)其实都是基于这个定义进行推导的。至于为什么在输出层没有使用这个定义去求误差，而是直接使用δj(L)=aj(L)-y得到输出层的误差，大家可以看完全文后回头去看一下这篇文章：反向传播输出层误差 δ。这篇文章清晰地进行了证明，这是因为逻辑回归的损失函数凑巧的一个性质造成的，如果是其他的损失函数则需要按照定义去

3、第L层δ（输出层）的具体推导
首先，我们先定义误差δ的一般形式，如下图所示：

对于输出层的误差推导如下图所示：

4、第l层误差δ的具体推导
下面我们对上一步进行推广，得到普遍的l层的误差误差δ

对上图结果向量化可得：

上面的推导看似很复杂，其实就是遵循一个链式法则，我已经基本没有省略步骤了，应该是很详细了。推导的时候需要记得前向传播中a(l)是如何通过权重矩阵编程z(l+1)的，然后z(l+1)通过激活函数又会变成a(l+1)，只要遵循这个就可以一步一步推导得出结果。

5、计算得出θij(l)的偏导数
反向传播算法的最终目的就是为了方便计算偏导数，到这一步就可以计算偏导数了。下面先重新放上吴恩达老师的视频截图，如下图所示

从上图中我们可以看到， 吴恩达老师还把g'(a)展开成了g(a)*(1-g(a))的形式，这个其实是因为sigmoid函数的性质造成的，具体推导如下：

关于 偏导数的推导如下图所示:
一文读懂反向传播算法原理

通过上面的推导，就可以完全解释吴恩达老师所有公式的原理了。

; 4.参考文章

1、反向传播算法（过程及公式推导）
2、反向传播输出层误差 δ
3、详解反向传播算法(上)
4、详解反向传播算法(下)

Original: https://blog.csdn.net/weixin_41799019/article/details/117353078
Author: XHHP
Title: 一文读懂反向传播算法原理

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/617898/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Paddle安装是遇到 Error: Can not import avx core while this file exists:

Error: Can not import avx core while this file exists: D:\Python\lib\site-packages\paddle\…

人工智能 2023年6月16日
0085
网络结构可视化onnx+netron

ONNX Open Neural Network Exchange (ONNX) 可以将不同框架(TensorFlow/Pytorch/Paddle)训练出来的模型都转换onnx模…

人工智能 2023年7月27日
0052
lightgbm回归模型使用方法（lgbm.LGBMRegressor）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月28日
0035
【SCA-CNN 解读】空间与通道注意力：Spatial and Channel-wise Attention

; 摘要视觉注意已经成功地应用于结构预测任务，如视觉字幕和问题回答。现有的视觉注意力模型一般是空间的，即注意力被建模为空间概率，该空间概率对编码输入图像的CNN的最后一个卷积层…

人工智能 2023年5月26日
00110
cspj2022 T4 上升点列(point)题解（floyd）

样例一： 8 23 13 23 33 61 22 25 55 3 样例一输出： 8 样例二： 4 10010 1015 2520 2030 30 样例二输出： 103 一、题目解析…

人工智能 2023年6月30日
0045
OpenCV学习——ArUco模块

ArUco模块是OpenCV的contrib拓展库中一个模块，需要安装OpenCV的contrib拓展库才能正常使用。 ArUco 标记是由宽黑色边框和确定其标识符（id）的内部二…

人工智能 2023年5月26日
0064
结构体&内存对齐

本章重点简介; 结构体的声明结构的自引用 typedef注意事项一种特殊的声明结构体变量的定义和初始化匿名结构体定义变量与初始化计算结构体大小&结构体内存对齐 …

人工智能 2023年6月29日
0078
理解支持向量机(SVM)的原理和工作原理

理解支持向量机(SVM)的原理和工作原理支持向量机（Support Vector Machine, SVM) 是一种非常常用的机器学习算法，用于分类和回归问题。它的基本原理是基于…

人工智能 2024年4月12日
0042
Anaconda安装Jupyter Notebook及使用

文章目录 * – + 一、什么是Jupyter Notebook + * 1. 网页应用 * 2. 文档 + 二、安装 Jupyter Notebook + * 1. …

人工智能 2023年7月3日
0063
YOLOv5简析

先说些题外话，YOLOv5没有论文，其作者是Mosaic Augmentation 的创造者，YOLO V5 在性能上稍弱于YOLO V4，但是在灵活性与速度上远强于YOLO V4…

人工智能 2023年5月26日
0075
大学数据分析课程设计

背景双十一购物狂欢节现已成中国电子商务的年度盛典，随着电子商务平台的逐渐兴起，平台的竞争也越来越强，为了更好地提高平台和商家利润。伴随着网购规模的逐年增大，随之产生了大量的围绕平…

人工智能 2023年7月18日
0062
[山东科技大学OJ]1107 Problem A: 编写函数：Swap (I) (Append Code)

Time Limit: 1 Sec Memory Limit: 16 MB Submit: 17642 Solved: 11482 [Submit][Status] Descrip…

人工智能 2023年6月27日
0088
【推荐实践】阿里文娱面向用户增长的信息流分发机制

今天给大家带来阿里文娱-人工智能部-信息流推荐的天师所做的分享《阿里文娱面向用户增长的信息流分发机制》,关注推荐算法、信息流分发、用户增长的伙伴们别错过啦！（到小程序：省时查报告 …

人工智能 2023年6月10日
0081
中科大2021年自然语言理解nlp/nlu期末试题回忆

一、分析句子是否有歧义，并指出是因为句法结构、词义、语义结构因素或者多个因素导致的。（30分） 1）A man stopped at every truck stop. 2）咬死猎…

人工智能 2023年5月31日
0078
价值学习（Value-based Reinforcement Learning）

文章目录前言一、价值学习（Value-based Reinforcement Learning） * 1.Deep Q-Network（DQN） 2.训练DQN使用的算法 3….

人工智能 2023年7月13日
0058
Opencv图像处理图像噪点与降噪形体学变换

图像阈值进行图像阈值处理主要的使用图像是二值图。例如如果需要讲灰度图转换为二值图，比如我们感兴趣的区域灰度在[128,256]，不感兴趣的的范围灰度值在[0,127]，此时我们…

人工智能 2023年6月18日
0095

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

一文读懂反向传播算法原理

1.前言

2.前向传播

; 3.反向传播

; 4.参考文章

大家都在看