梯度下降与反向传播算法的原理与推导

2023年7月13日上午8:09 • 人工智能 • 阅读 64

梯度下降算法是机器学习中最常用的优化算法之一，它可以求得目标函数的最小值，即算法的最优解。而对于复杂的多层神经网络来说，运用梯度下降算法十分复杂，因为其包含求导过程，为此学者将多层神经网络的优化问题简化为反向传播过程，也就是说，将目标函数（输出误差项）层层传递回输入层，求出每个节点的误差项，并根据每个节点的误差项更新各个权值。首先我们复习梯度下降算法，然后详细推导反向传播算法的原理。

梯度下降算法

我们的目标是优化目标函数，即求得目标函数的最小值，根据微积分的知识，求导数为0的点即是极值点。不过计算机可不会解方程，但是它可以凭借强大的计算能力，一步一步的去把函数的极值点『试』出来。

那怎么保证快速地朝下降的方向走到局部最低点呢？这里的奥秘在于，我们每次都是向函数的 梯度相反方向走的。梯度是一个向量，它指向函数值上升最快的方向。显然，梯度的反方向当然就是函数值下降最快的方向了。我们每次沿着梯度相反方向去修改的值，当然就能走到函数的最小值附近。

梯度下降算法计算如下：

接下来对E求导如下，将导数值代入（1）式即得到权值的更新值。

反向传播算法

梯度下降算法在计算单个感知器或线性单元的优化函数时很方便，然而单个感知器功能十分有限。早在1969年，作为人工神经网络创始人的明斯基和佩珀特就论证了简单的线性感知器不能解决如”异或”(XOR )这样的基本问题。因此出现了由多个感知器构成的 多层神经网络，可以模拟复杂的非线性函数。但是怎么优化多层神经网络呢？此时仍然可以采用梯度下降算法，只是梯度下降算法包含求导过程，对于多层神经网络而言求导十分复杂，因此学者把多层神经网络的梯度下降问题分解成了 反向传播过程。

首先我们用传统梯度下降算法计算一个三层神经网络，其中求导部分使用的 链式求导法则，关于这个大家可以看看微积分，这里就不赘述了。下面公式预警！（太难打了就手写，见谅）

三层神经网络如图，神经元的激活函数为sigmoid函数。从左到右分别为输入层（i），隐藏层（h），输出层（o），net代表单个神经元的输入，out代表单个神经元的输出。w代表权值。

即使是非常复杂的神经网络也可以采用这个算法进行权值更新，它被称为反向传播算法的原因可以直观理解为下图：

误差传递：

权值更新：

这与前向传播过程十分相似，只是前向传播过程将输入层层传输至输出以获得目标函数（误差项），而反向传播过程将误差层层传递至输入层以更新权值矩阵。

前向传播过程如下图所示：

（图片参考自CSDN: “反向传播算法”过程及公式推导（超直观好懂的Backpropagation））

Reference

零基础入门深度学习: https://www.zybuluo.com/hanbingtao/note/448086
吴恩达教授,《机器学习》,斯坦福大学
David E. Rumelhart, Geoffrey E. Hinton, Ronald J. Williams, Learning Representations By Back Propagating Errors , Nature 1986
Aurelien Geron, Hands on Machine-Learning with Scikit-Learn, Keras &TensorFlow
CSDN:”反向传播算法”过程及公式推导（超直观好懂的Backpropagation）

Original: https://blog.csdn.net/qq_53019232/article/details/122897777
Author: BetaDu
Title: 梯度下降与反向传播算法的原理与推导

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/689415/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

割草机器人芯片选型及各厂家产品对比

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
0077
简单的二次回归和线性回归的拟合效果对比

文章目录前言 * 本次主要是简单的对比了一下线性回归和二次回归的拟合效果对比，查看两种回归之间的差异。一、引入我们所需要的库二、创建训练数据集和测试数据集，并绘制训练集的散点…

人工智能 2023年6月17日
0094
语音识别方向秋招面试记录（持续更新）

语音识别相关 CTC 13 次（字节跳动 AI-Lab语音识别实习；vivo提前批语音算法工程师；百度语音技术岗；小米未来星；滴滴语音算法工程师-提前批；陌陌语音算法工程师；百度…

人工智能 2023年5月23日
0065
可解释的AI:用LIME解释扑克游戏

可解释的AI（XAI）一直是人们研究的一个方向，在这篇文章中，我们将看到如何使用LIME来解释一个模型是如何学习扑克规则的。在这个过程中，我们将介绍: 如何将LIME应用到扑克游戏…

人工智能 2023年7月28日
0074
【Jetson Nano学习笔记】3. ORB-SLAM3运行双目Demo（ZED 2i）

目录修改zed-ros-wrapper的参数双目测试平台：Jetson Nano系统版本：4.6.1 参考资料：zed-ros-wrapper —— ROS WikiZED …

人工智能 2023年6月2日
00113
Spark RDD、DataFrame和DataSet的区别

优点: 缺点: <span class="hljs-keyword">import org.apache.spark.sql.SQLContext …

人工智能 2023年6月2日
0066
人脸识别-对数据的训练

感谢优秀的你打开了小白的文章灰度转换人脸识别基础-灰度转换与修改图片尺寸_am_student的博客-CSDN博客矩形圆形的绘制人脸识别-矩形圆形的绘制_am_student的…

人工智能 2023年7月19日
0061
Matlab回归分析

线性回归：在实际中，对于情况较复杂的实际问题（因素不易化简，作用机理不详）可直接使用数据组建模，寻找简单的因果变量之间的数量关系，从而对未知的情形作预报。这样组建的模型为拟合模型…

人工智能 2023年7月26日
0057
R笔记：全子集回归 | 最优子集筛选变量挑选

R笔记：全子集回归 | 最优子集筛选 AIC 最优子集筛选（Best Subset Selection）一统浆糊 2021-05-05 18:58 变量筛选中常用方法解释 R语言…

人工智能 2023年6月17日
0096
BI建设 | 脱离业务谈数据都是耍流氓

前言数据是冰冷的，它会告诉你残酷的真相；同时，数据也是客观的，它会让你看到潜在的希望…… “数据分析”是指通过分析数据，发现业务…

人工智能 2023年7月18日
0059
Opencv项目实战：07 人脸识别和考勤系统

1、效果展示人脸识别：考勤效果： 2、项目介绍接下来，我们将学习如何以高精度执行面部识别，首先简要介绍理论并学习基本实现。然后我们将创建一个考勤项目，该项目将使用网络摄像头检…

人工智能 2023年7月28日
0075
java计算机毕业设计家电产品售后MyBatis+系统+LW文档+源码+调试部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年7月24日
0071
快进来看王冰冰！青年大学习提醒系统来了！！

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月5日
0060
【论文分享】KPT:Knowledgeable Prompt-tuning:Incorporating Knowledge into Prompt Verbalizer for Text Classi

论文链接：https://arxiv.org/pdf/2001.07676.pdf时间：2021年8月特点：改善答案映射，使用手工模板目录背景模型 * Verbalizer …

人工智能 2023年6月1日
00104
keras.layers.Conv2D默认参数详解

keras.layers.Conv2D(filters, kernel_size, strides=(1, 1), padding=’valid’, dat…

人工智能 2023年6月4日
00120
深度学习笔记_Keras六步法搭建网络

深度学习笔记_Keras六步法搭建网络 Keras六步法搭建网络，以MNIST数据集为例 * 一、import加载库二、设置训练集、测试集三、搭建神经网络四、配置神经网络五…

人工智能 2023年5月26日
00110

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

梯度下降与反向传播算法的原理与推导

梯度下降算法

反向传播算法

Reference

大家都在看