在AI算法中，什么是反向传播算法

2024年1月3日上午12:11 • 人工智能 • 阅读 59

什么是反向传播算法？

在深度学习中，反向传播算法（Backpropagation）是一种用于训练神经网络的优化算法。它通过计算损失函数对网络参数的梯度，并将其反向传播到网络的每层，从而更新参数以使损失最小化。反向传播算法是深度学习中最重要的算法之一，它使得神经网络能够自动学习和调整自己的权重和参数。

算法原理

反向传播算法利用了链式法则（chain rule）来计算网络参数的梯度。链式法则用于计算复合函数的导数，它将导数的计算分解为一系列局部导数的乘积。

对于一个具有多个参数和层的神经网络，反向传播算法计算损失函数关于每个参数的偏导数，然后使用梯度下降法来更新参数。算法的核心思想是将网络的前向传播过程和反向传播过程结合起来，通过计算每一层的误差梯度，逐层向后传播梯度，从而更新参数。

公式推导

首先我们定义一个多层神经网络的损失函数为$J$，神经网络的输出为$y$，真实标签为$t$。我们使用交叉熵损失函数来度量预测值与真实值之间的差异：

$$J = -\sum_i t_i \log(y_i)$$

其中，$t_i$是真实标签的第$i$个元素，$y_i$是网络输出的第$i$个元素。

下面推导反向传播算法的核心公式，我们以一个具有一个隐藏层的神经网络为例进行推导。

假设网络的输入层与隐藏层之间的权重矩阵为$W_1$，隐藏层与输出层之间的权重矩阵为$W_2$，并且该网络使用sigmoid激活函数。

计算输出层的梯度：

首先计算输出层的误差项$\delta_2$（即输出层的梯度）：

$$\delta_2 = y – t$$

然后计算输出层权重矩阵$W_2$的梯度：

$$\frac{\partial J}{\partial W_2} = \delta_2 \cdot a_1^T$$

其中，$a_1$是隐藏层的输出。

计算隐藏层的梯度：

首先计算隐藏层的误差项$\delta_1$（即隐藏层的梯度）：

$$\delta_1 = (W_2^T \cdot \delta_2) \cdot f'(z_1)$$

其中，$f'(z_1)$是隐藏层神经元激活函数sigmoid的导数。

然后计算隐藏层权重矩阵$W_1$的梯度：

$$\frac{\partial J}{\partial W_1} = \delta_1 \cdot x^T$$

其中，$x$是网络的输入。

计算步骤

反向传播算法的计算步骤如下：

初始化网络参数（权重矩阵和偏置向量）。
前向传播：计算网络的输出。
计算损失函数的梯度。
反向传播：计算每一层的梯度。
更新网络参数：使用梯度下降法更新网络的权重矩阵和偏置向量。
重复步骤2到5，直到收敛或达到最大迭代次数。

Python代码示例

下面是一个使用Python实现的简单的反向传播算法的示例代码，代码中使用的是虚拟数据集：

import numpy as np

# 定义sigmoid函数及其导数
def sigmoid(x):
 return 1 / (1 + np.exp(-x))

def sigmoid_derivative(x):
 return sigmoid(x) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls (1 - sigmoid(x))

# 初始化网络参数
input_size = 2
hidden_size = 4
output_size = 1
learning_rate = 0.1

W1 = np.random.randn(hidden_size, input_size)
b1 = np.random.randn(hidden_size, 1)
W2 = np.random.randn(output_size, hidden_size)
b2 = np.random.randn(output_size, 1)

# 定义前向传播函数
def forward_propagation(x):
 z1 = np.dot(W1, x) + b1
 a1 = sigmoid(z1)
 z2 = np.dot(W2, a1) + b2
 y = sigmoid(z2)
 return y, a1

# 定义反向传播函数
def backward_propagation(x, y, a1):
 delta2 = y - t
 delta1 = np.dot(W2.T, delta2) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls sigmoid_derivative(a1)

 dW2 = np.dot(delta2, a1.T)
 db2 = delta2
 dW1 = np.dot(delta1, x.T)
 db1 = delta1

 return dW1, db1, dW2, db2

# 定义梯度下降函数
def gradient_descent(dW1, db1, dW2, db2):
 global W1, b1, W2, b2
 W1 -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls dW1
 b1 -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls db1
 W2 -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls dW2
 b2 -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls db2

# 训练神经网络
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
Y = np.array([[0], [1], [1], [0]])
for i in range(100000):
 for j in range(len(X)):
 x = X[j].reshape(-1, 1)
 t = Y[j].reshape(-1, 1)

 y, a1 = forward_propagation(x)
 dW1, db1, dW2, db2 = backward_propagation(x, y, a1)
 gradient_descent(dW1, db1, dW2, db2)

# 预测输出
for j in range(len(X)):
 x = X[j].reshape(-1, 1)
 t = Y[j].reshape(-1, 1)
 y, _ = forward_propagation(x)
 print("Input:", x.flatten(), "Target:", t.flatten(), "Predicted:", y.flatten())

代码细节解释

初始化网络参数：初始化输入层到隐藏层之间的权重矩阵$W1$和偏置向量$b1$，隐藏层到输出层之间的权重矩阵$W2$和偏置向量$b2$。
前向传播：计算输入数据通过网络后的输出。首先计算第一层的加权和$z1$，然后通过sigmoid函数$f(z1)$得到隐藏层的输出$a1$。然后，计算第二层的加权和$z2$，再通过sigmoid函数$f(z2)$得到最终的输出$y$。
反向传播：计算每一层的梯度。首先计算输出层的梯度$delta2$，然后通过传播到隐藏层计算隐藏层的梯度$delta1$。然后，计算损失函数对参数$W1, b1, W2, b2$的偏导数$dW1, db1, dW2, db2$。
更新网络参数：根据梯度下降法更新参数$W1, b1, W2, b2$。
训练神经网络：使用虚拟数据集进行训练，对每个输入样本进行前向传播和反向传播，并更新网络参数。
预测输出：通过训练后的网络进行预测，输出每个输入样本的预测结果。

总之，反向传播算法通过计算损失函数对网络参数的梯度，并将其反向传播到每一层，实现了神经网络的训练。通过反向传播算法，神经网络能够自动学习和调整自己的权重和参数，从而提高模型的准确性。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823306/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基础篇：一文讲懂树莓派命令行文本编辑工具Vim的使用

简介众所周知，在Linux系统下的命令行调试界面，经常会遇到需要文本编辑的情况，而树莓派官方系统默认自带了Nano编辑器，Nano的操作门槛更低，但却不如Vim编辑器方便。Vim…

人工智能 2023年6月12日
0063
LSTM时间序列预测

文章目录 1、tensorflow张量的形状 2、RNN 3、LSTM * 3.1 深入了解LSTM结构 4、keras的LSTM – 4.1 参数return_seq…

人工智能 2023年5月24日
0085
halcon知识：select_shape究竟怎么用（1）？

目录说明一、测试select_shape,如下图（单通道图） 1.1 语法结构 1.2 区域Operation选取 1.3 用另一个图再试试！二、结论三、关于Featur…

人工智能 2023年6月18日
00115
什么是云计算？什么是边缘计算？为什么需要云边协同？

一、云计算的发展云计算（cloud computing）是分布式计算的一种，指的是通过网络”云”将巨大的数据计算处理程序分解成无数个小程序，然后，通过多…

人工智能 2023年7月31日
0084
三个点带你解读Smartbi商业智能大数据分析平台

过去，商业智能是大公司的特权，这些公司有能力雇佣 IT 专家和数据科学家团队。但随着技术的迅速发展，数据软件不仅更加轻巧、更强大，而且更易于访问。小型企业可以使用与同类大型企业相同…

人工智能 2023年6月11日
0086
初始化二维列表时使用[ [0]* N ] * K会出现的问题

声明二维列表使用[ [0]* N ] * K会出现的问题初始化二维列表时使用[ [0]* N ] * K创建，外层列表的每一个元素地址相同：创造了一个二维列表：修改其中的一个…

人工智能 2023年6月4日
0064
均值聚类散点图怎么画_JASP做K均值聚类提供的肘部图是个亮点

K均值聚类要求事先给出聚类个数K，或你需要对K有一定的认知。SPSS操作时允许用户直接指定K，但是没有配套的可视化图形辅助判断聚类是否合适。 JASP提供了肘部图，有助于我们理解聚…

人工智能 2023年6月2日
0088
双十二买什么蓝牙耳机好？平价好用蓝牙耳机推荐

如果您正在寻找蓝牙耳机来接听电话或锻炼，而不必担心耳机线，这些蓝牙设备是您的完美选择。十年前，入耳式无线耳机风靡一时。但随着越来越多的人习惯于将手机放在耳朵旁边，技术和质量要求导致…

人工智能 2023年5月25日
0076
trans系列平移距离模型

翻译距离模型Translation Distance Models 数值化知识知识图谱（KG）是由实体 (节点) 和关系 (不同类型的边) 组成的多关系图。每条边都表示为形式 (…

人工智能 2023年6月1日
00100
深度学习之目标检测（五）– RetinaNet网络结构详解

深度学习之目标检测（五）– RetinaNet网络结构详解 * – 深度学习之目标检测（五）RetinaNet网络结构详解 – + 1. Ret…

人工智能 2023年5月26日
00140
pandas 基本数据结构：Series 和 DataFrame

pandas主要有两个数据结构： Series 和 DataFrame 维数名称描述1Seriescentered 带标签的一维同构数组2DataFrame带标签的，大小可变的，二…

人工智能 2023年7月8日
00101
SQL 聚合查询

SQL 为什么要支持聚合查询呢？这看上去是个幼稚的问题，但我们还是一步步思考一下。数据以行为粒度存储，最简单的 SQL 语句是 select * from test，拿到的是整个…

人工智能 2023年7月16日
0086
pandas算加权平均值_使用Pandas数据框计算加权平均值

I have te following pandas dataframe: data_df = pd.DataFrame({‘ind’:[‘la…

人工智能 2023年7月8日
0080
【Java】反射, 枚举,Lambda表达式

✨系列专栏: 【Java SE】✨一句短话:难在坚持,贵在坚持,成在坚持! 文章目录一. 反射 * 1. 反射的概述 2. 反射的使用 – 2.1 反射常用的类 2….

人工智能 2023年7月29日
0062
channel-wise卷积–学习笔记

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月16日
0083
数据分析系统的设计与实现

数据分析系统的设计与实现大数据demo，参考自淘宝双11数据分析与预测课程案例厦大数据库实验室博客 (xmu.edu.cn) 实验环境操作系统 Linux （实验室版本为 U…

人工智能 2023年6月19日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31