什么是误差反向传播算法

2024年1月4日下午7:09 • 人工智能 • 阅读 56

什么是误差反向传播算法？

误差反向传播算法（Error Backpropagation Algorithm）是一种用于训练人工神经网络的常用方法。它通过计算每一层的误差梯度并反向传播，以便更新网络中的权重和偏置值。该算法使得神经网络逐渐优化，以使其输出更接近于期望输出。

算法原理

误差反向传播算法的原理基于梯度下降法，其目标是最小化网络输出与期望输出之间的误差。通过计算误差对每个网络参数的偏导数，并根据梯度的反方向更新参数，使得误差逐渐减小。

公式推导

首先，我们定义神经网络的损失函数为均方误差（Mean Squared Error, MSE）。对于一个具有o个输出节点的网络，MSE的计算公式如下：

$$ L = \frac{1}{2} \sum_{i=1}^{o}(target_i – output_i)^2 $$

其中，$target_i$表示期望输出值，$output_i$表示网络的实际输出值。

为了使用误差反向传播算法更新网络参数，我们需要计算损失函数对于网络参数的偏导数。根据链式法则，我们可以将这个偏导数写作链式形式。

设第l层的神经元输出为$a^l$，第l+1层的神经元输入为$z^{l+1}$，第l+1层的神经元激活函数为$f$，则有：

$$ \frac{\partial L}{\partial z^{l+1}} = \frac{\partial L}{\partial a^{l+1}} \cdot \frac{\partial a^{l+1}}{\partial z^{l+1}} = \delta^{l+1} \cdot f'(z^{l+1}) $$

其中，$\delta^{l+1}$是第l+1层的误差信号（即$\frac{\partial L}{\partial a^{l+1}}$），$f'(z^{l+1})$是第l+1层激活函数的导数。

根据误差信号的定义，有：

$$ \delta^{l+1} = \frac{\partial L}{\partial a^{l+1}} = \sum_{i=1}^{o} \frac{\partial L}{\partial output_i} \cdot \frac{\partial output_i}{\partial a^{l+1}} = \sum_{i=1}^{o} (output_i – target_i) \cdot f'(z^{l+1}) $$

根据上述计算结果，我们可以得到输出层的误差信号。

接下来，我们可以继续计算隐藏层的误差信号。

设第l层的误差信号为$\delta^{l}$，第l层的神经元输入为$z^{l}$，则有：

$$ \delta^{l} = \frac{\partial L}{\partial a^{l}} = \frac{\partial L}{\partial z^{l}} \cdot \frac{\partial z^{l}}{\partial a^{l}} = \delta^{l+1} \cdot \frac{\partial z^{l}}{\partial a^{l}} = \delta^{l+1} \cdot W^{l} $$

其中，$W^{l}$是连接第l层和第l+1层的权重矩阵。

计算步骤

误差反向传播算法的计算步骤如下：

初始化网络权重和偏置值。
对于每一个训练样本，依次进行前向传播计算输出结果。
根据输出结果和期望输出计算输出层的误差信号$\delta^{o}$。
从输出层开始，依次计算每一层的误差信号$\delta^{l}$。
根据每一层的误差信号计算参数的偏导数，并更新参数。
重复步骤2-5，直到达到停止条件（如达到最大迭代次数或误差小于某一阈值）。

复杂Python代码示例

下面是一个用于解决二分类问题的简化的误差反向传播算法的Python代码示例。代码中使用了一个虚拟的数据集，并通过梯度下降法更新参数来训练网络。

import numpy as np

# 定义激活函数（sigmoid）
def sigmoid(x):
 return 1 / (1 + np.exp(-x))

# 定义激活函数的导数
def sigmoid_derivative(x):
 return sigmoid(x) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls (1 - sigmoid(x))

# 定义误差函数（MSE）
def mse_loss(y_true, y_pred):
 return np.mean((y_true - y_pred)**2)

# 定义网络类
class NeuralNetwork:
 def __init__(self, num_inputs, num_hidden, num_outputs):
 self.weights_hidden = np.random.rand(num_hidden, num_inputs)
 self.weights_output = np.random.rand(num_outputs, num_hidden)
 self.bias_hidden = np.random.rand(num_hidden, 1)
 self.bias_output = np.random.rand(num_outputs, 1)

 def forward(self, x):
 self.hidden_layer = sigmoid(np.dot(self.weights_hidden, x) + self.bias_hidden)
 self.output_layer = sigmoid(np.dot(self.weights_output, self.hidden_layer) + self.bias_output)
 return self.output_layer

 def backward(self, x, y_true, learning_rate):
 m = x.shape[1] # 训练样本数量

 # 计算输出层的误差信号
 delta_output = (self.output_layer - y_true) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls sigmoid_derivative(np.dot(self.weights_output, self.hidden_layer) + self.bias_output)

 # 计算隐藏层的误差信号
 delta_hidden = np.dot(self.weights_output.T, delta_output) artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls sigmoid_derivative(np.dot(self.weights_hidden, x) + self.bias_hidden)

 # 更新权重和偏置值
 self.weights_output -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.dot(delta_output, self.hidden_layer.T) / m
 self.bias_output -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.sum(delta_output, axis=1, keepdims=True) / m
 self.weights_hidden -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.dot(delta_hidden, x.T) / m
 self.bias_hidden -= learning_rate artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls np.sum(delta_hidden, axis=1, keepdims=True) / m

 def train(self, x, y, epochs, learning_rate):
 for epoch in range(epochs):
 y_pred = self.forward(x)
 loss = mse_loss(y, y_pred)

 if epoch % 100 == 0:
 print(f"Epoch {epoch}, Loss: {loss}")

 self.backward(x, y, learning_rate)

# 创建一个虚拟的数据集
X = np.array([[0, 0, 1, 1], [0, 1, 0, 1]])
y = np.array([[0, 1, 1, 0]])

# 创建一个具有2个输入节点、4个隐藏节点、1个输出节点的神经网络
network = NeuralNetwork(2, 4, 1)

# 训练神经网络
network.train(X, y, epochs=1000, learning_rate=0.1)

代码细节解释

sigmoid函数用于计算激活函数的值，sigmoid_derivative函数用于计算激活函数的导数。
mse_loss函数用于计算均方误差。
NeuralNetwork类初始化时随机生成权重和偏置值。
forward方法用于进行前向传播计算输出结果。
backward方法根据误差信号计算参数的偏导数，并更新参数。
train方法用于训练网络，包括前向传播、误差计算、反向传播和参数更新。
X和y分别为训练样本和对应的期望输出。

此代码示例通过梯度下降法和误差反向传播算法训练了一个简单的二分类神经网络，并使用虚拟数据集进行了演示。在实际应用中，我们可以根据具体问题的需求进行修改和扩展。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/823863/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Linux 下的 /proc 目录介绍

Linux 下的 /proc 目录介绍目录 * – Linux 下的 /proc 目录介绍 – + * 1、/proc 目录包含的文件及其作用 * 2、/…

人工智能 2023年6月27日
00109
Pysyft学习笔记

文章目录 1 隐私、分布式数据科学的基础工具 * 1.1 张量指针 1.2 使用张量指针 2 联邦学习简介 * 2.1 一个联邦学习的范例 3 高级远程执行工具 * 3.1 指向指…

人工智能 2023年6月23日
0085
python视频操作：下载、选取特定帧、批量导入ppt及硬字幕提取

本次主要记录一次组会的PPT分享，大略是寻找感兴趣的话题，在会上与大家共赏。寻找到youtube上青蛙刀圣1993的《用34分钟，解决困扰我多年的问题：基督，犹太，伊斯兰教的关系》…

人工智能 2023年5月25日
00107
【C】语言文件操作（二）

🙈个人主页：阿伟@t👉系列专栏：【C语言–大佬之路】🎈今日心语：越忙，越要沉住气！继【C】语言文件操作（一）中我们详细地介绍了文件的顺序读写等一系列函数，这篇文章相对上一章内…

人工智能 2023年6月29日
0069
美赛 6：相关性模型、回归模型（十大模型篇）

目录三、相关性模型（SPSS） 1.皮尔逊相关系数 2.皮尔逊相关系数假设检验 3.数据正态分布检验 4.斯皮尔曼相关系数四、回归模型（Stata） 1.多元线性回归分析 2….

人工智能 2023年7月14日
00256
【GNN】高被引图神经网络（GNN）全面综述论文

论文名称：A Comprehensive Survey on Graph Neural Networks论文下载：https://arxiv.org/abs/1901.00596论…

人工智能 2023年7月12日
0044
Java项目的程序里为什么老用注解？注解有哪些作用

注解和注释不同的是，注解会被 Java 编译器处理而非跳过。注解是在JDK5.0版本开始引入的，它可以在编译期使用预编译工具进行处理, 也可以在运行期使用 Java 反射机制进行…

人工智能 2023年6月27日
0072
Python实现朴素贝叶斯分类器

朴素贝叶斯分类器文章目录朴素贝叶斯分类器一、贝叶斯分类器是什么？ * 贝叶斯判定准则朴素贝叶斯分类器举个栗子二、相关代码 * 1.数据处理 2.生成朴素贝叶斯表（字典）…

人工智能 2023年7月5日
0094
独家 | 使用Python的LDA主题建模（附链接）

作者：Kamil Polak翻译：刘思婧校对：孙韬淳本文约2700字，建议阅读5分钟本文为大家介绍了主题建模的概念、LDA算法的原理，示例了如何使用Python建立一个基础的L…

人工智能 2023年6月2日
0063
pandas数据预处理(标准化&归一化、离散化/分箱/分桶、分类数据处理、时间类型数据处理、样本类别分布不均衡数据处理、数据抽样)

1. 数值型数据的处理 1.1 标准化&归一化数据标准化是一个常用的数据预处理操作，目的是处理不同规模和量纲的数据，使其缩放到相同的数据区间和范围，以减少规模、特征、分布…

人工智能 2023年6月30日
0088
【论文速读】强化学习与知识图谱构建交互式推荐系统

前言论文名称：Interactive Recommender System via Knowledge Graph-enhanced Reinforcement Learning…

人工智能 2023年6月1日
0073
Pandas-时间（一）-数据类型：Timestamp（“时间戳”类型）【创建：①pd.Timestamp()-＞Timestamp；②pd.to_datetime(单个数据)】

时刻数据代表时间点，是pandas的数据类型，是将值与时间点相关联的最基本类型的时间序列数据 from datetime import datetime import pandas…

人工智能 2023年7月7日
0072
AI： 2021 年人工智能前沿科技报告02(更新中……)

ML之RFM：金融风控-保险理赔案件客户细分之利用RFM模型筛选非优质客户(基于已赔案件/出险的客户)为承保部门提供参考及其代码实现利用RFM模型筛选非优质客户(基于已赔案件/出…

人工智能 2023年5月26日
0074
UNETR 论文精解

引言本文会结合论文UNETR: Transformers for 3D Medical Image Segmentation和代码深入讲解。阅读这篇文章之前最好了解UNET网络和…

人工智能 2023年6月25日
00101
“如何获取一篇论文的代码以及运行”相关教程

内容简介本书从只有二十行的引导扇区代码_出发，一步一步地向读者呈现一个操作系统框架的完成过程。书中不仅关注 _代码_本身，同时关注完成这些 _代码_的思路和过程。本书不同于其他…

人工智能 2023年7月27日
0067
知识图谱领域顶级学术会议列表

知识图谱领域顶级学术会议列表会议简称会议全称 ACL Association of Computational Linguistics EMNLP Empirical Meth…

人工智能 2023年6月1日
0092

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31