神经网络理解：前向传播与反向传播

2023年6月16日上午10:49 • 人工智能 • 阅读 74

文章目录

参考资料
神经网络
*
前向传播
–
- 1. 输入层->隐含层
- 2. 隐含层->输出层
反向传播
–

参考资料

神经网络基础: 反向传播推导与卷积公式

神经网络前向传播与反向传播

主要基于参考资料的学习整理。

神经网络

神经网络通俗地可以理解成一个函数近似器，它需要近似一个输入x到输出y的映射函数。我们所要训练的网络参数其实就是在拟合这个映射函数的未知量。神经网络的训练可以分为两个步骤：一个是前向传播，另一个是反向传播。

; 前向传播

神经网络前向传播从输入层到输出层：前向传播就是从输入层开始，经过一层层的Layer，不断计算每一层的神经网络得到的结果及通过激活函数的本层输出结果，最后得到输出的过程。

1. 输入层->隐含层

计算神经元 h 1 h1 h 1 的输入加权和：

n e t h 1 = w 1 ∗ i 1 + w 2 ∗ i 2 + b 1 ∗ 1 net_{h1}=w_1i_1+w_2i_2+b_1*1 n e t h 1 =w 1 ∗i 1 +w 2 ∗i 2 +b 1 ∗1

激活后的输出 :

o u t h 1 = 1 1 + e − n e t h 1 out_{h1}=\frac{1}{1+e^{-net_{h1}}}o u t h 1 =1 +e −n e t h 1 1

其余隐层节点同理。

2. 隐含层->输出层

计算输出神经元o 1 o1 o 1的值:
n e t o 1 = w 5 ∗ o u t h 1 + w 6 ∗ o u t h 2 + b 2 ∗ 1 net_{o1}=w_5out_{h1}+w_6out_{h2}+b_2*1 n e t o 1 =w 5 ∗o u t h 1 +w 6 ∗o u t h 2 +b 2 ∗1

o u t o 1 = 1 1 + e − n e t o 1 out_{o1}=\frac{1}{1+e^{-net_{o1}}}o u t o 1 =1 +e −n e t o 1 1
其余输出节点同理。

反向传播

前向传播计算出了输出值（也即预测值），就可以根据输出值与目标值的差别来计算损失loss。
反向传播就是根据损失函数loss来反方向地计算每一层的偏导数，从最后一层逐层向前去改变每一层的权重，也就是更新参数，核心就是损失函数对每一网络层的每一个参数求偏导的链式求导法则。

1. 计算总误差

首先，我们需要通过前向传播的输出o u t p u t output o u t p u t和真实样本t a r g e t target t a r g e t计算此时神经网络的损失

; 2. 隐藏层与输出层之间的权重更新

以权重 w 5 w_5 w 5 为例，对参数 w 5 w_5 w 5 求偏导可以看出 w 5 w_5 w 5 对整体误差产生的影响，总体误差对 w 5 w_5 w 5 求偏导的链式规则如下所示:

最后三者相乘，下面的任务就是进行梯度下降从而更新参数:

η \eta η 为 learning rate，其余权重同理。

3. 输入层与隐藏层之间的权重更新

以权重w 1 w1 w 1为例

∂ E total ∂ w 1 = ∂ E total ∂ o u t h 1 ∗ ∂ o u t h 1 ∂ n e t h 1 ∗ ∂ net h 1 ∂ w 1 \frac{\partial E_{\text {total }}}{\partial w_{1}}=\frac{\partial E_{\text {total }}}{\partial out_{h_1}} * \frac{\partial out_{h_1}}{\partial net_{h_1}} * \frac{\partial \text {net}{h_1}}{\partial w{1}}∂w 1 ∂E total =∂o u t h 1 ∂E total ∗∂n e t h 1 ∂o u t h 1 ∗∂w 1 ∂net h 1

计算方法与上述步骤一致

最后三者相乘，进行梯度下降从而更新参数:
神经网络理解：前向传播与反向传播

; 4. 梯度下降

神经网络就是通过不断的前向传播和反向传播不断调整神经网络的权重，最终到达预设的迭代次数或者对样本的学习已经到了比较好的程度后，就停止迭代，那么一个神经网络就训练好了。这就是神经网络的本质：通过计算误差、不断修正权重以拟合输入输出的映射函数曲线。

Original: https://blog.csdn.net/weixin_42301220/article/details/123915977
Author: CHH3213
Title: 神经网络理解：前向传播与反向传播

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/623543/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基本的回归模型

前言一般来说，一个完整的机器学习项目分为以下步骤：明确项目任务：回归/分类收集数据集并选择合适的特征。选择度量模型性能的指标。选择具体的模型并进行训练以优化模型。评估模…

人工智能 2023年6月17日
00101
激光SLAM框架总结

一、激光SLAM简介基于激光雷达的同时定位与地图构建技术（simultaneous localization and mapping， SLAM）以其准确测量障碍点的角度与距离、…

人工智能 2023年6月23日
0085
天池比赛——用户情感可视化分析

天池比赛——用户情感可视化分析目录天池比赛——用户情感可视化分析前言一、读取数据，查看基本情况并做数据预处理引入相关库读取数据，基础分析数据空值处理，数据映射对评论…

人工智能 2023年7月17日
0073
Dapr 证书过期了怎么办？别慌，有救！

Dapr 默认证书有效时间是1年，证书过期后就不能执行相关控制面和数据面的交互了，如下图： Dapr 支持使用 Dapr 控制平面、Sentry 服务（中央证书颁发机构 (CA)）…

人工智能 2023年6月4日
0084
Pandas DataFrame 数据选取和过滤

This would allow chaining operations like: For current alternatives see: 可以这样： Pandas 是 Py…

人工智能 2023年6月2日
0084
《数据挖掘基础》实验：Weka平台实现分类算法

实验目的进一步理解分类算法（决策树、贝叶斯），利用weka实现数据集的分类处理，学会调整模型参数，以图或树的形式给出挖掘结果，并解释规则的含义。实验要求随机选取数据集（UCI…

人工智能 2023年6月30日
0054
6张图！5G六大细分领域产业图谱

上回，小编为大家展出了正站在风口上的芯片产业图谱（点击文字可直接传送）。今日，小编继续为大家呈现 5G行业6个细分领域的相关图谱。它们分别是： 5G天线产业图谱、 5G供电系统…

人工智能 2023年6月1日
0091
python函数之csr_matrix

csr_matrix表示逐行（注意csr的r,row）压缩矩阵,类似地，也有个函数csc_matrix（c:column)表示逐列压缩。形式：csr_matrix( (data,…

人工智能 2023年7月5日
0074
Pytorch最全安装教程（一步到位）

目录概述安装一、安装Anaconda 二、安装CUDA（也可以不安装）（一）CUDA概述（二）安装三、安装pytorch （一）CPU版本（二）GPU版本概述 Py…

人工智能 2023年6月16日
00100
Python快速刷题网站——牛客网数据分析篇（十五）

👦👦一个帅气的boy，你可以叫我Love And Program🖱 ⌨个人主页：Love And Program的个人主页💖💖如果对你有帮助的话希望三连💨💨支持一下博主前言本文…

人工智能 2023年7月8日
0085
使用PCA压缩图像（python实现）

import numpy as np import matplotlib.pyplot as plt import pandas as pd from scipy.io impor…

人工智能 2023年6月16日
00146
CIFAR-100 top1 and top5 err statistics

datasetnetworkparamstop1 errtop5 errepoch(lr = 0.1)epoch(lr = 0.02)epoch(lr = 0.004)epoch(…

人工智能 2023年7月13日
0051
举个栗子~Tableau 技巧（226）：用分段条形图呈现数据占比

如果需要呈现一项工作的完成率，或者某一种产品销售额在所有产品销售额的占比，你会怎么做呢？真实业务场景中，类似的进度分析很常见，「举个栗子」分享过一些方法：快速制作标靶图（靶心图）…

人工智能 2023年7月16日
0049
矩阵秩的定义和相关结论汇总

秩的定义：对于矩阵，以下陈述为真。（如果，则用共轭转置替换下述转置） rank(A)=矩阵A经过行初等变换，所得行阶梯形矩阵的非零行数 rank(A)=矩阵A经过行初等变换，所得行…

人工智能 2023年6月30日
00103
TensorFlow安装教程

诸神缄默不语-个人CSDN博文目录 TensorFlow是学习深度学习时常用的Python神经网络框架，本文将介绍其部分版本在Linux系统使用pip进行安装的方法。（注：Tens…

人工智能 2023年7月26日
0046
NLP-基于机器学习的文本分类-垃圾邮件分类

目录 * – 一、文本分类的步骤 – 二、提取特征的经典方法 – 三、分类器方法 – + 1.朴素贝叶斯(Naive Bayesia…

人工智能 2023年5月28日
00141

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31