BP神经网络– 基本模型

2023年6月15日下午6:28 • Java • 阅读 86

BP 神经网络中的 BP 为 Back Propagation 的简写，最早它是由Rumelhart、McCelland等科学家于 1986 年提出来的，Rumelhart 并在Nature 上发表了一篇非常著名的文章《Learning representations by back-propagating errors》。随着时代的迁移，BP神经网络理论不断的得到改进、更新，现在无疑已成为了应用最为广泛的神经网络模型之一。让我们一起来探索下 BP神经网络最初的基本模型和概念！

从神经网络的生物模型说起

我们知道人大脑信息的传递、对外界刺激产生反应都由神经元控制的，人脑就是由上百亿个的这样神经元构成。这些神经元之间并不孤立而且联系很密切，每个神经元平均与几千个神经元相连接，因此构成了人脑的神经网络。刺激在神经网络中的传播是遵循一定的规则的，一个神经元并非每次接到其他神经传递过来的刺激都产生反应。它首先会将与其相邻的神经元传来的刺激进行积累，到一定的时候产生自己的刺激将其传递给一些与它相邻的神经元。这样工作的百亿个的神经元构成了人脑对外界进行的反应。而人脑对外界刺激的学习的机制就是通过调节这些神经元之间联系以及其强度。当然，实际上以上说的是对人脑真正神经工作的一种简化的生物模型，利用这种简化的生物模型可以将它推广至机器学习中来，并把它描述成人工神经网络。BP神经网络就是其中的一种，来看看具体对神经元的分析。

图1 神经网络中神经元示意图

神经元的积累的刺激是由其他神经元传递过来的刺激量和对应的权重之和，用 Xj表示这种积累， Y i 表示某个神经元传递过来的刺激量， W i 表示链接某个神经元刺激的权重，得到公式：

Xj = (y 1 * W1)+(y2 * W2)+…+(yi * Wi)+…+ (yn * Wn)

而当 Xj完成积累后，完成积累的神经元本身对周围的一些神经元传播刺激，将其表示为 yj 得到如下所示：

yj = f（Xj）

神经元根据积累后 Xj的结果进行处理后，对外传递刺激 yj 。用 f 函数映射来表示这种处理，将它称之为 激活函数。

BP神经网络的构成

分析完单个的神经元后，再来看看它们组成网络后的情形，用图形来说明是最直观的方法，如图2所示：

图2 BP神经网络示意图

第一区域的来说，它们相当于外界的刺激，是刺激的来源并且将刺激传递给神经元，因此把第一区域命名为 输入层。第二区域，表示神经元相互之间传递刺激相当于人脑里面，因此把第二区命名为 隐藏层。第三区域，表示神经元经过多层次相互传递后对外界的反应，因此把第三区域命名为 输出层。

简单的描述就是，输入层将刺激传递给隐藏层，隐藏层通过神经元之间联系的强度（权重）和传递规则（激活函数）将刺激传到输出层，输出层整理隐藏层处理的后的刺激产生最终结果。若有正确的结果，那么将正确的结果和产生的结果进行比较，得到误差，再逆推对神经网中的链接权重进行反馈修正，从而来完成学习的过程。这就是BP神经网的反馈机制，也正是BP（Back Propagation）名字的来源： 运用向后反馈的学习机制，来修正神经网中的权重，最终达到输出正确结果的目的！

BP神经网络的数学推导

从数学上对BP神经网络模型进行分析，本文第一部分神经网的生物模型中可以得到关于BP神经网络的第一个 公式(1)：

对于神经元本身的输出的激活函数，一般来说选取 Sigmoid 函数，那么可以得到第二个 公式（2）：

通过以上两个公式，可以分析出来BP神经网络中输出结果的计算过程。每个神经元收到刺激 yi 然后加权积累（权重 W ji ）完成后产生 xj，再通过激活函数产生刺激 y j ，向下一层与它相连的神经元传递，依次类推最终输出结果。

我们再来分析如何利用向后反馈机制来修正神经元权重 Wji，这一部分数学推导需要运用到多元微分的数学内容。要修正 Wji就需要得到误差量。具体来看，首先用 dj 来表示真实的正确结果，并且设误差为 E ，那么 （ yj – dj ）对应的就是 E 对于 yj 的微分增量，即 y j 减去 （ yj – dj ）后就能得到正确值，得到 公式（3）：

所以最终得到的的误差量的值为：

以上公式需要注意下标：最后一个是 yi，前面的都是 yj。推到这里可以算是完成了运用神经网络的输出值 yj 和正确值 dj 对最后一层隐藏层 W ji的修正，那么对其他隐藏层呢？接着往下看。

这样所有的误差量的都可以同理推导完成！

最后一步修正 Wji ，就是加上下面变量了，设置一个 l （0 到 1 之间）学习率。

至此，BP神经网络反馈部分的数学推导算完成了，可以在自己的草稿纸上画画~

参考文献

Learning representations by back-propagating errors David E.Rumelhart,Geoffrey E.Hinton,Ronald J Williams*1986

An introduction to neural networks

Original: https://www.cnblogs.com/jzhlin/archive/2012/07/28/bp.html
Author: Java研究者
Title: BP神经网络– 基本模型

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/615543/

转载文章受原作者版权保护。转载请注明原作者出处！

Java

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Java分享客栈】一文搞定CompletableFuture并行处理，成倍缩短查询时间。

前言工作中你可能会遇到很多这样的场景，一个接口，要从其他几个service调用查询方法，分别获取到需要的值之后再封装数据返回。还可能在微服务中遇到类似的情况，某个服务的接口，要…

Java 2023年6月9日
0093
老徐和阿珍的故事：缓存穿透、缓存击穿、缓存雪崩、缓存热点，傻傻分不清楚

人物背景：老徐，男，本名徐福贵，从事Java相关研发工作多年，职场老油条，摸鱼小能手，虽然岁数不大但长的比较着急，人称老徐。据说之前炒某币败光了所有家产，甚至现在还有欠债。阿珍，女…

Java 2023年6月7日
0087
「免费开源」基于Vue和Quasar的前端SPA项目crudapi后台管理系统实战之数据库逆向（十二）

基于Vue和Quasar的前端SPA项目实战之数据库逆向（十二）回顾通过之前文章基于Vue和Quasar的前端SPA项目实战之动态表单（五）的介绍，实现了动态表单功能。如果是全…

Java 2023年6月6日
00150
Java设计模式13：责任链模式

前言来菜鸟这个大家庭10个月了，总得来说比较融入了环境，同时在忙碌的工作中也深感技术积累不够，在优秀的人身边工作必须更加花时间去提升自己的技术能力、技术视野，所以开一个系列文章，…

Java 2023年5月29日
00106
WebBrowser 当前线程不在单线程单元中，因此无法实例化 ActiveX 控件

使用多线程，在Form中实例化WebBrowser时，就会报异常我用下面方法解决： 1、在方法块外包一个线程 2、线程加入STA Original: https://www.cn…

Java 2023年5月30日
00128
优雅创建List或者Map的方式

优雅创建List和Map的方式 List 创建空List： Collections.emptyList();创建单个元素的List： Collections.singletonLi…

Java 2023年6月14日
0093
聊一聊过滤器与拦截器

过滤器 Filter 面试官：用过过滤器吧，介绍一下过滤器。John同学（心中窃喜）：用过，我经常用它来净化水 😁… 面试官：今天的面试到此结束，回去等通知吧。John…

Java 2023年6月9日
0063
黑马头条–延迟任务精准发布文章

1.添加任务 1.1.每次创建文章，就添加到任务中去文章提交中调用添加任务方法代码 @Override @Async public void addNewsToTask(Int…

Java 2023年6月9日
0089
Linux常用性能诊断命令详解

top top命令动态地监视进程活动与系统负载等信息。使用示例： top 效果如下图：以上命令输出视图中分为两个区域，一个统计信息区，一个进程信息区。统计信息区：第一行信息…

Java 2023年6月7日
0057
多态，内部类，基本API

day03-多态 ,内部类,常用API 今日目标多态内部类 *常用API 1 多态 1.1 面向对象三大特征 ? 封装 , 继承 , 多态 1.2 什么是多态 ? 一个对象在不…

Java 2023年6月13日
0066
反射、反射机制、类加载、Class类专题复习

一、反射概念 1.反射机制允许程序在执行期借助于ReflectionAPI取得任何类的内部信息(比如成员变量，构造器，成员方法等等)，并能操作对象的属性及方法。反射在设计模式和框架…

Java 2023年6月8日
0080
【Java面试】面试自閟了！工作5年的小伙伴今天面试被吊打问我，并行和并发有什么区别？

“并行和并发有什么区别？”关于这个问题，很多工作5年以上的同学都回答不出来。或者说，自己有一定的理解，但是不知道怎么表达。大家好，我是Mic，一个工作了14…

Java 2023年6月16日
0087
记录一下对jdk8后的接口的一些理解

对于jdk8后的接口，接口中加入了可以定义默认方法和静态方法。为什么要这样设计呢？是为了在给接口扩展方法的时候，不会影响已经实现了该接口的类加入默认方法可以解决：在添加方法的…

Java 2023年6月15日
0056
SAP S4HANA 2021 Fully-Activated Appliance 虚拟机版分享

该版本内置了四个Client： 1、000：SAP初始Client，原则上不能动； 2、100：只激活了US/DE两套BP，带大量Demo数据，可做数据参考； 3、200：复制Cl…

Java 2023年5月30日
0089
JIRA对接钉钉群机器人-实现任务的自定义格式指派通知

一、前提 Jira Software、钉钉群、RESTful服务、LDAP服务二、流程图三、对接步骤 1、创建项目群，把相关人员拉入群 2、钉钉群的智能群助手里添加自定义机器人…

Java 2023年6月5日
00121
Java的虚拟线程（协程）特性开启预览阶段，多线程开发的难度将大大降低

高并发、多线程一直是 Java编程中的难点，也是面试题中的要点。 Java开发者也一直在尝试使用多线程来解决应用服务器的并发问题。但是多线程并不容易，为此一个新的技术出现了，这就是…

Java 2023年5月29日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

BP神经网络– 基本模型

从神经网络的生物模型说起

BP神经网络的构成

BP神经网络的数学推导

参考文献

大家都在看