深度学习中的批归一化|深度学习

2023年5月28日下午12:50 • 大数据 • 阅读 78

深度学习中的批归一化|深度学习

在进行神经网络训练的时候，除了一些优化算法外，还有其它的一些优化技术，这些技术并不是具体的算法，而是一些通用的技巧，其中批归一化就是常用的一个技巧。

批归一化是loffe等在2015年提出来的优化神经网络训练的方法，自提出就受到了广泛关注。批归一化和普通的数据标准化类似，是将分散的数据统一的一种做法。批归一化所解决的问题实际上是对数据分布的调整。在神经网络训练过程中，尤其是深度神经网络训练过程中，在初始训练阶段，隐藏层中的神经元可能会变成”饱和”状态，导致更新缓慢，这是对于隐藏层使用批归一化来解决这个问题。
“饱和”状态是指数据经过神经网络的激活函数之后，函数的输出接近函数的极值(一般是+1和-1),之后反向传播进行梯度计算和更新网络参数时，得出的更新量将会很小(因为激活函数极值处的梯度值很小)，网络参数无法得到有效地更新，这种影响会随着庞大的神经网络结果不断累积，最后导致神经网络训练的失败。批归一化方法每次在数据进入激活函数之前，对数据进行”批归一化”处理，让数据分布在激活函数的敏感区域，不至于接近极值，这样神经网络的训练就可以正常进行。
具体的做法为：先把数据分批进行随机梯度下降，然后在前向传播的过程中对每一层进行标准化的处理。因此，批归一化是在全连接层到激活函数之间的步骤之间，假如神经元写成φ ( X ⋅ W + b ) \varphi (X \cdot W+b)φ(X ⋅W +b )，其中φ \varphi φ 是激活函数，那么批归一化处理就是在计算X·W之后，在经过激活函数之前进行，通过批归一化的处理，数据分布的该表使得激活函数非线性化的效果更加显著。批归一化处理可以写成下面的几个公式：
μ B = 1 m ⋅ ∑ i = 1 m x i σ b 2 = 1 m ∑ i = 1 m ( x i − μ B ) x ^ i = x i − μ B σ B 2 + ε x o u t i = γ x ^ i + β \mu_B=\frac{1}{m} \cdot \sum_{i=1}^mx^i \ \sigma^2_b=\frac{1}{m}\sum_{i=1}^m(x^i-\mu_B) \ \hat{x}^i=\frac{x^i-\mu_B}{\sqrt{\sigma_B^2+\varepsilon}} \ x_{out}^i=\gamma \hat{x}^i+\beta μB =m 1 ⋅i =1 ∑m x i σb 2 =m 1 i =1 ∑m (x i −μB )x ^i =σB 2 +εx i −μB x o u t i =γx ^i +β
其中，前三个式子完成对数据的批归一化操作，ε \varepsilon ε 是小常数，防止分母出现0。最后一个式子其实是让神经网络自己学习如何对待标准化操作，γ 和 β \gamma 和 \beta γ和β是神经网络学习得出的参数，用于对数据集尽心重新缩放和移位，加入神经网络觉得批归一化操作没有太大的作用，就会使用最后的式子对批归一化进行一定的抵消，x o u t i x_{out}^i x o u t i 就是算法的最后输出。

Original: https://blog.csdn.net/qq_48081868/article/details/121663429
Author: Wumbuk
Title: 深度学习中的批归一化|深度学习

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/531616/

转载文章受原作者版权保护。转载请注明原作者出处！

大数据

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

flink+kafka的端到端一致性

上一篇中提到flink+kafka如何做到任务级顺序保证，而端到端一致性即为实现用户数据目标端与源端的准确一致，当源端数据发生更改时，保证目标端及时、正确、持久的写入更改数据。为实…

大数据 2023年6月3日
0073
数仓Hive和分布式计算引擎Spark多整合方式实战和调优方向

文章目录概述 Spark on Hive Hive on Spark * 概述编译Spark源码配置调优思路 * 编程方向 – 分组聚合优化 join优化数据…

大数据 2023年11月12日
0043
【转载】大数据OLAP系统–开源组件方案对比

开源大数据OLAP组件，可以分为MOLAP和ROLAP两类。ROLAP中又可细分为MPP数据库和SQL引擎两类。对于SQL引擎又可以再细分为基于MPP架构的SQL引擎和基于通用计算…

大数据 2023年6月3日
0055
docker方式安装FastDFS

通过docker方式安装FastDFS 1、首先拉取fastdfs镜像必须在能联网的服务器上，如果需要在离线环境下安装的话，就先从能联网的服务器上拉取，然后通过docker s…

大数据 2023年5月29日
0071
一面数据： Hadoop 迁移云上架构设计与实践

背景一面数据创立于 2014 年，是一家领先的数据智能解决方案提供商，通过解读来自电商平台和社交媒体渠道的海量数据，提供实时、全面的数据洞察。长期服务全球快消巨头（宝洁、联合利华…

大数据 2023年6月3日
00124
qt实现sqlite数据库文件与csv文件相互转换

一、使用场景假设一：目前有一个项目记录数据是采用sqlite文件存储的，数据量很大，里面的记录数据客户需要将其导入到execl中进行报表编辑及汇报工作；假设二：用户手里有点表配…

大数据 2023年11月10日
0042
13.Redis系列之布隆过滤器

大数据 2023年11月16日
0050
【转载】谈谈Unicode编码，简要解释UCS、UTF、BMP、BOM等名词

谈谈Unicode 编码，简要解释UCS 、UTF 、BMP 、BOM 等名词这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念，增进知识，类…

大数据 2023年6月3日
0073
Redis中什么是热Key问题？如何解决热Key问题？

大数据 2023年11月16日
0047
Hadoop06【API操作】

windows环境搭建 1.安装hadoop 将hadoop在Linux中的安装文件解压缩一份。并将此bin目录中的文件覆盖掉解压缩文件中的bin目录。链接：https://…

大数据 2023年5月26日
0090
android 读取本地数据库db文件（Android sqlite，工作感悟

if (!mRootPath.endsWith(“/”)) mRootPath += “/”; return mRootPath; …

大数据 2023年11月11日
0033
MyLibrary –Qt + sqlite 图书馆管理系统

MyLibrary 介绍基于Sqlite 和 Qt 技术实现电子图书馆的智慧综合管理参考资料：https://blog.csdn.net/lishichengyan/artic…

大数据 2023年11月12日
0036
NLP经典论文：Word2vec、CBOW、Skip-gram 笔记

NLP经典论文：Word2vec、CBOW、Skip-gram 笔记论文介绍模型结构 * CBOW模型 – 整体模型 + 输入输出整体流程整体维度输入层与…

大数据 2023年5月28日
0064
Hive metastore 使用达梦数据库存储元数据

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

大数据 2023年11月12日
0061
JVM中的Stack和Frame

JVM执行Java程序时需要装载各种数据，比如类型信息（Class）、类型实例（Instance）、常量数据（Constant）、本地变量等。不同的数据存放在不同的内存区中，这些数…

大数据 2023年5月28日
0088
Linux网络基础

一、网络协议和管理 1 网络基础 1.1 网络概念计算机网络是一组计算机或网络设备通过有形的电缆或无线等无形介质，按照一定的规则连接起来，进行通信的集合。 [En] Comput…

大数据 2023年5月27日
0067

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习中的批归一化|深度学习

大家都在看