浅谈深度学习归一化加快模型收敛速度

2023年7月14日上午7:17 • 人工智能 • 阅读 86

在训练模型时，我们经常会对数据进行归一化，甚至在隐藏层中也加入归一化。这样做的主要目的是为了加快模型收敛速度。
假设特征在经过卷积层后没有经过归一化的数据如下图分布（xx表示数据点），用sigmoid函数作为激活函数。那么在不经过归一化的时候数据所在的分布会使sigmoid的函数值接近0，这样会导致出现梯度消失的情况。

假设在对经过卷积层的数据进行归一化后，数据分布如下图所示，分布会处在中间状态，sigmoid的函数值会取到比较大的值（相对于0）。这样便会加快模型的收敛速度。
浅谈深度学习归一化加快模型收敛速度

但是，我们一般并不是简单的对数据进行归一化，即让数据表现一个正态分布，如果简单地把数据进行标准化，那么就会改变原始数据的分布状态，这不利于神经网络学习原始数据的分布状态，所以在对数据进行标准化后（x-u/方差），会对标准化后的结果在进行处理。
假设标准化后的结果是x，那么再对x进行处理
z = γ * x + β
为什么要多加两个可学习的参数呢，如下图
左边为没有对x再进行处理，右边为对x再进行处理
对x再进行处理可以使x可贴近原始数据的分布，而不会单纯地让数据分布集中地处于中间那一部分。

另外，如果数据集中地处于中间那一部分，那么sigmoid中间那一部分也可以看成线性函数了，这样也弱化了加激活函数的作用。激活函数本身就是想增强网络的非线性能力。

以上处于个人理解，如果有错误欢迎指正。

Original: https://blog.csdn.net/weixin_45413024/article/details/122043591
Author: 菜就多练，不要多想
Title: 浅谈深度学习归一化加快模型收敛速度

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691563/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一欧元滤波器(OneEuroFilter)

在查阅人脸关键点防抖动相关资料时，留意到一篇2012发布的防止抖动滤波器—–一欧元滤波器论文：Casiez, G., Roussel, N., &…

人工智能 2023年6月16日
0048
NLP-D9-第一场大数据比赛D1&知识蒸馏&翻译论文&CATTI备考-第一套综合

，第一步是安装Spark和Spark 。您可以从官方网站下载Spark和Spark 的二进制文件，也可以使用Maven或SBT等构建工具安装它们。安装完成后，您可以使用Spark…

人工智能 2023年5月28日
0059
解决训练难题，1000层的Transformer来了，训练代码很快公开

1000 层的 Transformer，深得吓人。昨日出炉的论文《DeepNet: Scaling Transformers to 1,000 Layers》在研究社区引起了热议…

人工智能 2023年5月30日
0086
python线性回归实现(简易版+原理版)

线性回归模型样例: 假设1：影响房价的关键因素是卧室个数和居住面积等因素，即为x1, x2, x3假设2：成交价的关键因素的加权和y=w1x1 + w2x2 +w3x3 +b这里我…

人工智能 2023年6月15日
0047
Python3.7最简便的方式解决下载dlib和face_recognition的问题

我下载dlib包和face_recognition包是为了完成我的《Opencv项目实战: 07 人脸识别和考勤系统》，那么这一篇将作为一个前篇，完成项目包的搭建。本项目链接：(…

人工智能 2023年7月20日
0039
R语言 xlsx 读写Excel数据

【基础】简单读取excel文件数据【基础】简单写入数据到excel文件【进阶】随心所欲读取excel中的各种信息【进阶】随心所欲将数据写入excel文件感谢Adrian A. Dr…

人工智能 2023年7月18日
0037
OpenCV|练习笔记

配置：需要 pip install opencv-contrib-pythonpip install numpy在pycharm中配置好环境读入 cv2.inread() 输出 …

人工智能 2023年7月20日
0040
同时安装 Tensorflow&Pytorch

Pytorch 与 Tensorflow 可一同安装，但需要注意版本对应问题，找到一个两者都能用的CUDA号，如：CUAD 11.0; Pytorch v1.7.1; tensor…

人工智能 2023年7月22日
0057
操作系统学习笔记8 |段页式内存管理

多进程图像中的CPU管理已经告一段落，接下来要介绍另一大方面—— 内存管理。首先我们也来看看内存是如何被使用起来的。最后介绍段页式内存管理的实现过程。参考资料：课程：哈工大操作…

人工智能 2023年6月4日
0074
【推荐系统】最全的推荐系统数据集，包括基于社交网络的推荐数据集

1.电影推荐数据集（社交数据集） *FilmTrust 该数据集是2011年6月从FilmTrust网站上抓取的一个小型数据集。包含用户对电影的评分信息和用户间的社交信息。数据量较…

人工智能 2023年7月16日
0057
Opengl入门基础-基础知识

通过之前的教程，我们已经拥有了开发环境，但是在真正开发程序之前，我们首先了解下Opengl的基本概念。 Opengl是什么？通常网上会说Opengl是一种规范，一种接口，但是这种…

人工智能 2023年6月19日
0068
Python-pandas返回重复数据的index

在处理数据的时候,会出先相同的列或者行,我们需要有时候需要对其中一列或者其中一行进行操作因为数据清洗的过程会碰到多种情况下面是我碰到的一种情况既有合并的又有空列使用pandas进…

人工智能 2023年7月8日
0050
回归算法及应用

目录 1.相关与回归 1.1 有监督的机器学习过程 1.2 分类与回归 1.3 回归的涵义 1.4 案例分析 1.5 回归分析与相关分析 1.6 相关分析 1.7 实战 1.8 小…

人工智能 2023年6月17日
0088
（门控卷积实现）DeepFillv2（图像修复）：Free-Form Image Inpainting with Gated Convolution，pytroch代码实现

deepfillv2的动机结合了几乎所有的目前先进的图像修复技术，基于部分卷积提出了门控卷积，结合了CA中的注意力机制，根据 Adversarial Edge图像修复中的边缘…

人工智能 2023年7月13日
00126
DataFrame 行列数据的筛选

一、对DataFrame的认知DataFrame的本质是行(index)列(column)索引+多列数据。 DataFrame默认索引是序号（0，1，2…），可以理解成…

人工智能 2023年6月2日
0056
课堂练习12 继承与多态

; 第1关：定义类Animal 任务描述本关任务：定义类Aniaml并测试。相关知识为了完成本关任务，你需要掌握：属性方法的定义获取数组的长度Python中的属性方法是把一个方…

人工智能 2023年6月27日
0057

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

浅谈深度学习归一化加快模型收敛速度

大家都在看