pytorch的归一化层

2023年7月23日上午3:22 • 人工智能 • 阅读 59

原理

归一化公式：
y = x − E [ x ] V a r [ x ] + ϵ ∗ γ + β y=\frac{x-E[x]}{\sqrt{Var[x]+\epsilon}}*\gamma + \beta y =V a r [x ]+ϵx −E [x ]∗γ+β

其中：

E [ x ] E[x]E [x ] 是向量x x x 的均值
V a r [ x ] Var[x]V a r [x ] 是向量x x x 的方差
ϵ \epsilon ϵ 常数，通常等于0.00001 0.00001 0 .0 0 0 0 1，防止分母为 0
γ \gamma γ 用于仿射变换
β \beta β 用于仿射变换

本文介绍的 4 种归一化主要是针对的维度不同，例如 BatchNorm 是对所有 banch 的单个通道归一化，每个通道的归一化独立，而 GroupNorm 是一个 banch 下的通道分组归一化，不受 banch size 的影响，如下图：

; 1 BatchNorm

BN 是对所有 banch 的单个通道做归一化，每个通道都分别做一次。


torch.nn.BatchNorm2d(num_features, eps=1e-5, momentum=0.1,\
                     affine=True, track_running_stats=True)

成员变量：

num_features：通道数。
eps：常数ϵ \epsilon ϵ。
momentum：动量参数，用来控制 running_mean 和 running_var 的更新，更新方法：M n e w = ( 1 − m ) ∗ M o l d + m ∗ m e a n M_{new}=(1-m)M_{old}+mmean M n e w =(1 −m )∗M o l d +m ∗m e a n，其中，M n e w M_{new}M n e w 是最新的 running_mean，M o l d M_{old}M o l d 是上一次的 running_mean，m e a n mean m e a n 是当前批数据的均值。
affine：仿射变换的开关
如果 affine=False，则γ = 1 \gamma=1 γ=1、β = 0 \beta=0 β=0，且不能学习；（对应weight、bias变量）
如果 affine=True，则γ \gamma γ、β \beta β 可以学习；
training：训练状态或测试状态，两种状态下运行逻辑不通。
track_running_stats：如果为 True，则统计跟踪 batch 的个数，记录在 num_batches_tracked 中。
num_btaches_tracked：跟踪 batch 的个数。

trainning 和 tracking_running_stats 有 4 种组合：

trainningtracking_running_stats说明TrueTrue正常的训练过程，跟踪整个训练过程的 banch 特性TrueFalse不跟踪训练过程的 banch 特性，只计算当前的 banch 统计特性FalseTrue使用之前训练好的 running_mean、running_var，且不会更新FalseFalse（一般不采用）只计算当前特征

更新过程：

running_mean、running_var 是在 forward 过程中更新的，记录在 buffer 中。（反向传播部影响）
γ \gamma γ、β \beta β 是在反向传播中学习得到的。
model.eval() 可以固定住 running_mean、running_var。

2 GroupNorm

torch.nn.GroupNorm(num_groups, num_channels, eps=1e-5, affine=True)

3 InstanceNorm

torch.nn.InstanceNorm2d(num_features, eps=1e-5, momentum=0.1, affine=False, track_running_stats=False)

4 LayerNorm

torch.nn.LayerNorm(normalized_shape, eps=1e-5, elementwise_affine=True)

参考上面的原理图，LayerNorm 是对一个 banch 的所有通道做归一化，如果输入的 tensor 维度为 [ 4 , 6 , 3 , 3 ] [4,6,3,3][4 ,6 ,3 ,3 ]，那么函数的传参 normalized_shape 就是 [ 6 , 3 , 3 ] [6,3,3][6 ,3 ,3 ]。

Original: https://blog.csdn.net/qq_33236581/article/details/124016573
Author: Rareay
Title: pytorch的归一化层

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/710005/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

信号处理-基于希尔伯特解调（包络谱）的轴承故障诊断实战，通过python代码实现超详细讲解

希尔伯特解调（包络谱）python代码实战及详细讲解，在CWRU数据上验证 * – 1、数据介绍 – 2、加载CWRU内圈故障数据 – 3、希尔…

人工智能 2023年7月4日
0051
Python数据分析高薪实战第十一天 AI落地实战票房预测

28 AI 落地实战：训练通用电影票房预测模型近十年，电影行业在世界范围内都取得了蓬勃的发展，越来越多的资金和人都源源不断地流入到这个行业，但对于电影投资人来说，风险和收益也是并…

人工智能 2023年6月19日
0088
基于WEB的网上购物系统的设计与实现（附：源码论文 sql文件）

摘要随着计算机网络技术的飞速发展和人们生活节奏的不断加快，电子商务技术已经逐渐融入了人们的日常生活当中，网上商城作为电子商务最普遍的一种形式，已被大众逐渐接受。因此开发一个网上…

人工智能 2023年7月31日
0056
爱了爱了，20个好用到爆的Python函数

大家好，今天分享20个日常工作中必不可少的 Python函数，这些函数平时看到的不多，但是它们使用起来倒是非常的方便，它们可以大幅度地提高工作效率。内容较长，欢迎收藏学习，喜欢点…

人工智能 2023年7月8日
0050
机器学习作业之波士顿房价（boston）数据分析与绘图（注释我都写了这么多，我不信你还看不懂？）

目录一、前言二、简单介绍头文件 * 1、sklearn头文件 – 意外 2、其他头文件三、题目理解 * 1、题目的简单介绍 2、属性标签 3、降维比喻四、代码 …

人工智能 2023年7月15日
00113
超越前作，实现动漫风格迁移——AnimeGANv2

前言之前一直在研究如何将图像动漫化，尝试了阿里云api和百度api，效果都不尽如人意。结果发现了一个宝藏github项目——AnimeGANv2，能够将现实世界场景照片进行动漫风…

人工智能 2023年6月24日
0079
安装MMdetection3D和MinkowskiEngine

MMdetection3D更新了,只好再次安装,由于CUDA,cuDNN,PyTorch以前已经安装了,这次就不需要安装了,只需要安装MMdetection3D就行了. 安装MMC…

人工智能 2023年6月4日
0074
【云驻共创】华为云IoT数据分析流程实操

文章目录一、数据分析的发展 * 1.数据分析概念 – 1.1 数据分析的背景 1.2 数据分析的目的 1.3数据分析的定义 2.物联网数据分析概念 3.华为云IoT数…

人工智能 2023年6月11日
00112
猿创征文｜【Python数据科学快速入门系列 | 05】常用科学计算函数

这是机器未来的第44篇文章原文首发地址：https://blog.csdn.net/RobotFutures/article/details/126615267 文章目录 1. …

人工智能 2023年7月25日
0069
autoware.auto编译与测试(含官方demo问题解决)

安装docker 本文参考菜鸟教程关于docker的安装，详见（https://www.runoob.com/docker/ubuntu-docker-install.html）。…

人工智能 2023年6月2日
0073
【OpenCV 例程200篇】61. 导向滤波（Guided filter）

【OpenCV 例程200篇】61. 导向滤波（Guided filter）欢迎关注『OpenCV 例程200篇』系列，持续更新中欢迎关注『Python小白的OpenCV学习课…

人工智能 2023年5月26日
0074
MediaPipe实现手指关键点检测及追踪，人脸识别及追踪

OpenCV 是一个用于计算机视觉应用程序的库。在 OpenCV 的帮助下，我们可以构建大量实时运行更好的应用程序。主要用于图像和视频处理。可以在此处获取有关 OpenCV 的更…

人工智能 2023年5月26日
00135
这4款数据自动化探索 Python 神器，解决绝大多数的数据分析问题

探索性数据分析是一种非常重要的数据探索技术，用于了解数据的各个方面，这是执行任何机器学习或深度学习任务之前最重要的步骤之一。背景在任何机器学习项目的生命周期中，我们在数据分析、…

人工智能 2023年6月11日
0091
中科院韩先培：预训练模型怎样成为下一代知识图谱

【专栏：研究思路】随着大规模预训练模型的快速发展，许多研究者都在期待，模型能够将通用的知识抽取到通用的知识库/知识图谱中，为构建新的AI节省开发的时间和精力，让研究者能够更加专注…

人工智能 2023年6月1日
0083
mmcv指定版本在win10/ubuntu下配置过程

前言：-我要跑的代码要求mmcv版本在1.1.4-1.3.0之间，但是由于mmcv开发者最开始没打算支持win，win版本的mmcv只有1.1.3-1.1.5之间，（下载链接：ht…

人工智能 2023年7月22日
0098
深度学习实战——基于pytorch写的一个猫狗分类的模型——学习总结

写在前面本学习总结主要目的 1.怕以后忘记，到时候翻来看看，2.梳理一下项目过程，便于工业化生产（哈哈）3.敲一遍代码加深记忆4.帮助他人，方便入门同学能够容易入门本过程主要设…

人工智能 2023年7月2日
0074

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch的归一化层

原理

; 1 BatchNorm

2 GroupNorm

3 InstanceNorm

4 LayerNorm

大家都在看