神经网络定点量化

2023年7月14日上午11:33 • 人工智能 • 阅读 82

目的：

加速计算（特别是移动端上）
减少内存/显存占用（特别是移动端上）
减少功耗（读取内存和计算都会耗电）

把某个tensor或者某个channel的这组float32, 用int8来表示，就是量化。

这组float32的上下界，可以取他们的min和max，也可以moving average，也可以去中间99%的那部分。。。越界的就用量化为0或者255。

公式：

(r实数-0) / (q整数-Z整数）= S = (r实数max-r实数min) / (q整数max-q整数min) = (r实数max-r实数min) / 255

S为缩放稀疏，Z为”Zero-Point”，其实Z就是真实浮点值0映射到整数时对应的值，无论是在图像中还是NLP中都会有用0做padding值来补全的，映射到整数后，也应该有这样一个值的存在，这个值就是Z。在这里S和Z可以称为量化参数，对于每个权重矩阵和每个激活数组都有一对这样的值。

Linear层和卷积的量化：

神经网络量化入门–基本原理 – 知乎 (zhihu.com)

累加用的是INT16或者INT32:

Arithmetic in the quantized model is done using vectorized INT8 instructions. Accumulation is typically done with INT16 or INT32 to avoid overflow. This higher precision value is scaled back to INT8 if the next layer is quantized or converted to FP32 for output.

PyTorch的Dynamic Quantization

用户指定量化哪些层；这些层的权重全被量化成int8，activation在输入时量化成int8，计算完成后再反量化成float32; 每个batch的每层都要量化一次（所以叫做Dynamic量化）；

PyTorch的Static Quantization

权重和activation全部被量化成int8；层与层之间不再转成float32；因此速度超快；

模型权重中，每层的数据分布，在inference阶段是固定的，所以可以一次性统计分布并量化（先得到S和Z，再量化）

activation，每个batch都是不一样的，所以要先做calibration，即采样上千个batch，经过float32神经网络，得到每个激活tensor(或激活channel)的数据分布，最后计算好S和Z，最最后再量化；

以上两者都属于Post Training Quantization

Quantization Aware Training

Quantization aware training 量化背后的技术——Quantization and Training of Neural Networks for Efficient Integer-Arithmetic-Only Inference – 微笑sun – 博客园 (cnblogs.com)

Original: https://blog.csdn.net/smartcat2010/article/details/122913849
Author: smartcat2010
Title: 神经网络定点量化

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/691968/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python利用opencv进行相机标定获取参数，并根据畸变参数修正图像附有全部代码（流畅无痛版）

python利用opencv进行相机标定获取参数，并根据畸变参数修正图像附有全部代码一、前言今天的低价单孔摄像机(照相机)会给图像带来很多畸变。畸变主要有两种:径向畸变和切想畸…

人工智能 2023年7月5日
0062
Python selenium webdriver 基本使用

系列文章目录 selenium webdriver 的常用示例文章目录系列文章目录 * selenium webdriver 的常用示例前言一、Pip安装&创建Bo…

人工智能 2023年7月18日
0078
VMware导入vmdk格式的文件踩了一堆坑~~~

嗨喽! 大家好，我是”流水不争先，争得滔滔不绝”的翀，18双非本科生一枚，正在努力！欢迎大家来交流学习，一起学习数据分析，希望我们一起好好学习，天天向上，目…

人工智能 2023年6月25日
0084
多智能体强化学习之MAPPO理论解读

本文主要是结合文章Joint Optimization of Handover Control and Power Allocation Based on Multi-Agent …

人工智能 2023年7月4日
0064
【pandas】空数据处理

目录 1、判断空值 .isna() 2、空值删除 .dropna() 3、空值替换 .dropna() 数据清洗是对一些没有用的数据进行处理的过程。很多数据集存在数据缺失、数据格…

人工智能 2023年7月15日
0063
SpringBoot集成Redis实现缓存——基于SpringBoot和Vue的后台管理系统项目系列博客（二十）

系列文章目录系统功能演示——基于SpringBoot和Vue的后台管理系统项目系列博客（一） Vue2安装并集成ElementUI——基于SpringBoot和Vue的后台管理系…

人工智能 2023年6月27日
00108
ffmpeg 静默_使用FFMPEG与silencedetect去除音频静音

I am trying to use the following command with the latest ffmpeg build to remove silence fr…

人工智能 2023年5月27日
0072
STATA数据统计软件学习记录

STATA是一个数据统计软件，正如它的名字一样，STATA=statistic+data。STATA软件的功能和matlab类似，也可以用代码实现数据的统计与可视化。但几乎只能进行…

人工智能 2023年6月3日
0074
一文详解PnP算法原理

PnP(Perspective-n-Point)问题的几何结构如图1所示，给定3D点的坐标、对应2D点坐标以及内参矩阵，求解相机的位姿。数学语言描述如下：图1.PnP几何结构 …

人工智能 2023年6月16日
00119
在Python中将图像转换为ASCII字符图

引言使用Python进行图像处理，非常快捷方便，往往简短几行代码就可以实现功能强大的效果。在这篇文章中，我们将使用Python来将图像转换为ASCII字符照，如下所示：闲话少说…

人工智能 2023年6月20日
0086
python公园售票小程序(身份证获取简单信息+简单数据分析+简单多线程)

1.文件目录 2.main.py主文件 from utils import welcome,examineIdCard,playMusic,dataAnalysis import …

人工智能 2023年7月16日
00109
RNN – LSTM－GRU

文章目录前言为什么引入ＲＮＮ？ RNN * 1.RNN网络结构２.RNN的两个主要应用３.RNN的两个主要应用对应的不同的Loss ４.针对Loss进行反向传播 LSTM …

人工智能 2023年6月21日
0079
（情感倾向分类）2分类文本任务，Bert微调详细教程

🎀 Dataset：SST-2 Model：bert-base-cased ✨ transformers库的使用【三】对预训练模型进行微调 Transformers实战——使用Tr…

人工智能 2023年7月1日
0073
【神经网络】MLP 编码器-解码器注意力机制残差连接

[1] 多层感知机(MLP) 最典型的MLP包括包括三层：输入层、隐层和输出层，MLP神经网络不同层之间是全连接的（全连接的意思就是：上一层的任何一个神经元与下一层的所有神经元都有…

人工智能 2023年7月12日
0057
[NLP] 实例讲解 N-gram语言模型中 Good-Turning 平滑技术

1.背景最近在阅读论文的时候接触到了古德-图灵估计法，感觉比较模糊不清，进一步查阅了一些资料，希望有一个自己的直观理解。 …本论文采用的是古德-图灵估计法，其基本思想…

人工智能 2023年5月30日
0062
【集成学习系列教程2】AdaBoost回归算法原理及sklearn应用

文章目录 * – 4 AdaBoost回归算法 – + 4.1 概要 + 4.2 算法步骤 + 4.3 sklearn中的AdaBoost回归 + * 4….

人工智能 2023年6月18日
00121

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

神经网络定点量化

大家都在看