彻底搞懂float16与float32的计算方式

2023年6月15日下午10:14 • 人工智能 • 阅读 86

1 float 16与float 32

1.1 float16

1.1.1 计算方式

float 16又称半精度，用16个比特也就是2个字节表示一个数。
如下图所示，其中1位符号位， 5位指数位， 10位小数位。

那么，这16个比特位是怎么表示1个数的呢？分3部分：符号位，指数部分，小数部分。

a 符号位： 1代表负数， 0代表正数。

b 指数部分，5个比特位，全0和全1有特殊用途，所以是00001~11110，也就是1到30，减去偏置15，指数部分最终范围为-14 ~15.

c 小数部分， 10个比特位，范围为（0~1023）/1024.

所以最终一个数据的计算方式为：

( − 1 ) s i g n ∗ 2 e x p o n e n t − 15 ∗ ( 1 + f r a c t i o n 1024 ) (-1)^{sign}2^{exponent-15}(1+\frac{fraction}{1024})(−1 )s i g n ∗2 e x p o n e n t −1 5 ∗(1 +1 0 2 4 f r a c t i o n )

但是需要注意，有2个特殊情况，也就是上面说的指数位全0和全1的特殊用途。
1）exponent全0
计算公式为
( − 1 ) s i g n ∗ 2 − 14 ∗ ( 0 + f r a c t i o n 1024 ) (-1)^{sign}2^{-14}(0+\frac{fraction}{1024})(−1 )s i g n ∗2 −1 4 ∗(0 +1 0 2 4 f r a c t i o n )

2）exponent全1
如果fraction全0 ，则表示+ i n f +inf +i n f或者− i n f -inf −i n f
如果fraction不全为0 ，则表示N a N NaN N a N

; 1.1.2 表示范围与精度

根据上面的计算方法，
fp16 的最大值为： 0 11110 1111111111 = 2 15 ∗ ( 1 + 1023 / 1024 ) = 65504 0 \quad11110 \quad 1111111111=2^{15}(1+1023/1024)=65504 0 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 =2 1 5 ∗(1 +1 0 2 3 /1 0 2 4 )=6 5 5 0 4
fp16 的最小值为： 1 11110 1111111111 = − 1 ∗ 2 15 ∗ ( 1 + 1023 / 1024 ) = − 65504 1 \quad11110 \quad 111111111 1=-12^{15}*(1+1023/1024)=-65504 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 =−1 ∗2 1 5 ∗(1 +1 0 2 3 /1 0 2 4 )=−6 5 5 0 4
精度为： 2 − 24 = 5.960464477539063 e − 08 2^{-24}=5.960464477539063e-08 2 −2 4 =5 .9 6 0 4 6 4 4 7 7 5 3 9 0 6 3 e −0 8

有效动态范围： 5.960464477539063e-08 ~65504 \quad 注意这里不是从最小值到最大值，而是说的正数的部分，因为正负是对称的

另外，需要注意的一点是， fp16表示的数的范围是非均匀的，什么意思呢？ fp16表示的数的范围是-65536 – 65536，但这些数并不是等间隔分布的。在不同的区间，间隔是不一样的，最小的间隔为2 − 24 2^{-24}2 −2 4, 最大的间隔为2 5 2^5 2 5.

1.2 float32

1.2.1 计算方式

float32 又称单精度，用32个比特数也就是4个字节表示一个数。
如下图所示，其中1位符号位， 8位指数位， 23位小数位。

那么，这32个比特位是怎么表示1个数的呢？分3部分：符号位，指数部分，小数部分。

a 符号位： 1代表负数， 0代表正数。

b 指数部分，8个比特位，全0和全1有特殊用途，所以是00000001~11111110，也就是1到254，减去偏置127，指数部分最终范围为-126 ~127.

c 小数部分， 23个比特位，范围为( 0 − − 2 23 − 1 ) / 2 23 (0 — 2^{23}-1)/2^{23}(0 −−2 2 3 −1 )/2 2 3

所以最终一个数据的计算方式为：

( − 1 ) s i g n ∗ 2 e x p o n e n t − 127 ∗ ( 1 + f r a c t i o n 2 23 ) (-1)^{sign}2^{exponent-127}(1+\frac{fraction}{2^{23}})(−1 )s i g n ∗2 e x p o n e n t −1 2 7 ∗(1 +2 2 3 f r a c t i o n )

但是需要注意，有2个特殊情况，也就是上面说的指数位全0和全1的特殊用途。
1）exponent全0
计算公式为
( − 1 ) s i g n ∗ 2 − 126 ∗ ( 0 + f r a c t i o n 2 23 ) (-1)^{sign}2^{-126}(0+\frac{fraction}{2^{23}})(−1 )s i g n ∗2 −1 2 6 ∗(0 +2 2 3 f r a c t i o n )

2）exponent全1
如果fraction全0 ，则表示+ i n f +inf +i n f或者− i n f -inf −i n f
如果fraction不全为0 ，则表示N a N NaN N a N

; 1.2.2 表示范围与精度

根据上面的计算方法，
fp32 的最大值为： 0 11111110 111111…..1111 = 2 127 ∗ ( 1 + 2 23 − 1 2 23 ) = 3.4028234663852886 e + 38 0 \quad11111110 \quad 111111…..1111=2^{127}(1+\frac{2^{23}-1}{2^{23}})=3.4028234663852886e+38 0 1 1 1 1 1 1 1 0 1 1 1 1 1 1 …..1 1 1 1 =2 1 2 7 ∗(1 +2 2 3 2 2 3 −1 )=3 .4 0 2 8 2 3 4 6 6 3 8 5 2 8 8 6 e +3 8
fp32 的最小值为： 1 11111110 111111…..1111 = − 1 ∗ 2 127 ∗ ( 1 + 2 23 − 1 2 23 ) = − 3.4028234663852886 e + 38 1 \quad11111110 \quad 111111…..1111=-12^{127}*(1+\frac{2^{23}-1}{2^{23}})=-3.4028234663852886e+38 1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 …..1 1 1 1 =−1 ∗2 1 2 7 ∗(1 +2 2 3 2 2 3 −1 )=−3 .4 0 2 8 2 3 4 6 6 3 8 5 2 8 8 6 e +3 8
精度为： 2 − 149 = 1.401298464324817 e − 45 2^{-149}=1.401298464324817e-45 2 −1 4 9 =1 .4 0 1 2 9 8 4 6 4 3 2 4 8 1 7 e −4 5

有效动态范围：1.401298464324817e-45~3.4028234663852886e+38 \quad 注意这里不是从最小值到最大值，而是说的正数的部分，因为正负是对称的
同样地， fp32表示的数的范围是非均匀的. fp32表示的数的范围是-3.4028234663852886e+38 – 3.4028234663852886e+38，但这些数并不是等间隔分布的。在不同的区间，间隔是不一样的，最小的间隔为2 − 149 2^{-149}2 −1 4 9, 最大的间隔为2 104 2^{104}2 1 0 4.

Original: https://blog.csdn.net/leo0308/article/details/117398166
Author: leo0308
Title: 彻底搞懂float16与float32的计算方式

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/617872/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytorch：深入理解 reshape(), view(), transpose(), permute() 函数

文章目录 * – 前言 – 1. reshape() – 2. view() – + ① 1 阶变高阶 + * 1 阶变 2 阶 *…

人工智能 2023年6月16日
00101
Transformer模型入门详解及代码实现

目录前言一.什么是Transformer 二.Encoder的组成 1.输入部分 2.注意力机制 2.1注意力机制的含义 2.2在TRM中的实现 3.前馈神经网络 3.1 前馈…

人工智能 2023年7月4日
0060
yolov5的anchor详解

以yolov5s v3为例： *anchor长啥样及怎么得到的？以下是yolov5 v3.0中的anchor anchors: 1. [10,13, 16,30, 33,23] …

人工智能 2023年5月26日
0094
论文阅读Knowledge Vault

文章目录题目归属及框架前言概述动机贡献 KV组件 Local closed world assumption(LCWA) 抽取器(Extractors) * 抽取方法 &…

人工智能 2023年6月1日
0097
YOLOv5改进之五：改进特征融合网络PANET为BIFPN

前言：作为当前先进的深度学习目标检测算法YOLOv5，已经集合了大量的trick，但是在处理一些复杂背景问题的时候，还是容易出现错漏检的问题。此后的系列文章，将重点对YOLOv5…

人工智能 2023年6月16日
0086
Python重命名核酸截图文件

前言随着核酸常态化的进行，核酸检测已经越来越成为每个人工作生活中的一部分。在很多单位里，出于统计需求，往往需要收集个人核酸截图。收集截图后一般要求对图片文件名按照某种特定格式进行…

人工智能 2023年7月18日
0067
【Java】String类的常用方法

✨系列专栏: 【Java SE】✨一句短话:难在坚持,贵在坚持,成在坚持! 文章目录一. String对象的比较 * 1. ==比较是否引用同一个对象 2. boolean eq…

人工智能 2023年5月30日
00102
安装Pytorch后torch.cuda.is_available()返回False问题解决

首先说几点安装Pytorch时需要注意的点： 1.如果有能力，最好在科学上网后，利用类似如下命令直接安装： conda install pytorch torchvision t…

人工智能 2023年6月16日
00102
什么是反向传播算法（Backpropagation），它在AI算法中的作用是什么

什么是反向传播算法（Backpropagation）反向传播算法是一种用于训练人工神经网络的常用算法，它通过计算网络中每个参数对于损失函数的梯度来更新参数，从而使网络能够逐渐调整…

人工智能 2024年1月5日
0044
Focal Loss详解，及Keras实现

文章目录总述交叉熵 * 信息熵H(x) 相对熵交叉熵 focal loss focal loss 二分类 Keras实现总述 focal loss就是在cross_entr…

人工智能 2023年5月23日
0094
voc数据集格式转coco数据集格式

小白AI：VOC数据集史上最实用的介绍和使用（1）刚入门目标检测时，用的都是VOC格式的数据集，简单且评价标准单一。目前cv领域用的都是COCO格式的评价标准，前期使用Label…

人工智能 2023年7月21日
0075
神经网络—Sequential的使用

本文通过搭建一个简单的神经网络来学习Sequential的使用目录一、搭建神经网络二、Sequential的使用一、搭建神经网络代码如下： import torchfro…

人工智能 2023年7月12日
0060
视频流采集存储和展示技术调研

针对云平台直接接收摄像头视频数据的需求，本文调研了云平台接收摄像头视频数据的技术方案。一、摄像头数据输出协议调研调研了海康威视iDS-2VS435-F832©摄像头，支持RJ4…

人工智能 2023年6月20日
0084
C++(CMake)视觉OpenCV-Raspberry Pi图像处理-3D图像重建-面部界标检测-卷积神经网络车牌自动识别-深度神经网络面部检测和识别

演示如何为桌面和小型嵌入式系统（如 Raspberry Pi）编写一些图像处理过滤器；使用 SfM 模块将场景重建为稀疏点云，包括相机位姿，以及如何使用多视图立体获取密集点云；使用…

人工智能 2023年7月20日
0088
【计算机视觉】图像增强——图像的形态学操作

个人简介： 📦个人主页：赵四司机🏆学习方向：JAVA后端开发⏰往期文章：SpringBoot项目整合微信支付🔔博主推荐网站：牛客网刷题|面试|找工作神器📣种一棵树最好的时间是十年…

人工智能 2023年7月26日
0064
ptmalloc源码分析 – 多线程争抢竞技场Arena的实现（04）

一、为何要引入Arena竞技场概念二、主分配区和非主分配区的数据结构三、获取分配区主函数arena_get 四、首次申请分配区的核心函数arena_get2 1、get_fre…

人工智能 2023年6月30日
0078

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31