深度学习中模型计算量(FLOPs)和参数量(Params)的理解以及四种计算方法总结

2023年6月13日上午12:01 • 人工智能 • 阅读 78

接下来要分别概述以下内容：

１首先什么是参数量，什么是计算量

２如何计算参数量，如何统计计算量

３换算参数量，把他换算成我们常用的单位，比如:mb

４对于各个经典网络，论述他们是计算量大还是参数量，有什么好处

５计算量，参数量分别对显存，芯片提出什么要求，我们又是怎么权衡

深度学习中模型参数量和计算量的理解与计算

1 首先什么是计算量，什么是参数量
2 如何计算：参数量，计算量
3 对于换算计算量
4 对于各个经典网络：
5 计算量与参数量对于硬件要求
6 计算量(FLOPs)和参数量(Params)
*
6.1 第一种方法：thop
–
- 第一步：安装模块
- 第二步：计算
6.2 第二种方法：ptflops
6.3 第三种方法：pytorch_model_summary
6.4 第四种方法：参数总量和可训练参数总量
7 输入数据对模型的参数量和计算量的影响
参考资料

1 首先什么是计算量，什么是参数量

计算量对应我们之前的时间复杂度，参数量对应于我们之前的空间复杂度，这么说就很明显了

也就是计算量要看网络执行时间的长短，参数量要看占用显存的量

2 如何计算：参数量，计算量

（１）针对于卷积层的

深度学习中模型计算量(FLOPs)和参数量(Params)的理解以及四种计算方法总结

其中上面的公式是 计算时间复杂度(计算量)，而下面的公式是 计算空间复杂度(参数量)

对于卷积层：

参数量就是

(kernel*kernel) *channel_input*channel_output

kernel*kernel 就是 weight * weight

其中kernel*kernel ＝ 1个feature的参数量

计算量就是

(kernel*kernel*map*map) *channel_input*channel_output

kernel*kernel 就是weight*weight

map*map是下个featuremap的大小，也就是上个weight*weight到底做了多少次运算

其中kernel*kernel*map*map＝　1个feature的计算量

（２）针对于池化层：

无参数

（３）针对于全连接层：

参数量＝计算量＝weight_in*weight_out

3 对于换算计算量

一般一个参数是值一个float，也就是４个字节
1kb=1024字节

4 对于各个经典网络：

(1)换算

以alexnet为例：

参数量：6000万

设每个参数都是float,也就是一个参数是4字节，

总的字节数是24000万字节

24000万字节= 24000万/1024/1024=228mb

(2)为什么模型之间差距这么大

这个关乎于模型的设计了，其中模型里面最费参数的就是全连接层，这个可以看alex和vgg,

alex,vgg有很多fc(全连接层)

resnet就一个fc

inceptionv1(googlenet)也是就一个fc

(3)计算量

densenet其实这个模型不大，也就是参数量不大，因为就1个fc

但是他的计算量确实很大，因为每一次都把上一个feature加进来，所以计算量真的很大

; 5 计算量与参数量对于硬件要求

计算量，参数量对于硬件的要求是不同的

计算量的要求是在于芯片的floaps（指的是gpu的运算能力）

参数量取决于显存大小

6 计算量(FLOPs)和参数量(Params)

6.1 第一种方法：thop

计算量：
FLOPs，FLOP时指浮点运算次数，s是指秒，即每秒浮点运算次数的意思，考量一个网络模型的计算量的标准。

参数量：
Params，是指网络模型中需要训练的参数总数。

第一步：安装模块

pip install thop

第二步：计算


import torch
import torchvision
from thop import profile

print('==> Building model..')
model = torchvision.models.alexnet(pretrained=False)

dummy_input = torch.randn(1, 3, 224, 224)
flops, params = profile(model, (dummy_input,))
print('flops: ', flops, 'params: ', params)
print('flops: %.2f M, params: %.2f M' % (flops / 1000000.0, params / 1000000.0))

结果

==> Building model..

[INFO] Register count_convNd() for <class 'torch.nn.modules.conv.Conv2d'>.

[INFO] Register zero_ops() for <class 'torch.nn.modules.activation.ReLU'>.

[INFO] Register zero_ops() for <class 'torch.nn.modules.pooling.MaxPool2d'>.

[WARN] Cannot find rule for <class 'torch.nn.modules.container.Sequential'>. Treat it as zero Macs and zero Params.

[INFO] Register count_adap_avgpool() for <class 'torch.nn.modules.pooling.AdaptiveAvgPool2d'>.

[INFO] Register zero_ops() for <class 'torch.nn.modules.dropout.Dropout'>.

[INFO] Register count_linear() for <class 'torch.nn.modules.linear.Linear'>.

[WARN] Cannot find rule for <class 'torchvision.models.alexnet.AlexNet'>. Treat it as zero Macs and zero Params.

flops:  714691904.0 params:  61100840.0
flops: 714.69 M, params: 61.10 M

注意：

输入input的第一维度是批量(batch size)，批量的大小不回影响参数量，计算量是batch_size=1的倍数
profile(net, (inputs,))的 (inputs,)中必须加上逗号，否者会报错

6.2 第二种方法：ptflops


import torchvision
from ptflops import get_model_complexity_info

model = torchvision.models.alexnet(pretrained=False)
flops, params = get_model_complexity_info(model, (3, 224, 224), as_strings=True, print_per_layer_stat=True)
print('flops: ', flops, 'params: ', params)

结果

AlexNet(
  61.101 M, 100.000% Params, 0.716 GMac, 100.000% MACs,
  (features): Sequential(
    2.47 M, 4.042% Params, 0.657 GMac, 91.804% MACs,
    (0): Conv2d(0.023 M, 0.038% Params, 0.07 GMac, 9.848% MACs, 3, 64, kernel_size=(11, 11), stride=(4, 4), padding=(2, 2))
    (1): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.027% MACs, inplace=True)
    (2): MaxPool2d(0.0 M, 0.000% Params, 0.0 GMac, 0.027% MACs, kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
    (3): Conv2d(0.307 M, 0.503% Params, 0.224 GMac, 31.316% MACs, 64, 192, kernel_size=(5, 5), stride=(1, 1), padding=(2, 2))
    (4): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.020% MACs, inplace=True)
    (5): MaxPool2d(0.0 M, 0.000% Params, 0.0 GMac, 0.020% MACs, kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
    (6): Conv2d(0.664 M, 1.087% Params, 0.112 GMac, 15.681% MACs, 192, 384, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (7): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.009% MACs, inplace=True)
    (8): Conv2d(0.885 M, 1.448% Params, 0.15 GMac, 20.902% MACs, 384, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (9): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.006% MACs, inplace=True)
    (10): Conv2d(0.59 M, 0.966% Params, 0.1 GMac, 13.936% MACs, 256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.006% MACs, inplace=True)
    (12): MaxPool2d(0.0 M, 0.000% Params, 0.0 GMac, 0.006% MACs, kernel_size=3, stride=2, padding=0, dilation=1, ceil_mode=False)
  )
  (avgpool): AdaptiveAvgPool2d(0.0 M, 0.000% Params, 0.0 GMac, 0.001% MACs, output_size=(6, 6))
  (classifier): Sequential(
    58.631 M, 95.958% Params, 0.059 GMac, 8.195% MACs,
    (0): Dropout(0.0 M, 0.000% Params, 0.0 GMac, 0.000% MACs, p=0.5, inplace=False)
    (1): Linear(37.753 M, 61.788% Params, 0.038 GMac, 5.276% MACs, in_features=9216, out_features=4096, bias=True)
    (2): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.001% MACs, inplace=True)
    (3): Dropout(0.0 M, 0.000% Params, 0.0 GMac, 0.000% MACs, p=0.5, inplace=False)
    (4): Linear(16.781 M, 27.465% Params, 0.017 GMac, 2.345% MACs, in_features=4096, out_features=4096, bias=True)
    (5): ReLU(0.0 M, 0.000% Params, 0.0 GMac, 0.001% MACs, inplace=True)
    (6): Linear(4.097 M, 6.705% Params, 0.004 GMac, 0.573% MACs, in_features=4096, out_features=1000, bias=True)
  )
)
flops:  0.72 GMac params:  61.1 M

6.3 第三种方法：pytorch_model_summary

import torch
import torchvision
from pytorch_model_summary import summary

print('==> Building model..')
model = torchvision.models.alexnet(pretrained=False)

dummy_input = torch.randn(1, 3, 224, 224)
print(summary(model, dummy_input, show_input=False, show_hierarchical=False))

结果

==> Building model..

6.4 第四种方法：参数总量和可训练参数总量

import torch
import torchvision
from pytorch_model_summary import summary

print('==> Building model..')
model = torchvision.models.alexnet(pretrained=False)

pytorch_total_params = sum(p.numel() for p in model.parameters())
trainable_pytorch_total_params = sum(p.numel() for p in model.parameters() if p.requires_grad)

print('Total - ', pytorch_total_params)
print('Trainable - ', trainable_pytorch_total_params)

结果

==> Building model..

Total -  61100840
Trainable -  61100840

7 输入数据对模型的参数量和计算量的影响


import torch
import torchvision
from thop import profile

print('==> Building model..')
model = torchvision.models.alexnet(pretrained=False)

dummy_input = torch.randn(1, 3, 224, 224)
flops, params = profile(model, (dummy_input,))
print('flops: ', flops, 'params: ', params)
print('flops: %.2f M, params: %.2f M' % (flops / 1000000.0, params / 1000000.0))

输入数据：(1, 3, 224, 224)，一张224*224的RGB图像

flops:  714691904.0 params:  61100840.0
flops: 714.69 M, params: 61.10 M

输入数据：(1, 3, 512, 512)，一张512*512的RGB图像

flops:  3710034752.0 params:  61100840.0
flops: 3710.03 M params: 61.10 M

输入数据：(8, 3, 224, 224)，八张224*224的RGB图像

flops:  5717535232.0 params:  61100840.0
flops: 5717.54 M params: 61.10 M

输入数据计算量（flops）参数量（params）(1, 3, 224, 224)714.69 M61.10 M(1, 3, 512, 512)3710.03 M61.10 M(8, 3, 224, 224)5717.54 M61.10 M

参考资料

https://www.cnblogs.com/lllcccddd/p/10671879.html
https://blog.csdn.net/Caesar6666/article/details/109842379

Original: https://blog.csdn.net/qq_40507857/article/details/118764782
Author: 紫芝
Title: 深度学习中模型计算量(FLOPs)和参数量(Params)的理解以及四种计算方法总结

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/605763/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

自监督模型—MoCoV3

摘要本文没有描述一种新的方法。相反，考虑到计算机视觉的进展，它研究了一个直接的、增量的、但必须知道的基线：视觉变压器(ViT)的自我监督学习。虽然标准卷积网络的训练配方已经高度…

人工智能 2023年6月18日
0091
将yolov5的detect.py改写成可以供其他程序调用的方式，并实现低时延（＜0.5s）直播推理

将yolov5的推理代码改成可供其它程序调用的方式，并实现低时延（ Original: https://blog.csdn.net/HC_wood/article/details/…

人工智能 2023年7月9日
0064
TPH-YOLOv5简述

引言无人机捕获场景下的目标检测技术已广泛应用于植物保护、野生动物保护和城市监测等实际应用中，在无人机捕获的图像上的目标检测性能，并为上述众多的应用提供洞察力。本文专注于在无人机上…

人工智能 2023年5月28日
0061
Error in eval(predvars, data, env) : object ‘**‘ not found

Error in eval(predvars, data, env) : object ‘**’ not found 目录 Error in eval(pr…

人工智能 2023年6月15日
0067
【Python】京东自动下单抢购脚本——双十一购物小技巧

最近种草一款富士📷已久，但限于富士产能，一直都没有等到开放购买，在尝试几次定闹钟到点准时抢购后，果断放弃，于是花了一个周末时间写了一个简易脚本，终于成为一名合格的”富家…

人工智能 2023年7月30日
0081
图像处理技术基础篇

色彩-分类计算机颜色模式，是将某种颜色表现为数字形式的模型，或者说是一种记录图像颜色的方式。常用模式如下：RGB模式；CMY /CMYK模式；HSV/HSB模式；Lab颜色模式；…

人工智能 2023年6月4日
0078
python pandas 分割DataFrame中的字符串及元组

python pandas 分割DataFrame中的字符串类型数据的方法文章目录 1.使用str.split()方法 2.使用join()与split()方法结合 3. 使用a…

人工智能 2023年6月25日
00100
tensorflow安装步骤（CPU版本，Anaconda环境下，Windows10）

本文主要讲述了在Anaconda环境下，CPU版本tensorflow2.3.0的安装步骤，Windows10系统中Anaconda的安装步骤可以阅读此篇博客：Anaconda安装…

人工智能 2023年7月25日
0069
从DETR backbone 的NestedTensor 到DataLoader, Sampler,collate_fn，再到DETR transformer

在DETR中backbone中，resnet50 的构建继承了backbonebase的类，backbonebase的前向过程如下，这里引入了NestedTensor类。 # 前向…

人工智能 2023年6月17日
00103
TensorFlow 从入门到精通（11）—— DeepDream(上)

这节课，我翘了两天，原因是最近压力比较大。大家可能对卷积云里雾里，这节课我们就可视化一下卷积层。通过噪声图像起点单层网络单通道/单层网络多通道/多层网络全通道来生成几幅图像，让大…

人工智能 2023年5月26日
0073
Mutli-Head Attention 和 Self-Attention 的区别与联系

最近在阅读论文的过程中接触到了Multi-Head Attention的结构，脑子里的第一反应是都叫Attention，那Mutli-Head Attention 和 Self-A…

人工智能 2023年5月28日
0098
【三维重建】三维重构基础知识、三维数据、重建流程

文章目录 * – 1.在计算机内生成三维信息 – + 三维图像重构： + 四个坐标系 + * 坐标系转换 * – 内参矩阵 – 外参…

人工智能 2023年5月26日
0052
Halcon实例转OpenCvSharp(C# OpenCV)实现–瓶口缺陷检测(附源码)

本文作者Color Space，文章未经作者允许禁止转载！导读本文主要介绍如何使用OpenCvSharp实现瓶口缺陷检测实例。效果如下： OpenCV瓶嘴缺陷检测实现展示 (H…

人工智能 2023年7月19日
0060
史上最详细的YOLOV3 SPP结构代码解析

推荐一个特别好的博主@太阳花的小绿豆，本人小白一枚，学习深度学习神经网络的知识全是看这个博主学习的。最近学习到了Yolov3 spp的代码，觉得代码有一定的难度在这里分享一下。我尽…

人工智能 2023年7月12日
0080
pytorch中使用TensorBoard进行可视化Loss及特征图

pytorch中使用TensorBoard进行可视化Loss及特征图安装导入TensorBoard 安装TensorBoard pip install tensorboard 导…

人工智能 2023年6月24日
00112
好像还挺好玩的GAN重制版4——Pytorch搭建SRGAN平台进行图片超分辨率提升

好像还挺好玩的GAN重制版4——Pytorch搭建SRGAN平台进行图片超分辨率提升学习前言源码下载地址网络构建 * 一、什么是SRGAN 二、生成网络的构建三、判别网络的…

人工智能 2023年7月23日
0096

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31