pytorch如何查看显存利用情况

2023年7月21日下午12:55 • 人工智能 • 阅读 72

最近搞LSTM优化，但是显存利用率不稳定，想看一下LSTM的显存占用情况，搜罗了一通，发现一个不错的开源工具，记录分享一下。

首先上项目地址：https://github.com/Oldpan/Pytorch-Memory-Utils

这里也有作者写的博客：https://oldpan.me/archives/pytorch-gpu-memory-usage-track

代码库就两个python文件 modelsize_estimate.py 和 gpu_mem_track.py，需要先将这两个文件复制到自己的代码工程目录下

作者也给出了使用示例，如下：

import torch

from torchvision import models
from gpu_mem_track import MemTracker

device = torch.device('cuda:0')

gpu_tracker = MemTracker()         # define a GPU tracker

gpu_tracker.track()                     # run function between the code line where uses GPU
cnn = models.vgg19(pretrained=True).features.to(device).eval()
gpu_tracker.track()                     # run function between the code line where uses GPU

dummy_tensor_1 = torch.randn(30, 3, 512, 512).float().to(device)  # 30*3*512*512*4/1024/1024 = 90.00M
dummy_tensor_2 = torch.randn(40, 3, 512, 512).float().to(device)  # 40*3*512*512*4/1024/1024 = 120.00M
dummy_tensor_3 = torch.randn(60, 3, 512, 512).float().to(device)  # 60*3*512*512*4/1024/1024 = 180.00M

gpu_tracker.track()

dummy_tensor_4 = torch.randn(120, 3, 512, 512).float().to(device)  # 120*3*512*512*4/1024/1024 = 360.00M
dummy_tensor_5 = torch.randn(80, 3, 512, 512).float().to(device)  # 80*3*512*512*4/1024/1024 = 240.00M

gpu_tracker.track()

dummy_tensor_4 = dummy_tensor_4.cpu()
dummy_tensor_2 = dummy_tensor_2.cpu()
gpu_tracker.clear_cache() # or torch.cuda.empty_cache()

gpu_tracker.track()

使用也很简单，在你需要查看显存利用代码的上下添加gpu_tracker.track()即可

gpu_tracker.track()
cnn = models.vgg19(pretrained=True).to(device)  # 导入VGG19模型并且将数据转到显存中
gpu_tracker.track()

然后可以发现程序运行过程中的显存变化（第一行是载入前的显存，最后一行是载入后的显存）

At __main__ : line 13                        Total Used Memory:472.2  Mb

+ | 1 * Size:(128, 64, 3, 3)      | Memory: 0.2949 M |
+ | 1 * Size:(256, 128, 3, 3)     | Memory: 1.1796 M |
+ | 1 * Size:(64, 64, 3, 3)       | Memory: 0.1474 M |
+ | 2 * Size:(4096,)              | Memory: 0.0327 M |
+ | 1 * Size:(512, 256, 3, 3)     | Memory: 4.7185 M |
+ | 2 * Size:(128,)               | Memory: 0.0010 M |
+ | 1 * Size:(1000, 4096)         | Memory: 16.384 M |
+ | 6 * Size:(512,)               | Memory: 0.0122 M |
+ | 1 * Size:(64, 3, 3, 3)        | Memory: 0.0069 M |
+ | 1 * Size:(4096, 25088)        | Memory: 411.04 M |
+ | 1 * Size:(4096, 4096)         | Memory: 67.108 M |
+ | 5 * Size:(512, 512, 3, 3)     | Memory: 47.185 M |
+ | 2 * Size:(64,)                | Memory: 0.0005 M |
+ | 3 * Size:(256,)               | Memory: 0.0030 M |
+ | 1 * Size:(128, 128, 3, 3)     | Memory: 0.5898 M |
+ | 2 * Size:(256, 256, 3, 3)     | Memory: 4.7185 M |
+ | 1 * Size:(1000,)              | Memory: 0.004 M |

At __main__ : line 15                        Total Used Memory:1387.5 Mb

1387.5 – 472.2 = 915.3 MB，即显存占用情况，熟悉vgg19 的同学应该看出来，vgg19所有层的权重加起来大概是548M，这里却用了915.3M，将上面打印的报告打印的Tensor-Memory也都加起来算下来也差不多 551.8Mb，和原始模型大小比较一致，但是两次打印的差值为什么要大这么多呢？

作者分析了原因： Pytorch在开始运行程序时需要额外的显存开销，这种额外的显存开销与我们实际使用的模型权重显存大小无关

大概可以理解。

下面是我的实验，模型是双层LSTM：

打印信息如下：


At train-mul.py line 172: main                        Total Tensor Used Memory:0.0    Mb Total Allocated Memory:0.0    Mb

+ | 2 * Size:(180, 60)            | Memory: 0.0823 M |  | torch.float32
+ | 1 * Size:(352504, 300)        | Memory: 403.40 M |  | torch.float32
+ | 4 * Size:(240,)               | Memory: 0.0036 M |  | torch.float32
+ | 4 * Size:(180,)               | Memory: 0.0027 M |  | torch.float32
+ | 1 * Size:(11, 120)            | Memory: 0.0050 M |  | torch.float32
+ | 2 * Size:(180, 160)           | Memory: 0.2197 M |  | torch.float32
+ | 2 * Size:(1, 256)             | Memory: 0.0019 M |  | torch.float32
+ | 2 * Size:(240, 80)            | Memory: 0.1464 M |  | torch.float32
+ | 2 * Size:(256,)               | Memory: 0.0019 M |  | torch.float32
+ | 1 * Size:(256, 160)           | Memory: 0.1562 M |  | torch.float32
+ | 1 * Size:(11,)                | Memory: 4.1961 M |  | torch.float32
+ | 2 * Size:(240, 300)           | Memory: 0.5493 M |  | torch.float32
+ | 1 * Size:(256, 120)           | Memory: 0.1171 M |  | torch.float32

At train-mul.py line 177: main                        Total Tensor Used Memory:404.7  Mb Total Allocated Memory:405.3  Mb

所有tensor相加大概是408.88M，如下：

两次打印差值是405.3M-0M=405.3M

很奇怪，两次差值比tensor memory相加要低，按说要大一些才是，原因不明

Original: https://blog.csdn.net/yaohaishen/article/details/123497474
Author: just do it now
Title: pytorch如何查看显存利用情况

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/707064/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

信息熵的计算与分析

信息熵的计算与分析一、[实验目的] 二、[实验环境] 三、[实验原理] 四、[实验内容] 五、[实验过程] * 1、二元信源熵函数曲线 2、求解离散单符号信源熵 3、计算图像一维…

人工智能 2023年6月18日
00129
毕设题目：Matlab无人机三维路径规划

1 案例背景在无人机低空飞行时,障碍物的形状大都不规则,很难建立其准确的解析模型;针对该问题,在栅格法的基础上提出了一种利用类三维地图进行路径规划的方法;首先阐述了类三维地图的创建…

人工智能 2023年6月18日
0085
pandas数据处理

pandas数据处理目录 pandas数据处理 * 1.处理丢失数据 2.处理空值操作 4.处理重复数据 5. 处理异常数据 – 6. 随机查看5条数据 1.处理丢失…

人工智能 2023年7月7日
0066
数据分析实战项目-用户行为分析（Python）

数据分析步骤1:明确项目背景和需求提出问题和应用模型 1.本次分析的目的是为了通过对某电商用户的行为进行分析，从而找到提升GMV方法。思路：项目GMV的拆解公式为：GMV=UV…

人工智能 2023年7月15日
0060
Jetson Nano （九）深度学习docker环境

TensorFlow PyTorch Docker环境文章目录 * – 一.软硬件版本 – 二.Nvidia Containers – 三.使…

人工智能 2023年5月26日
0090
逻辑斯谛（Logistic）回归、参数估计教程

### 回答1：逻辑_斯 _谛回归（ logistic regression）是一种用于分类问题的统计学习方法，属于监督学习中的一种。它的基本思想是通过建立模型去学习不同特征之…

人工智能 2023年6月17日
0075
微信语音麦克风静音_今天才发现，长按微信2秒，找出隐藏的7个功能，涨知识了…

今天才发现，长按微信2秒，找出隐藏的7个功能，涨知识了微信已经成为我们最常用的聊天工具之一，在使用过程中，有6个小功能，长按微信2秒就可以打开，来看看吧！ [En] Wechat…

人工智能 2023年5月27日
0096
三维坐标旋转矩阵推导过程（包看懂）

推导前提： 2. 绕X 轴旋转角度为俯仰角即Pitch3. 绕Y 轴旋转角度为偏航角即Yaw （Head ）4. 绕Z 轴旋转角度为翻滚角即Roll 一、平面二维坐标点…

人工智能 2023年5月26日
0083
conda环境下安装GPU版本的pytorch

1、确认NVIDIA 独立显卡的 CUDA 计算能力首先要确定 GPU 型号，方法为：右击”我的电脑”->在上下文菜单中选择”管理&#8…

人工智能 2023年7月21日
00135
jetson nano 5 运行YOLOV5

yolo系列算法在目标检测上很有地位,速度很快.之前都是在电脑上跑代码,今天来踩踩nano的坑,话不多少,开始吧! 1.首先下载yolov5的源码(我用的是5.0版本),可以去gi…

人工智能 2023年7月10日
0082
【无需注册账号】只需两步， Ai Studio上也可以玩[ChatGPT]了

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0060
OpenCV的车道线检测

资源下载地址：https://download.csdn.net/download/sheziqiong/85604275资源下载地址：https://download.csdn….

人工智能 2023年7月19日
0092
本科生学深度学习，搭建环境，再不入坑就晚了

1、目的 2、心理准备 3、IDE的选择 4、AI框架的选择 5、安装环境 6、总结最近没怎么写游戏了，一直在写python，是因为我对深度学习感兴趣，想学习一下，同时也觉得AI…

人工智能 2023年6月16日
0064
面试官：你说一说MySQL查询慢应该怎么办？

偶尔慢：上述所说的偶尔慢情况都是与MySQL系统刷新脏页有关。而刷新脏页与 IOPS有关， IOPS，具体可以看我这篇文章点击查看。 Original: https://blo…

人工智能 2023年7月29日
0083
linux下的opencv-4.5.5 及 opencv_contrib 扩展模块安装

适用于ubuntu(20.04)下安装opencv-4.5.5 以及opencv_contrib 扩展模块一并安装，如果已经安装了opencv-4.5.5，需要安装扩展模块的话，…

人工智能 2023年7月28日
0087
9 概率图模型

9 概率图模型 1 背景 * 1.1 概率的基本性质 1.2 条件独立性 1.3 概率图的算法分类 – 1.3.1 Representation 1.3.2 Infer…

人工智能 2023年6月18日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch如何查看显存利用情况

大家都在看