Pytorch训练时显存分配过程探究

2023年6月3日下午10:25 • 人工智能 • 阅读 85

对于显存不充足的炼丹研究者来说，弄清楚Pytorch显存的分配机制是很有必要的。下面直接通过实验来推出Pytorch显存的分配过程。

实验实验代码如下：

import torch
from torch import cuda

x = torch.zeros([3,1024,1024,256],requires_grad=True,device='cuda')
print("1", cuda.memory_allocated()/1024**2)
y = 5 * x
print("2", cuda.memory_allocated()/1024**2)
torch.mean(y).backward()
print("3", cuda.memory_allocated()/1024**2)
print(cuda.memory_summary())

输出如下：

代码首先分配3GB的显存创建变量x，然后计算y，再用y进行反向传播。可以看到，创建x后与计算y后分别占显存3GB与6GB，这是合理的。另外，后面通过backward()，计算出x.grad，占存与x一致，所以最终一共占有显存9GB，这也是合理的。但是，输出显示了显存的峰值为12GB，这多出的3GB是怎么来的呢？首先画出计算图：

下面通过列表的形式来模拟Pytorch在运算时分配显存的过程：

如上所示，由于需要保存反向传播以前所有前向传播的中间变量，所以有了12GB的峰值占存。

我们可以不存储计算图中的非叶子结点，达到节省显存的目的，即可以把上面的代码中的y=5*x与mean(y)写成一步：

import torch
from torch import cuda

x = torch.zeros([3,1024,1024,256],requires_grad=True,device='cuda')
print("1", cuda.memory_allocated()/1024**2)
torch.mean(5*x).backward()
print("2", cuda.memory_allocated()/1024**2)
print(cuda.memory_summary())

占显存量减少了3GB：

Original: https://www.cnblogs.com/qizhou/p/14110086.html
Author: 颀周
Title: Pytorch训练时显存分配过程探究

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/565927/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

平衡车Car_Balance（一）——电机

目录一、电机简要概述二、常见电机种类 1.直流有刷电机（BDC，最最最常见的电机） 2.直流无刷电机（BLDC） 3.舵机 4.步进电机三、平衡小车选用电机及需要关注的参数 …

人工智能 2023年6月11日
00100
yolov5 + pyqt5 口罩识别系统实战 (yolov5、pyqt5 快速入门 ,大作业项目)

文章目录前言 yolov5部分 * 环境配置程序结构程序测试 pyqt5部分: * 环境配置程序结构小总结前言本项目用yolov5识别口罩，然后用pyqt5做ui形成…

人工智能 2023年6月16日
00101
opencv-python学习【4】色彩空间类型转换

文章目录一.色彩空间基础 * 1.GRAY 色彩空间 – (1).RGB 转 GRAY (2).GRAY 转 RGB 2.XYZ 色彩空间 – (1).R…

人工智能 2023年7月20日
0090
VoxelNet：End_to_End Learning for Point Cloud Based 3D Object Detection 论文学习与解读

写给读者文章的内容主要是我个人在学习论文的过程中按模块对论文进行了粗略的翻译并且加入了一定的理解，其中对于一些我不太了解的额外知识进行了一个补充，欢迎大家指正。 Introduc…

人工智能 2023年7月12日
0086
python+OpenCv笔记（十一）：中值滤波

中值滤波：原理：中值滤波是一种典型的非线性滤波技术，基本思想是用像素点邻域灰度值的中值来代替该像素点的灰度值。应用：中值滤波对椒盐噪声来说尤其有用，因为它不依赖于邻域内那些…

人工智能 2023年5月28日
0090
Pytorch模型加密的方法

*加密过程 *解密过程 pip install cryptography from cryptography.fernet import Fernet key = Fernet.g…

人工智能 2023年6月17日
0072
目标检测环境搭建相关问题解决

anaconda环境搭建 anaconda常见命令包管理 列出当前环…

人工智能 2023年7月12日
0091
Out-of-distribution Detection系列专栏（六）

目录前言 A simple unified framework for detecting out-of-distribution samples and adversarial…

人工智能 2023年7月14日
0085
python：flatten()参数详解

python：flatten()参数详解这篇博客主要写flatten（）作用，及其参数的含义 flatten()是对多维数据的降维函数。 flatten(),默认缺省参数为0，也…

人工智能 2023年7月4日
00100
2022-03-13 安装Pytorch（加避坑）

安装Pytorch的详细教程 * – 1、安装Anaconda/Miniconda – 2、在Anaconda中新建一个pytorch环境 – …

人工智能 2023年7月23日
0084
spss方差分析_SPSS统计案例：考虑交互作用的双因素方差分析

某工厂使用3种机型的机器生产同一款产品，现在老板想考察不同机型以及不同操作工人对产品的影响，为此他简单设计了一个小实验，让甲、乙、丙、丁四个工人操作机器Ⅰ、Ⅱ、Ⅲ各三天，其产品产量…

人工智能 2023年6月18日
00122
Text to image论文精读MISE：多模态图像合成和编辑Multimodal Image Synthesis and Editing: A Survey

由于信息在现实世界中以各种形式存在，多模态信息之间的有效交互和融合对于计算机视觉和深度学习研究中多模态数据的创建和感知起着关键作用。近期 OpenAI 发布的 DALLE-2 …

人工智能 2023年6月24日
0070
目标检测 YOLOv5 – 数据增强

目标检测 YOLOv5 – 数据增强 flyfish 版本 YOLOv5:v5原始代码 YOLOv5源码镜像（可以快速打开）本文所描述的数据增强包含一下12个超参数，参…

人工智能 2023年6月17日
0097
python实现Excel中的数据透视表功能

主要利用pandas包中的pd.pivot_table()函数。 male_emo=pd.pivot_table(emo,index=’year’,columns=’emotion…

人工智能 2023年6月11日
0096
Python实例：根据字典值对字典进行排序的三种方法

Python实例：根据字典值对字典进行排序的三种方法一、实际场景及解决思路二、字典排序的三种实现方法 * 2.1 使用列表解析方法实现字典排序 2.2 使用zip方法实现字典排…

人工智能 2023年7月4日
00163
3.1 OrCAD中怎么创建新的原理图工程文件？OrCAD中原理图的设计纸张大小应该怎么设置？

笔者电子信息专业硕士毕业，获得过多次电子设计大赛、大学生智能车、数学建模国奖，现就职于南京某半导体芯片公司，从事硬件研发，电路设计研究。对于学电子的小伙伴，深知入门的不易，特开次博…

人工智能 2023年6月27日
0090

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch训练时显存分配过程探究

大家都在看