深度学习 | TensorFlow 2.x 和 1.x 限制显存（超详细）

2023年5月23日下午6:04 • 人工智能 • 阅读 90

本文为 HinGwenWoong 原创，如果这篇文章对您有帮助，欢迎转载，转载请阅读文末的【授权须知】，感谢您对 HinGwenWoong 文章的认可！

部署深度学习服务的时候，往往不是让其吃满一整张卡，而且有时候会出现致命的 OOM （Out of Memory）错误，这就需要适当限制下显存，下面介绍下如何使用代码限制显存。

我是 HinGwenWoong，一个有着清晰目标不停奋斗的程序猿，热爱技术，喜欢分享，码字不易，如果帮到您，请帮我在屏幕下方点赞 👍，您的点赞可以让技术传播得更远更广，谢谢！

方法一： `set_memory_growth`

该方法是设置 显存按需增长 来实现一开始不吃满来达到目的。

import tensorflow as tf
gpu_list = tf.config.experimental.list_physical_devices('GPU')
if len(gpu_list) > 0 :
  for gpu in gpu_list:
    try:

      tf.config.experimental.set_memory_growth(gpu, True)
    except RuntimeError as e:
        print(e)
else：
    print("Got no GPUs")

注意：

所有 GPU 的【显存按需增长】的配置应该相同。
应该在初始化 GPU 之前设置【显存按需增长】。

方法二： `memory_limit`

该步骤将第一个 GPU 的内存使用量限制为 2048MB。只需根据需要更改 gpu_list 的索引和 memory_limit 的设置即可。

import tensorflow as tf

using_gpu_index = 0
gpu_list = tf.config.experimental.list_physical_devices('GPU')
if len(gpu_list) > 0:
  try:
    tf.config.experimental.set_virtual_device_configuration(
        gpu_list[using_gpu_index],
        [tf.config.experimental.VirtualDeviceConfiguration(memory_limit=2048)]
    )
  except RuntimeError as e:
    print(e)
else：
    print("Got no GPUs")

方法一： `allow_growth`

下面这段代码对应于 TF2.x 的【方法一】。

config = tf.ConfigProto()
config.gpu_options.allow_growth=True
sess = tf.Session(config=config)

方法二： `per_process_gpu_memory_fraction`

下面这段代码对应 TF2.x 的【方法二】，但它设置的是显存的百分比，不是一个确定的值。下面的例子设置了使用 60% 的显存

import tensorflow as tf
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.6)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

以上就是 TF 2.x 和 1.x 显存的限制手段，希望能够帮助大家部署更加平稳。

Original: https://blog.csdn.net/hxj0323/article/details/121629067
Author: HinGwenWoong
Title: 深度学习 | TensorFlow 2.x 和 1.x 限制显存（超详细）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/497077/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

撸了 ChatGPT 的 Teams 机器人

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月31日
0074
【Pytorch】BERT+LSTM+多头自注意力（文本分类）

【Pytorch】BERT+LSTM+多头自注意力（文本分类） 2018年Google提出了BERT[1]（Bidirectional Encoder Representation…

人工智能 2023年7月24日
0054
p-范数（2-范数即欧几里得范数）

规范化矩阵 p-范数定义 vecnorm和norm * vecnorm – 应用废了废了，2016版本用不起vecnorm norm norm规范化矩阵 p-范数定义…

人工智能 2023年6月15日
0083
关于pyqt5弹出提示框

虽然有分类，但是实际操作是大同小异的(每一类都介绍两种方法) 这类的弹框一般是在整个软件关闭的时候提醒用户是否需要退出整个软件 (构建成函数的方法） def closeEvent(…

人工智能 2023年7月5日
0081
物理信息驱动的深度学习相比于传统数值方法的潜在优势

物理驱动的神经网络相比于传统数值方法在哪些问题上有潜在优势？刚接触到物理驱动的神经学习方法时，总会有一些疑惑：物理驱动的深度学习方法在求解一些物理系统（由物理方程所描述控制的系统…

人工智能 2023年7月12日
0066
NeRF 源码分析解读（二）

光线的生成由上一章节我们得到了加载到的数据，包括读取图像的数组、图像的高宽焦距、相机的 pose 、以及用于分割测试集、训练集的分割数组。得到这些数据后，我们开始进行生成光线的步…

人工智能 2023年6月23日
0090
GPT2模型详解

一背景介绍 GPT2模型是OpenAI组织在2018年于GPT模型的基础上发布的新预训练模型，其论文原文为 language_models_are_unsupervised_mu…

人工智能 2023年7月27日
0070
【Warning】YOLOV5训练时的ignoring corrupt image/label: [Errno 2]…..,无法全部训练数据集，快速带你解决它

问题描述在使用yolo(yolov5)训练自己的模型时候，有时候会发现出现下面的问题： ignoring corrupt image/label: [Errno 2]&#8230…

人工智能 2023年7月6日
00193
使用决策树对鸢尾花进行分类

本文整理自《Python机器学习》决策树决策树可视为数据从顶向下划分的一种方法，通常为二叉树。通过决策树算法，从树根开始，基于可获得的最大信息增益（Information G…

人工智能 2023年7月3日
0075
对比学习（contrastive learning）

什么是自监督学习？举个通俗的例子：即使不记得物体究竟是什么样子，我们也可以在野外识别物体。我们通过记住高阶特征并忽略微观层面的细节来做到这一点。那么，现在的问题是，我们能否构建…

人工智能 2023年5月26日
0070
从零开始目标检测

整理一些自己在学习过程中搜集到的文章和当时不懂的地方机器学习深度学习目标检测目标检测是许多计算机视觉任务的基础。在学习目标检测前，需具备机器学习和深度学习的基础知识。推荐…

人工智能 2023年7月10日
0059
linux创建mysql新用户及授权

言 1. 一般信息 1.1. 关于本手册 1.2. 本手册采用的惯例 1.3. MySQL AB概述 1.4. MySQL_数据库管理系统概述 1.4.1. _MySQL_的历史 …

人工智能 2023年6月29日
00126
李沐动手学深度学习V2-Encoder-Decoder编码器和解码器架构

一. encoder-decoder编码器和解码器架构 1. 介绍机器翻译是序列转换模型的一个核心问题，其输入和输出都是长度可变的序列。为了处理这种类型的输入和输出，可以设…

人工智能 2023年6月17日
00108
Ubuntu安装NVIDIA驱动

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月16日
0084
YOLO Air：小白YOLO系列Trick改进论文推荐 | 改进组合上千种搭配，包括Backbone,Neck,Head,注意力机制,适用于YOLOv5、YOLOv7、YOLOX等算法

🔥🔥🔥YOLOAir开源算法库！！！ 💡统一使用 YOLOv5、YOLOv7 代码框架，结合不同模块来构建不同的YOLO目标检测模型。 🌟本项目包含大量的改进方式,降低改进难度,…

人工智能 2023年5月26日
0081
sklearn岭回归

from sklearn.linear_model import Ridgek=np.linspace(0,1,29)#(start, end, num=num_points)使k…

人工智能 2023年6月17日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习 | TensorFlow 2.x 和 1.x 限制显存（超详细）

方法一： set_memory_growth

方法二： memory_limit

方法一： allow_growth

方法二： per_process_gpu_memory_fraction

大家都在看

方法一： `set_memory_growth`

方法二： `memory_limit`

方法一： `allow_growth`

方法二： `per_process_gpu_memory_fraction`