解决：RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB (GPU 0； 4.00 GiB total capacity； 2

2023年6月16日下午3:01 • 人工智能 • 阅读 104

引发pytorch：CUDA out of memory错误的原因有两个：

1.当前要使用的GPU正在被占用，导致显存不足以运行你要运行的模型训练命令不能正常运行

解决方法：
1.换另外的GPU
2.kill 掉占用GPU的另外的程序（慎用！因为另外正在占用GPU的程序可能是别人在运行的程序，如果是自己的不重要的程序则可以kill）
命令行中输入以下命令，可以 查看当前正在GPU运行的程序：

nvidia-smi

解决：RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB (GPU 0； 4.00 GiB total capacity； 2

再根据上面显示的正在运行程序的PID，输入以下查看进程的命令，可以 查看到进程的相关信息，包括使用该进程的用户，时间，命令等

ps -f -p 12345

输出大致如下：

ps -f -p 进程号
ps -f -p 5014
UID        PID  PPID  C STIME TTY          TIME CMD
root      5014     1  0 17:26 ?        00:00:00 /usr/local/apache/bin/httpd -k

杀死进程的命令：

kill 12345

强制杀死进程
kill -KILL 123456

2.可能是你要训练的模型所设置的batch-size太大了，GPU的显存满足不了

解决方法：
把batch-size调小一些，如设置常用的256 128 64 32 16等

Original: https://blog.csdn.net/universe_R/article/details/124551674
Author: universe_R
Title: 解决：RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB (GPU 0； 4.00 GiB total capacity； 2

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/624894/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

[论文][表情识别]Towards Semi-Supervised Deep Facial Expression Recognition with An Adaptive Confidence Margin

论文基本情况发表时间及刊物/会议：2022 CVPR发表单位：西安电子科技大学，香港中文大学，重庆邮电大学问题背景在大部分半监督学习方法中，一般而言，只有部分置信度高于提前…

人工智能 2023年6月6日
0079
30 个 Python 技巧，加速你的数据分析处理速度

今天给大家分享的是我日常在做数据处理中总结的一些 Python 技巧文章目录 * – 交流+完整代码 – pandas的下载 – 创建Data…

人工智能 2023年7月4日
0074
【论文解读】YOLOR: 2021年YOLO系列目标检测的最强王者

图表数据来源： EfficientDet: https://arxiv.org/pdf/2011.08036.pdf YOLOv3: https://arxiv.org/pdf…

人工智能 2023年5月26日
0056
DQN自动驾驶——python+gym实现

一、安装环境 gym是用于开发和比较强化学习算法的工具包，在python中安装gym库和其中子场景都较为简便。安装gym： pip install gym 安装自动驾驶模块，这里…

人工智能 2023年6月2日
0088
实战1 – 空气质量数据的校准

1 题目简介题目来源于2019 高教社杯全国大学生数学建模竞赛D题——空气质量数据的校准。空气污染对生态环境和人类健康危害巨大，通过对”两尘四气”（PM2…

人工智能 2023年6月19日
0058
面试准备思路

如何理解数据分析/数据科学/数据挖掘工作未来计划发展方向（技术or业务、算法or分析）实习经历里的项目ab实验专题用户行为漏斗分析等等异动分析：淘宝GMV下降30%分析如何提高…

人工智能 2023年7月17日
0053
TensorFlow安装问题：Could not load dynamic library ‘*****.dll‘； dlerror: ********.dll not found

在tensorflow2.x版本安装成功后，在运行下段代码后： tf.config.list_physical_devices(‘GPU’) 总是会出现以下情况：（注意：一般会有…

人工智能 2023年5月26日
0078
随机森林 matlab

Ref: 官方 matlab 已有牛人在前人的基础上进行学习，然后针对具体应用。很容易掌握随机森林法基本概念 Random Forest（随机森林）是Bagging的扩展变…

人工智能 2023年6月15日
0097
Java分片上传全解决方案，真香

因为我们是做语音识别的，在离线的情况下，需要上传语音，但是因为语音很大，所以需要拆分进行上传，要不然如果网络波动就前功尽弃了，今天就来复述下这个方案 1、解决方案我们的方案是 …

人工智能 2023年5月25日
0078
Ubuntu16.04下DynaSLAM配置过程（基于tensorflow-gpu）

Ubuntu16.04下DynaSLAM配置过程（基于tensorflow-gpu）电脑硬件配置及环境版本前言正文配置Mask RCNN 安装pangolin 安装Eige…

人工智能 2023年5月26日
0070
第二章 Urbansound8k 音频分类

1.建立自己的音频定义数据集 Urbansounddataste.py 创建自定义数据集 import os import torch from torch.utils.data …

人工智能 2023年7月1日
0083
从零搭建完整python自动化测试框架（UI自动化和接口自动化）——持续更新

本自动化测试框架采用python + unittest 的基础来搭建，采用PO模式、数据驱动的思想，通过selenium来实现WEB UI自动化，通过request来实现接口自动化…

人工智能 2023年7月3日
0084
R语言把dataframe中的字符类型数据列转化为数值类型数据列、使用as.numeric函数

R语言把dataframe中的字符类型数据列转化为数值类型数据列、使用as.numeric函数目录 R语言把dataframe中的字符类型数据列转化为数值类型数据列、使用as.n…

人工智能 2023年6月19日
0074
数据分析师23-京东商业数据分析有感

1： 4种分析情况：描述性分析（是什么一般就是看看分布平均四分位峰值等等）；诊断性分析（为什么会发生）；预测性分析（相关性）；指导性分析（全面做出策略） 2：可视化的目的是…

人工智能 2023年7月16日
0066
Interspeech 2022丨FFSVC 2022 远场说话人识别比赛

人工智能 2023年5月23日
0094
DL-Paper精读：LSTM + Transformer 架构模型

Transformer Language Models with LSTM-based Cross-Utterance Information Representation htt…

人工智能 2023年5月30日
00150

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

解决：RuntimeError: CUDA out of memory. Tried to allocate 64.00 MiB (GPU 0； 4.00 GiB total capacity； 2

1.当前要使用的GPU正在被占用，导致显存不足以运行你要运行的模型训练命令不能正常运行

2.可能是你要训练的模型所设置的batch-size太大了，GPU的显存满足不了

大家都在看