训练时是否使用显卡和怎么使用多张显卡的问题

2023年7月22日下午6:28 • 人工智能 • 阅读 91

前言：修改代码时心生疑问，故写此文章，以便参考。
*model.to(device)和model.cuda()的区别：

.to(device) 可以指定CPU 或者GPU

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")
model.to(device)

if torch.cuda.device_count() > 1:
  model = nn.DataParallel(model，device_ids=[0,1,2,3])
model.to(device)

.cuda() 只能指定GPU


os.environ['CUDA_VISIBLE_DEVICE']='1'
model.cuda()

os.environment['CUDA_VISIBLE_DEVICES'] = '0,1,2,3'
device_ids = [0,1,2,3]
net  = torch.nn.Dataparallel(net, device_ids =device_ids)
net  = torch.nn.Dataparallel(net)
net = net.cuda()

如若不知该设备有多少块GPU
Linux设备可以使用

 nvidia-smi

查看该设备有多少块GPU，如图，特需注意的是此处显示的Driver Version 470.103.01是显卡驱动版本号，而CUDA Version显示的并不是该设备所使用的的显卡CUDA版本，而是设备所支持的最大CUDA版本。由此图亦可以看出各个GPU
的使用情况。

另外使用.cuda()所需要注意的是：.cuda是要写在模型装载之后，下面是举例

net = resnet34()

os.environ['CUDA_VISIBLE_DEVICES'] = '0,1,2,3'
device_ids = [0, 1, 2, 3]

in_channel = net.fc.in_features
net.fc = nn.Linear(in_channel, args.out_feature)
net = nn.DataParallel(net, device_ids=device_ids)
net.cuda()

最后也要注意选择不同,数据的载入也不同,下面是例子

logits = net(images.cuda())
loss = loss_function(logits, labels.cuda())

为什么使用多个GPU比一个GPU的时候还慢？
此处请看这位博主的文章『开发技术』GPU训练加速原理（附KerasGPU训练技巧）

Original: https://blog.csdn.net/m0_55256134/article/details/124651645
Author: 2A40
Title: 训练时是否使用显卡和怎么使用多张显卡的问题

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/709436/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Mindspore】【GPU并行训练】用2块GPUs可以，四块或八块就失败了 V2.0–后续报错

问题：【功能模块】显卡配置：4 * Nvidia P100 【操作步骤&问题现象】 1、使用mpirun –allow-run-as-root -n 4 p…

人工智能 2023年7月12日
0046
tensorflow安装2022/3/12

鬼知道我经历了什么，将近一个星期，anaconda下载卸载无数次我的配置 Windows10+python 9+Anaconda3-2021.11-Windows-x86_64+c…

人工智能 2023年5月24日
0083
课程作业——基于数据挖掘算法和技术指标预测股票涨跌

导入数据 import pandas as pd data = pd.read_csv(‘D:/QQ文件夹/金发科技数据十年.csv’) data.head…

人工智能 2023年7月17日
0068
python方差分析模型的预测结果怎么看_statsmodels中方差分析表结果解析

引言通常我们在对多个变量进行统计分析的时候，结果的汇总和整理需要耗费大量的时间和精力，稍有不慎还有可能出现错误。因此在对多个变量统计分析的时候，使用自动化的脚本对结果进行整理和汇…

人工智能 2023年7月8日
00133
监督学习VS无监督学习

监督学习和无监督学习，在机器学习与深度学习领域中经常提到，为了防止混淆，也为了加强理解，下边主要是一些概念和一个实例。一、监督学习和无监督学习——划分依据监督学习、非监督学习和…

人工智能 2023年7月1日
00103
opencv 图像平滑处理(python)

图像平滑处理 * – + * 图像平滑处理 * – 均值滤波 – 方框滤波 – 高斯滤波 – 中值滤波 – …

人工智能 2023年7月20日
0071
ChatGPT 加图数据库 NebulaGraph 预测 2022 世界杯冠军球队

一次利用 ChatGPT 给出数据抓取代码，借助 NebulaGraph 图数据库与图算法预测体坛赛事的尝试。作者：古思为 ; 蹭 ChatGPT 热度最近因为世界杯正在进行，…

人工智能 2023年7月31日
0084
jupyter notebook 打开指定路径文件

最近做作业，需要用到jupyter notebook，但是每次我们进去的时候打开的都是默认路径，怎么切换到指定的路径，是一个问题。我对CSDN上已存在的几种方法进行对比，找到了最…

人工智能 2023年7月5日
00108
制作YOLOv5数据集

制作YOLOv5数据集 1 使用labelImg标注数据集 * 1.1 下载labelImg 1.2 使用labelImg标注数据 – 1.2.1 数据存放 1.2.2…

人工智能 2023年5月28日
0089
＜论文阅读07＞用于乳房 X 线照片分类的具有多个视图的多示例网络

文章目录引入方法描述 * 创新点关键技术 * 多视图输入… 权重MIL… 数据集引入题目：A multi-instance networks wi…

人工智能 2023年7月1日
0094
PyCharm中Opencv库不能自动补全【2022年7月】

笔者在用PyCharm学习OpenCV时碰到了这样一个问题，在 ‘ init.py’ 中找不到引用 ‘imread’。在网上找了一系…

人工智能 2023年6月18日
0088
bayer raw & RGB raw

Bayer Pattern——RGGB – 梅长苏枫笑 – 博客园图像处理——传感器原始图像格式:Bayer RGB 和RGB RAW_夜风的博客-CSD…

人工智能 2023年6月20日
0086
python实战故障诊断之CWRU数据集（一）：数据集初识

文章目录 1. 概述 2. CWRU数据集简介 * 2.1. 试验设施简介 2.2. 试验数据简介 3. 轴承数据初步探索 4. 轴承的故障特征频率探索概述在完成了振动信号处理…

人工智能 2023年6月24日
0087
利用opencv带你玩转人脸识别-下篇（人脸录入，数据训练，人脸识别小案例快速入门）

本文将介绍如何使用 OpenCV_进行 _人脸识别_模型的 _训练。 1. 收集人脸数据首先需要准备一些标记了人脸_的图像，可以通过人工标注或使用自动化工具来收集。要求每个…

人工智能 2023年6月18日
0077
今天分享的案例是关于某电商店铺的年终销售业绩

从情境中学习数据分析，体会数据分析逻辑。今天分享的案例是关于某电商店铺的年终销售业绩的分析哦~ 在2011年的圣诞节前两周，老板希望回顾一下过去一年的销售业绩，数据来自该店铺的实际…

人工智能 2023年7月16日
0062
【图像处理技术】｜黑科技解读之 PS检测、弯曲拉平、切边增强、摩尔纹

🎬 图像处理技术黑科技解读之 PS检测、弯曲拉平、切片增强、摩尔纹 * – 📢 前言一、图像处理技术 – + 1.1 什么是图像处理技术 1.2 图…

人工智能 2023年6月17日
0081

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

训练时是否使用显卡和怎么使用多张显卡的问题

大家都在看