【PyTorch教程】07-PyTorch如何使用多块GPU训练神经网络模型

2023年10月10日上午10:56 • Python • 阅读 38

本期目录

1. 绪论
2. 导入Pytoch模块并声明参数
3. 创建虚拟数据集
4. 搭建一个简单的模型
5. 多GPU并行计算
6. 运行模型

; 1. 绪论

在本篇博文中，你将学习到在PyTorch中如何使用多GPU进行并行训练。在PyTorch中使用多GPU训练神经网络模型是非常简单的，PyTorch已经为我们封装好一个 nn.DataParallel 类来进行多GPU训练。

先来回顾一下在单GPU中如何训练，首先，我们可以把张量复制到GPU上：

import torch
import torch.nn as nn

device = torch.device("cuda:0")
mytensor = my_tensor.to(device)

我们还可以把神经网络模型放到GPU上：

model.to(device)

【注意】
原本在CPU的张量只是复制了一个副本过去GPU，其本身仍旧存储在CPU上。因此使用 torch.to('cuda') 函数时，要声明一个新的变量来接收GPU张量。

但是，PyTorch默认只会使用一张GPU。因此我们可以使用 nn.DataParallel 在多块GPU上并行地运行你的神经网络模型：

model = nn.DataParallel(model)

下面将是本篇教程的核心内容。我会用一个简单的数据集和神经网络模型来详细演示如何使用多GPU进行运算。

2. 导入Pytoch模块并声明参数

为了简单起见，我们声明一个输入尺寸为5，输出尺寸为2的张量。批量大小设置为30，数据集大小为100：

mport torch
import torch.nn as nn
from torch.utils.data import Dataset, DataLoader

input_size = 5
output_size = 2

batch_size = 30
data_size = 100

声明GPU：

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

3. 创建虚拟数据集

为了简单起见，创建一个简单的虚拟数据集，由随机值张量生成。


class RandomDataset(Dataset):

    def __init__(self, size, length):
        self.len = length
        self.data = torch.randn(length, size)

    def __getitem__(self, index):
        return self.data[index]

    def __len__(self):
        return self.len

rand_loader = DataLoader(dataset=RandomDataset(input_size, data_size),
                         batch_size=batch_size, shuffle=True, num_workers=12)

4. 搭建一个简单的模型

简单起见，搭建一个只有一层全连接层的神经网络模型。为了方便大家观察到输入输出变化，我在模型中插入了 print 语句，在实际使用中不需要加。当然，你可以把本文的多GPU运算应用到任何复杂的神经网络模型中。

class Model(nn.Module):

    def __init__(self, input_size, output_size):
        super(Model, self).__init__()
        self.fc = nn.Linear(input_size, output_size)

    def forward(self, input):
        output = self.fc(input)
        print("\tIn Model: input size", input.size,
              "output size", output.size)
        return output

5. 多GPU并行计算

这部分内容是本文的核心内容。首先，我们实例化模型对象，然后检查我们的电脑是否有多块GPU。如果有多块GPU，就可以使用 nn.DataParallel 打包我们的模型，最后用 nn.DataParallel 的 model.to(device) 把模型传送到多块GPU中进行运算。

model = Model(input_size, output_size)
if torch.cuda.device_count() > 1:
    print(f"Let's use {torch.cuda.device_count()} GPUs!")
    model = nn.DataParallel(model)

model.to(device)

6. 运行模型

现在，我们可以让模型跑起来，同时大家可以观察一下输入输出张量的形状变化：

for data in rand_loader:
    input = data.to(device)
    output = model(input)
    print(f"Outside: input size {input.size()},"
          f"output_size {output.size()}")

博主服务器里有8张GPU，所以可以看到如下输出：

Let's use 8 GPUs!
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([4, 5]) output size torch.Size([4, 2])
    In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
Outside: input size torch.Size([30, 5]) output_size torch.Size([30, 2])
    In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
    In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
    In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
    In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
    In Model: input size torch.Size([2, 5]) output size torch.Size([2, 2])
Outside: input size torch.Size([10, 5]) output_size torch.Size([10, 2])

可以看到，我们一共有100个数据，每个批量30个。PyTorch会自动帮我们尽可能地把每批次数据平均分到8张卡上。因此在前3个批次中，前7张卡都分到了4个数据，而最后一张卡分剩下的2个数据，一共是
7 × 4 + 2 = 30 7\times 4 + 2=30 7 ×4 +2 =3 0
个数据。刚好等于 batch_size = 30 。

而前3个批次已经计算完 30 × 3 = 90 30\times3=90 3 0 ×3 =9 0 个数据了，自然剩下的 100 − 90 = 10 100-90=10 1 0 0 −9 0 =1 0 个数据就分到了5张卡上，每张2个数据。100个数据分4个批次就运算完毕了，每个批次8张GPU都是并行地运算。

至此，恭喜你已经掌握了如何使用PyTorch进行多GPU运算了。

Original: https://blog.csdn.net/Sihang_Xie/article/details/125707018
Author: 自牧君
Title: 【PyTorch教程】07-PyTorch如何使用多块GPU训练神经网络模型

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/795395/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Scrapy框架进阶一Crawlspider爬虫案例

文章目录 🧨前言 * 📕往期知识点 💫最终效果 💥CrawlSpider介绍 * 💮项目的创建 💮LinkExtractors和Rule规则 💥scrapy爬虫实战 * 💦页面分析…

Python 2023年10月2日
0052
Ubuntu配置conda+tensorflow-gpu系列二：conda+tensorflow-gpu配置

Ubuntu使用conda配置tensorflow-gpu有两种方法1.采用conda创建虚拟环境，直接在conda环境中安装cuda，cudnn和tensorflow-gpu 参…

Python 2023年9月8日
0053
msyql表去重命令

delete from lb_paint_category where id not in (SELECT a.id FROM (SELECT min( id ) id FROM …

Python 2023年6月12日
0064
使用python画柱状图（matplotlib.pyplot）– 你想要的设置这张图基本都包括

本人写论文时画的图，总结一下方法：安心看下去，你应该就可以画出一个好看的柱状图，基本上需要的设置都有哦！！！目录 1 首先引入画图所需要的包Matplotlib 2 Matpl…

Python 2023年8月1日
0084
Infrastructure 知识: dnf对module的处理

从RHEL8/CentOS8开始，dnf取代yum作为rpm 包管理工具。与之而来的还有模块（module）这个东西。有了它们的加持，让在同一个OS上安装不同版本的软件或者开发语…

Python 2023年6月10日
0059
Python实现替换照片人物背景，精细到头发丝（附代码）

Original: https://www.cnblogs.com/123456feng/p/16054314.htmlAuthor: 蚂蚁ailingTitle: Python实…

Python 2023年11月9日
0037
【车道线检测】霍夫变换(HoughLines)检测直线详解

总结霍夫变换是一种思想，用来检测任意能够用数学公式表达的形状，即使这个形状被破坏或者有点扭曲。霍夫变换的原理是将特定图形上的点变换到一组参数空间上，根据参数空间点的累计结果…

Python 2023年10月7日
0068
scrapy 大规模 mysql_SEO记录Scrapy的一些坑！

最近曾庆平在搞一套抓自媒体的增量爬虫，包含UC、头条、百家、企鹅、搜狐、微信…..还有一些港台媒体，每天凌晨自动抓前一天的内容规模较大，需求是最低成本的解决爬虫自动化…

Python 2023年10月6日
0050
pandas缺失值填充

pandas缺失值填充作用：填充缺失值 DataFrame.fillna(value=None, method=None, axis=None, inplace=False, …

Python 2023年8月22日
0053
爬虫学习笔记–scrapy二

全站数据爬取：将网站中某板块下的全部页码所对应的信息爬取Scrapy中Yield scrapy.requests(url= ,callback=self.parse) 手动请求发送…

Python 2023年10月6日
0061
用python爬取豆瓣影评及影片信息(评论时间、用户ID、评论内容)

爬虫入门：python爬取某瓣影评及影片信息：影片评分、评论时间、用户ID、评论内容思路分析元素定位完整代码某瓣网作为比较官方的电影评价网站，有很多对新上映影片的评价，不多…

Python 2023年7月31日
0074
Numpy重要模块——linalg线性代数详细参数及演示

numpy——linalg线性代数实验目的熟练掌握linalg中常用函数实验原理 numpy.linalg模块包含线性代数的函数。使用这个模块，可以计算逆矩阵、求特征值、解线…

Python 2023年8月27日
0061
Pytest下Allure环境配置

文章目录一、命令行安装allure-pytest 二、安装Allure 三、配置Pycharm 注意：Allure使用Java语言开发，配置Allure环境之前请确保Java环境…

Python 2023年9月9日
0048
用Python实现简单的验证码识别

我们在做采集数据的时候，过快或者访问频繁，或者一访问就给弹出验证码，然后就蚌珠了~ 今天就给大家来一个简单处理验证码的方法 ; 环境模块本文使用的是 Python和pycharm…

Python 2023年11月2日
0039
根据excel批量生成打印卡片功能

根据excel批量生成打印卡片功能这天某大人在企业微信跟我说上级领导要她打印整个工厂的临时出入车控制卡片，发给我一个资料，让我看看能不能帮她搞一下，资料就如下：我一看，我操，原来…

Python 2023年8月11日
00184
flask使用iframe嵌套跳转界面

回答1：在Vue中 HTML可以通过以下步骤实现： 1. 在Vue组件中添加一个标签，设置src属性为要的HTML页面的URL。 2. 在Vue组件中添加一个data属性，用…

Python 2023年8月12日
00143

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31