pytorch之常用函数整理

2023年7月6日上午3:37 • 人工智能 • 阅读 87

pytorch之常用函数整理

一、图像预处理函数
*
1.1 torchvision.datasets.ImageFolder()函数
二、参数优化函数
*
2.1 torch.optim.lr_scheduler.StepLR()函数
2.2 optimizer.param_groups参数
三、模型保存与加载
*
3.1 模型和模型参数保存torch.save()函数
3.2 模型加载torch.load()函数
3.3 模型参数加载model.load_state_dict()函数
–
- 3.3.1 model.state_dict()函数和optimizer.state_dict()函数
3.4 总结模型参数保存与加载
–
四、其他函数
*
4.1 torch.randperm函数

一、图像预处理函数

1.1 torchvision.datasets.ImageFolder()函数

ImageFolder函数假设所有的文件按文件夹保存，每个文件夹下存储同一类别的图片，文件夹名为类别名；

ImageFolder(root, transform=None, target_transform=None, loader=default_loader)
"""
参数解释：
1）root：图片存储根目录；
2）transform：对PIL Image进行的转换操作，原始图片作为输入，返回一个转换后的图片；
3）target_transform：对图片类别进行预处理的操作，输入为 target，输出对其的转换。如果不传该参数，即对 target 不做任何转换，返回的顺序索引 0,1, 2...；
4）loader：表示数据集加载方式，通常默认加载方式即可；
返回值：
self.classes：用一个 list 保存类别名称；
self.class_to_idx：类别对应的索引，与不做任何转换返回的 target 对应；
self.imgs：保存(img-path, class) tuple的 list；
"""

from torchvision import transforms
from torchvision.datasets import ImageFolder
transform = transforms.Compose([
     transforms.RandomResizedCrop(224),
     transforms.RandomHorizontalFlip(),
     transforms.ToTensor(),
     transforms.Normalize(mean=[0.4, 0.4, 0.4], std=[0.2, 0.2, 0.2]),
])
dataset = ImageFolder('data1/dogcat_2/', transform=transform)

print(dataset.classes)
print(dataset.class_to_idx)
print(dataset.imgs)
'''
输出：
['cat', 'dog']
{'cat': 0, 'dog': 1}
[('./data/train\\cat\\cat.12484.jpg', 0),
 ('./data/train\\cat\\cat.12485.jpg', 0),
 ('./data/train\\cat\\cat.12486.jpg', 0),
 ('./data/train\\cat\\cat.12487.jpg', 0),
 ('./data/train\\dog\\dog.12496.jpg', 1),
 ('./data/train\\dog\\dog.12497.jpg', 1)，
 ('./data/train\\dog\\dog.12498.jpg', 1),
 ('./data/train\\dog\\dog.12499.jpg', 1)]
'''

二、参数优化函数

2.1 torch.optim.lr_scheduler.StepLR()函数

学习率衰减函数：每训练7个epoch，学习率衰减为原来的1/10

from torch import optim
optimizer_ft=optim.Adam(params_to_update,lr=1e-2)
scheduler=optim.lr_scheduler.StepLR(optimizer_ft,step_size=7,gamma=0.1)

2.2 optimizer.param_groups参数

optimizer.param_groups：是长度为1的list，其中的元素是1个字典；
1）optimizer.param_groups[0]：长度为7的字典，包括[‘amsgrad’, ‘params’, ‘lr’, ‘betas’, ‘weight_decay’, ‘eps’, ‘maximize’]这7个参数；

import torch
import torch.optim as optim
w1 = torch.randn(3, 3)
w1.requires_grad = True
optimizer = optim.Adam([w1])
print(optimizer.param_groups)
print(next(iter(optimizer.param_groups))['lr'])

"""
[{'params': [tensor([[ 1.0950,  0.2128,  0.1464],
        [ 0.0240, -0.4230, -0.3268],
        [ 0.4877, -0.2145,  0.5996]], requires_grad=True)],
  'lr': 0.001,
  'betas': (0.9, 0.999),
  'eps': 1e-08,
  'weight_decay': 0,
  'amsgrad': False,
  'maximize': False}]
0.001
"""

三、模型保存与加载

pytorch保存和加载模型后缀为：.pt和.pth

3.1 模型和模型参数保存torch.save()函数

torch.save： 保存一个序列化（serialized）的目标到磁盘。函数使用了Python的pickle程序用于序列化。模型（models），张量（tensors）和文件夹（dictionaries）都是可以用这个函数保存的目标类型。

"""
torch.save(obj, f, pickle_module=, pickle_protocol=2)
参数：
obj：保存对象
f：类文件对象（必须实现写和刷新）或一个保存文件名的字符串
pickle_module：用于pickling源数据和对象模块
pickle_protocol：指定pickle_protocol可以覆盖默认参数
"""

torch.save(model,'save.pt')

torch.save(model.state_dict(), 'save.pt')

3.2 模型加载torch.load()函数

torch.load： 用来加载模型。torch.load() 使用 Python 的解压工具（unpickling）来反序列化 pickled object 到对应存储设备上。首先在 CPU 上对压缩对象进行反序列化并且移动到它们保存的存储设备上，如果失败了（如：由于系统中没有相应的存储设备），就会抛出一个异常。用户可以通过 register_package 进行扩展，使用自己定义的标记和反序列化方法。

"""
torch.load(f, map_location=None, pickle_module=)
参数：
f：类文件对象（返回文件描述符）或一个保存文件名的字符串
map_location：一个函数或字典规定如何映射存储设备
pickle_module：用于unpickling元数据和对象的模块（必须匹配序列化文件时的pickle_module）
"""

torch.load('tensors.pt')

torch.load('tensors.pt', map_location=torch.device('cpu'))

torch.load('tensors.pt', map_location=lambda storage, loc: storage)

torch.load('tensors.pt', map_location=lambda storage, loc: storage.cuda(1))

torch.load('tensors.pt', map_location={'cuda:1':'cuda:0'})

with open('tensor.pt') as f:
    buffer = io.BytesIO(f.read())
torch.load(buffer)

3.3 模型参数加载model.load_state_dict()函数

model.load_state_dict：使用状态字典state_dict反序列化模型参数字典，用来加载模型参数。将state_dict中的parameters和buffers复制到model及其子节点中。

model.load_state_dict(state_dict, strict=True)
"""
state_dict：保存parameters和persistent buffers的字典
strict：可选参数，bool型。state_dict中的key是否和model.state_dict()返回的key一样。
"""
torch.save(model,'save.pt')

model.load_state_dict(torch.load("save.pt"))

3.3.1 model.state_dict()函数和optimizer.state_dict()函数

state_dict其实是pytorch中模型的可学习参数（如weight和bias）python字典，模型的参数可通过model.parameters()获取。只有包含了可学参数层（卷积层、池化层）和已注册的命令（registered buffers，比如batchnorm的running_mean）才会进入state_dict中，优化目标torch.optim也有state_dict，其中包含的是优化器状态信息和使用到的超参数。
model.state_dict()函数

"""
model.state_dict()
返回一个包含模型状态信息的字典。包含参数（weighs and biases）和持续的缓冲值（如：观测值的平均值）。
只有具有可更新参数的层才会被保存在模型的 state_dict 数据结构中
"""
model.state_dict().keys()

torch.optim.Optimizer.state_dict()函数

"""
torch.optim.Optimizer.state_dict()
返回一个包含优化器状态信息的字典。包含两个 key：
state：字典，保存当前优化器的状态信息。不同优化器内容不同。
param_groups：字典，包含所有参数组（eg：超参数）。
"""

from __future__ import print_function, division

import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
import numpy as np
import torchvision
from torchvision import datasets, models, transforms
import matplotlib.pyplot as plt
import time
import os
import copy

class TheModelClass(nn.Module):
    def __init__(self):
        super(TheModelClass, self).__init__()
        self.conv1 = nn.Conv2d(3, 6, 5)
        self.pool = nn.MaxPool2d(2, 2)
        self.conv2 = nn.Conv2d(6, 16, 5)
        self.fc1 = nn.Linear(16 * 5 * 5, 120)
        self.fc2 = nn.Linear(120, 84)
        self.fc3 = nn.Linear(84, 10)

    def forward(self, x):
        x = self.pool(F.relu(self.conv1(x)))
        x = self.pool(F.relu(self.conv2(x)))
        x = x.view(-1, 16 * 5 * 5)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x

model = TheModelClass()

optimizer = optim.SGD(model.parameters(), lr=0.001, momentum=0.9)

print("Model's state_dict:")
for param_tensor in model.state_dict():
    print(param_tensor, "\t", model.state_dict()[param_tensor].size())
print(model.state_dict().keys())

print("Optimizer's state_dict:")
for var_name in optimizer.state_dict():
    print(var_name, "\t", optimizer.state_dict()[var_name])

Model's state_dict:
conv1.weight     torch.Size([6, 3, 5, 5])
conv1.bias   torch.Size([6])
conv2.weight     torch.Size([16, 6, 5, 5])
conv2.bias   torch.Size([16])
fc1.weight   torch.Size([120, 400])
fc1.bias     torch.Size([120])
fc2.weight   torch.Size([84, 120])
fc2.bias     torch.Size([84])
fc3.weight   torch.Size([10, 84])
fc3.bias     torch.Size([10])

odict_keys(['conv1.weight', 'conv1.bias', 'conv2.weight', 'conv2.bias', 'fc1.weight', 'fc1.bias', 'fc2.weight', 'fc2.bias', 'fc3.weight', 'fc3.bias'])

Optimizer's state_dict:
state    {}
param_groups     [{'lr': 0.001, 'momentum': 0.9, 'dampening': 0, 'weight_decay': 0, 'nesterov': False, 'maximize': False, 'params': [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]}]

3.4 总结模型参数保存与加载

3.4.1 保存整个模型参数

torch.save(model.state_dict(), PATH)

3.4.2 加载模型参数

model = TheModelClass(*args, **kwargs)
torch.save(model.state_dict(), PATH)
model.load_state_dict(torch.load(PATH))
model.eval()

保存训练过程时，只需保存模型训练好的参数，使用torch.save()保存state_dict，能够方便模型的加载。因此推荐使用这种方式进行模型保存。
模型参数加载好后，要使用model.eval()来固定dropout和归一化层，否则每次预测结果会不同。
注意，load_state_dict()需要传入字典对象，因此需要先反序列化state_dict再传入load_state_dict()。

3.4.3 保存阶段性模型训练过程

torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'loss': loss,
            ...

            }, PATH)

3.4.4 加载阶段性模型训练过程

model = TheModelClass(*args, **kwargs)
optimizer = TheOptimizerClass(*args, **kwargs)
torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'loss': loss,
            ...

            }, PATH)
checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

model.eval()

model.train()

3.4.5 保存/加载多个模型到一个文件

保存

torch.save({
            'modelA_state_dict': modelA.state_dict(),
            'modelB_state_dict': modelB.state_dict(),
            'optimizerA_state_dict': optimizerA.state_dict(),
            'optimizerB_state_dict': optimizerB.state_dict(),
            ...

            }, PATH)

加载

modelA = TheModelAClass(*args, **kwargs)
modelB = TheModelBClass(*args, **kwargs)
optimizerA = TheOptimizerAClass(*args, **kwargs)
optimizerB = TheOptimizerBClass(*args, **kwargs)

checkpoint = torch.load(PATH)
modelA.load_state_dict(checkpoint['modelA_state_dict'])
modelB.load_state_dict(checkpoint['modelB_state_dict'])
optimizerA.load_state_dict(checkpoint['optimizerA_state_dict'])
optimizerB.load_state_dict(checkpoint['optimizerB_state_dict'])

modelA.eval()
modelB.eval()

modelA.train()
modelB.train()

3.4.6 加载其他模型

保存

torch.save(modelA.state_dict(), PATH)

加载

modelB = TheModelBClass(*args, **kwargs)
modelB.load_state_dict(torch.load(PATH), strict=False)

3.4.7 跨设备保存与加载模型

3.4.7.1 GPU上保存，CPU上加载

当在CPU上加载一个GPU上训练的模型时，在torch.load()中指定map_location=torch.device(‘cpu’)，此时，map_location动态地将tensors的底层存储重新映射到CPU设备上。


torch.save(model.state_dict(), PATH)

device = torch.device('cpu')
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location=device))


state_dict = torch.load('myfile.pth.tar')

from collections import OrderedDict
new_state_dict = OrderedDict()
for k, v in state_dict.items():
    name = k[7:]
    new_state_dict[name] = v

model.load_state_dict(new_state_dict)

3.4.7.2 GPU上保存，GPU上加载

在把GPU上训练的模型加载到GPU上时，只需要使用model.to(torch.device(‘cuda’))将初始化的模型转换为CUDA优化模型。同时确保在模型所有的输入上使用.to(torch.device(‘cuda’))。注意，调用my_tensor.to(device)会返回一份在GPU上的my_tensor的拷贝。不会覆盖原本的my_tensor，因此要记得手动将tensor重写：my_tensor = my_tensor.to(torch.device(‘cuda’))。


torch.save(model.state_dict(), PATH)

device = torch.device("cuda")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location="cuda:0"))
model.to(device)

3.4.7.3 CPU上保存，GPU上加载

在 GPU 上加载 CPU 训练保存的模型时，将 torch.load() 函数的 map_location 参数设置为 cuda:device_id。这种方式将模型加载到指定设备。下一步，确保调用 model.to(torch.device(‘cuda’)) 将模型参数 tensor 转换为 cuda tensor。最后，确保模型输入使用 .to(torch.device(‘cuda’)) 为 cuda 优化模型准备数据。
注意：调用 my_tensor.to(device) 会在 GPU 上返回 my_tensor 的新副本，不会覆盖 my_tensor。因此，使用 my_tensor = my_tensor.to(torch.device(‘cuda’)) 手动覆盖。


torch.save(model.state_dict(), PATH)

device = torch.device("cuda")
model = TheModelClass(*args, **kwargs)
model.load_state_dict(torch.load(PATH, map_location="cuda:0"))
model.to(device)

参考网址：https://zhuanlan.zhihu.com/p/505487325

四、其他函数

4.1 torch.randperm函数

torch.randperm(n)：将0~n-1（包括0和n-1）随机打乱后获得的数字序列，函数名是random permutation缩写

torch.randperm(10)

Original: https://blog.csdn.net/qq_40216188/article/details/124167851
Author: 西西先生666
Title: pytorch之常用函数整理

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/673125/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

聚类算法分类及如何选择某类方法

(1)划分聚类算法:也称为基于距离的聚类算法，此类算法中，簇的数量是随机选择的或最初给定的。属于这一类的算法有K-Meansl，PAM，CLARANSI等。 K-means聚类算法…

人工智能 2023年6月2日
0090
Docker（感谢狂神）

Docker(kuangsheng)B站狂神说java系列之docker笔记整理链接一、Docker概述 1.1、Docker为什么出现？一款产品：开发–上线两套环境！应用…

人工智能 2023年6月20日
0096
【机器学习】吴恩达机器学习作业 ex1 python实现+Matlab实现

文章目录 1 简单练习 * 输出一个5*5的单位矩阵 2 单变量的线性回归 * 2.1 Ploting绘图 2.2 Cost and Gradient descent单变量梯度下降…

人工智能 2023年6月15日
0082
强化学习基础07——deep Q-network(DQN)

目录 1. DQN 关于Q函数请参考强化学习基础概念03——价值函数_王三省的读研日记的博客-CSDN博客中的问题4（optimal action value function最优…

人工智能 2023年7月13日
0074
sklearn自学指南(part38)–OPTICS

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月3日
00105
【论文笔记】对比学习(Contrastive Learning)音频表示框架（COLA）

文章目录 * – 1. 对比学习 Contrastive Learning – 2. COLA 介绍 – + 1) similarity mea…

人工智能 2023年5月27日
0082
（Visual Navigation）深度图像转点云

深度图像即图像中包含深度信息（也就是距离信息）的单通道图像，每个像素反应的是图中的一点相对于相机的位置：左右位置高度位置和深度位置而视觉导航中比较常用的就是深度相机，通过深度相…

人工智能 2023年7月20日
0064
Nexus存储库管理器搭建-Maven私服

写在前面 🍁个人主页：微枫Micromaple✨本期专栏：《0到1项目搭建》欢迎订阅学习~📌源码获取：GitCode、GitHub、码云Gitee 持续更新中，别忘了 star 喔…

人工智能 2023年7月31日
0069
2.C语言矩阵乘法

本篇内容1）首先介绍了矩阵乘法的基本原理；2）然后介绍了相对初阶的C语言乘法代码设计；3）最后根据C语言动态内存规划，提出了更加便捷、优化的代码设计，希望能给大家带来帮助。更新：…

人工智能 2023年6月15日
00103
java计算机毕业设计高校人事管理系统源码+mysql数据库+系统+lw文档+部署

本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：idea eclipse 前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAV…

人工智能 2023年6月29日
0052
跟着Cell学单细胞转录组分析(二):单细胞转录组测序文件的读入及Seurat对象构建

分析单细胞转录组测序的软件和方法有很多，最流行的莫过于Seurat包，可以完成单细胞分析整个流程，我们整个教程也是基于R语言Seurat包来实现的，所以首先安装包： BiocMan…

人工智能 2023年6月19日
0085
【论文笔记】A data value metric for quantifying information content and utility

摘要数据驱动的创新是由最近的科学进步、快速的技术进步、制造成本的大幅降低以及对有效决策支持系统的重大需求推动的。这导致人们努力收集大量异构和多源数据，然而，并非所有数据都具有相同…

人工智能 2023年7月17日
0066
左右双侧条形图展示基因本体论（GO）BP、CC、MF三合一富集分析结果C、MF三合一富集分析结果

基因本体论（Gene Ontology，GO）计划（http://www.geneontology.org）为注释基因、基因产物和序列开发了一套结构化的、受控词汇表。它被分成三部分…

人工智能 2023年7月15日
0073
【分类模型】聚类分析

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年7月1日
0052
【论文阅读】注意力综述（软注意力）

以下内容来自：综述：图像处理中的注意力机制 – 知乎目录概述软注意力 Spatial Transformer Networks(空间域注意力)—2015 nips…

人工智能 2023年7月12日
0070
强化学习技巧四：模型训练速度过慢、GPU利用率较低，CPU利用率很低问题总结与分析。

1.PyTorchGPU利用率较低问题原因：在服务器端或者本地pc端，输入nvidia-smi 1.1 GPU内存占用率问题这是由于模型的大小以及batch size的大小，…

人工智能 2023年6月26日
00113

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch之常用函数整理

pytorch之常用函数整理

1.1 torchvision.datasets.ImageFolder()函数

2.1 torch.optim.lr_scheduler.StepLR()函数

2.2 optimizer.param_groups参数

3.1 模型和模型参数保存torch.save()函数

3.2 模型加载torch.load()函数

3.3 模型参数加载model.load_state_dict()函数

3.3.1 model.state_dict()函数和optimizer.state_dict()函数

3.4 总结模型参数保存与加载

3.4.1 保存整个模型参数

3.4.2 加载模型参数

3.4.3 保存阶段性模型训练过程

3.4.4 加载阶段性模型训练过程

3.4.5 保存/加载多个模型到一个文件

3.4.6 加载其他模型

3.4.7 跨设备保存与加载模型

3.4.7.1 GPU上保存，CPU上加载

3.4.7.2 GPU上保存，GPU上加载

3.4.7.3 CPU上保存，GPU上加载

4.1 torch.randperm函数

大家都在看