【Pytorch-6】-模型保存与加载

2023年7月14日下午5:44 • 人工智能 • 阅读 38

其实Pytorch模型保存还是挺简单的，但是不同方式也有优劣之分吧。有时候，我们不仅仅需要保存模型参数，而有时需要保存训练的所有现场，包括优化器的内容。即有时候是只保存参数，但有时候需要保存模型训练的全过程。

我们实际上保存的是模型的参数，没有保存模型的结构的完整信息。

即，保存的模型是以字典形式保存的，所以被称作为state_dict。上面实际上我们按照已经定义好的模型进行加载，所以使用model.load_state_dict。其中的键信息实际是原本模型的层次的名字，因此模型在重新读取的时候，需要我们先实例化完全一致的结构，再进行参数的加载。

如果model是pytorch的nn.module继承而来的，那么如下：

model_path = os.path.join(output, 'model.pth')
torch.save(model.state_dict(), model_path)

这里有 .pth的格式存储，还有 .pkl格式，以及 .pt的格式。

之后，如果要进行推理或者使用时加载模型，只需要模型的结构对应，就可以直接加载：

model.load_state_dict(torch.load(args.model_path))

总结如下：

保存模型时调用 state_dict() 获取模型的参数，而不保存结构
加载模型时需要预先实例化一个对应的结构
加载模型使用 load_state_dict 方法，其参数不是文件路径，而是 torch.load(PATH)

这是完整的存储了模型的信息的方法，包括模型的参数信息、模型的结构信息、参数等等所有内容。和方法一相比，弊端是会占用更大的信息，优势是，我们不需要知道文件中的模型究竟是什么样的，直接读取即可使用了：

torch.save(model, PATH)

model = torch.load(PATH)

有时我们不仅要保存模型，还要连带保存一些其他的信息。比如在训练过程中保存一些 checkpoint，往往除了模型，还要保存它的 epoch、 loss、 optimizer等信息，以便于加载后对这些 checkpoint 继续训练等操作；或者再比如，有时候需要将多个模型一起打包保存等。

这里我们主要将多个内容放入一个字典进行保存：

torch.save({
            'epoch': epoch,
            'model_state_dict': model.state_dict(),
            'optimizer_state_dict': optimizer.state_dict(),
            'loss': loss,
            ...

            }, PATH)

加载的时候，我们需要将各个对应的元素按照原本的类别，进行数据初始化，例如优化器必须还是之前的优化器，模型还是之前的模型结构（主要这里例子是state_dict，不然直接保存模型也是可以的）

model = TheModelClass(*args, **kwargs)
optimizer = TheOptimizerClass(*args, **kwargs)

checkpoint = torch.load(PATH)
model.load_state_dict(checkpoint['model_state_dict'])
optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
epoch = checkpoint['epoch']
loss = checkpoint['loss']

我们时常会涉及到，在有GPU的服务器进行训练，但是在CPU上进行推理和使用的情况。正常的CPU训练、CPU加载或者GPU训练、GPU使用，都是没问题的，主要是设备不同时的问题。

GPU训，GPU加载

最为正常和一般的情况，照常操作，不过还是别忘记把模型放到GPU上去。

GPUidx=0
device = torch.device('cuda:{}'.format(GPUidx) if torch.cuda.is_available() else 'cpu')

BATCH_SIZE = 64
N_EPOCHS = 15
INPUT_DIM = 28 * 28
HIDDEN_DIM = 256
LATENT_DIM = 20

encoder = Encoder(INPUT_DIM, HIDDEN_DIM, LATENT_DIM)
decoder = Decoder(LATENT_DIM, HIDDEN_DIM, INPUT_DIM)
VAEmodel = VAE(encoder, decoder).to(device)

VAEmodel.load_state_dict(torch.load(modelpath))

GPU训练，CPU加载

保存的行为一致，我们只需要在torch.load时，对相应的参数 map_location进行设置即可：

torch.save(net.state_dict(), PATH)

device = torch.device("cpu")

loaded_net = Net()
loaded_net.load_state_dict(torch.load(PATH, map_location=device))

CPU训练，GPU加载

虽然一般不太可能，但还是啰嗦一下

torch.save(net.state_dict(), PATH)

device = torch.device("cuda")

loaded_net = Net()
loaded_net.load_state_dict(torch.load(PATH, map_location=device))

loaded_net.to(device)

Original: https://blog.csdn.net/zeiyousao/article/details/123724936
Author: 临淮郡人
Title: 【Pytorch-6】-模型保存与加载

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692549/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

软件测试的分类（按是否查看代码划分）

软件测试按照是否查看代码划分为以下 3类，分别是黑盒测试、白盒测试、灰盒测试。俗话说” 不管黑盒、白盒，抓住bug就是好盒“ 黑盒测试也称功能测试，测试中…

人工智能 2023年7月18日
0064
YOLO V5 测试图像时 img_size 的设置问题

最近项目用到了 yolo v5。初始图像是 1440×1080 大小的，在训练时显示 “cuda out of memory”，故保持原始长宽比，将图像缩小…

人工智能 2023年7月22日
0078
pytorch获得模型的参数量和模型的大小

参考 Finding model size Pytorch模型中的parameter与buffer What pytorch means by buffers? Pytorch中M…

人工智能 2023年7月21日
0070
新技术的成熟、商业模式的完备，产业互联网的落地提供了土壤

仅仅只是站在互联网的角度来看待产业互联网，只会把产业互联网带入到互联网的发展怪圈之中。这是我们看到如此多的产业互联网玩家投身其中，却一直并未有所突破的关键原因。纵然是那些头部的互联…

人工智能 2023年5月30日
0082
cubase怎么添加midi设备_Cubase教程丨20分钟快速上手Cubase（下）

插入乐器轨在cubase中，乐器轨是我们最常用的轨道之一。我们可以在创建轨道区，点击左键，选择”添加乐器轨”。在箭头所指的方向，可以选择相应的vst乐器…

人工智能 2023年5月27日
00332
MediaPipe实现手指关键点检测及追踪，人脸识别及追踪

OpenCV 是一个用于计算机视觉应用程序的库。在 OpenCV 的帮助下，我们可以构建大量实时运行更好的应用程序。主要用于图像和视频处理。可以在此处获取有关 OpenCV 的更…

人工智能 2023年7月20日
0078
【自然语言处理（NLP）】基于GRU实现情感分类

; 【自然语言处理（NLP）】基于GRU实现情感分类作者简介：在校大学生一枚，华为云享专家，阿里云星级博主，腾云先锋（TDP）成员，云曦智划项目总负责人，全国高等学校计算机教学与…

人工智能 2023年7月3日
0084
[Transformer] Deformable DETR：Deformable Transformers for End-to-End Object Detection

2020.10 作者单位：商汤目标检测：在DETR中加入了Deformable和多尺度特征融合策略 Paper: https://arxiv.org/abs/2010.04159…

人工智能 2023年7月12日
0070
1048 Find Coins

Eva loves to collect coins from all over the universe, including some other planets like M…

人工智能 2023年6月30日
0062
图像恢复(加噪与去噪)

人工智能导论实验导航实验一：斑马问题 https://blog.csdn.net/weixin_46291251/article/details/122246347 实验二：图像…

人工智能 2023年7月28日
0070
机器学习1-（多元）线性回归的基本概念

目录一、线性回归的基本概念：二、简单线性回归：三、最优解：四、多元线性回归：一、线性回归的基本概念：线性回归是机器学习中有监督机器学习下的一种算法。回归问题主要关注…

人工智能 2023年6月18日
0059
Python:实用的IPython（一种交互式开发环境）

用习惯了CentOS突然又用Windows，写Python想在控制端写怎么办？别急，一招教你在Windows终端写出一手舒服的代码！欢迎光临，我的主页。更多干货，等你来学：不许代码…

人工智能 2023年7月6日
0098
通俗地讲解目标检测中AP指标

声明：以下内容全是我的个人见解，如有问题，欢迎指正！ AP(Average Precision)即平均精度，是目标检测中的一个常用指标。一、精确率和召回率说道AP，那不得不提准…

人工智能 2023年7月9日
0068
Jupter torch.multiprocessing.spawn()报错：Exception: process 0 terminated with exit code 1

详细报错： ~/.local/lib/python3.6/site-packages/torch/multiprocessing/spawn.py in spawn(fn, arg…

人工智能 2023年6月17日
0077
数据分析有 AI 帮你，Sugar BI 智能分析全场景介绍

AI + BI ，省去传统拖拽操作的过程，超越模型固有字段的限制，对数据进行快速彻底的智能分析，让企业与个人的数据分析工作耗时更短，更加专业。本次分享将全场景介绍 Sugar B…

人工智能 2023年7月16日
0044
Fast planner 基本原理学习(一)

一、主题：Fast planner 基本原理学习二、目标：理解Fast planner轨迹规划处理流程理解hybrid A*的改进点 B样条曲线定义、性质、以及所带来的便利 …

人工智能 2023年6月1日
0072

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

【Pytorch-6】-模型保存与加载

GPU训，GPU加载

GPU训练，CPU加载

CPU训练，GPU加载

大家都在看