pytorch的模型保存加载和继续训练

2023年6月16日下午10:45 • 人工智能 • 阅读 83

import torch
from torch import nn
import numpy as np

定义一个三层的MLP分类模型

class MyModel(nn.Module):
    def __init__(self):
        super().__init__()
        self.linear = nn.Linear(64, 32)
        self.linear1 = nn.Linear(32, 10)
        self.relu = nn.ReLU()

    def forward(self, x):
        x = self.linear(x)
        x = self.relu(x)
        x = self.linear1(x)
        return x

rand1 = torch.rand((100, 64)).to(torch.float)
label1 = np.random.randint(0, 10, size=100)
label1 = torch.from_numpy(label1).to(torch.long)
rand2 = torch.rand((100, 64)).to(torch.float)
label2 = np.random.randint(0, 10, size=100)
label2 = torch.from_numpy(label2).to(torch.long)

model = MyModel()
optimizer = torch.optim.Adam(model.parameters(), lr=0.01)
loss = nn.CrossEntropyLoss()

epoch = 10
for i in range(epoch):
    output = model(rand1)
    my_loss = loss(output, label1)
    optimizer.zero_grad()
    my_loss.backward()
    optimizer.step()
    print("epoch:{} loss:{}".format(i, my_loss))

结果如下：记下这些loss值，观察下次继续训练的初始loss

epoch:0 loss:2.3494179248809814
epoch:1 loss:2.287858009338379
epoch:2 loss:2.2486231327056885
epoch:3 loss:2.2189149856567383
epoch:4 loss:2.193182945251465
epoch:5 loss:2.167125940322876
epoch:6 loss:2.140075206756592
epoch:7 loss:2.1100614070892334
epoch:8 loss:2.0764594078063965
epoch:9 loss:2.0402779579162598

采用torch.save函数保存模型，一般分为两种模式，分别是简单的保存所有参数，第二种是保存各部分参数，到一个字典结构里面。


save_path = r'model_para/'
torch.save(model, save_path+'model_full.pth')

保存模型参数，优化器参数和epoch情况。

def save_model(save_path, epoch, optimizer, model):
    torch.save({'epoch': epoch+1,
                'optimizer_dict': optimizer.state_dict(),
                'model_dict': model.state_dict()},
                save_path)
    print("model save success")
save_model(save_path+'model_dict.pth',epoch, optimizer, model)

对于保存的pth参数文件，使用torch.load进行加载，代码如下：

def load_model(save_name, optimizer, model):
    model_data = torch.load(save_name)
    model.load_state_dict(model_data['model_dict'])
    optimizer.load_state_dict(model_data['optimizer_dict'])
    print("model load success")

观察当前训练模型的权重参数

print(model.state_dict()['linear.weight'])

tensor([[-0.0215,  0.0299, -0.0255,  ..., -0.0997, -0.0899,  0.0499],
        [-0.0113, -0.0974,  0.1020,  ...,  0.0874, -0.0744,  0.0801],
        [ 0.0471,  0.1373,  0.0069,  ..., -0.0573, -0.0199, -0.0654],
        ...,
        [ 0.0693,  0.1900,  0.0013,  ..., -0.0348,  0.1541,  0.1372],
        [ 0.1672, -0.0086,  0.0189,  ...,  0.0926,  0.1545,  0.0934],
        [-0.0773,  0.0645, -0.1544,  ..., -0.1130,  0.0213, -0.0613]])

命名一个新模型，加载之前保存的参数文件，并打印出层参数

new_model = MyModel()
new_optimizer = torch.optim.Adam(new_model.parameters(), lr=0.01)
load_model(save_path+'model_dict.pth', new_optimizer, new_model)
print(new_model.state_dict()['linear.weight'])

可以看出新模型和当前模型的参数一致，说明参数加载成功。

model load success
tensor([[-0.0215,  0.0299, -0.0255,  ..., -0.0997, -0.0899,  0.0499],
        [-0.0113, -0.0974,  0.1020,  ...,  0.0874, -0.0744,  0.0801],
        [ 0.0471,  0.1373,  0.0069,  ..., -0.0573, -0.0199, -0.0654],
        ...,
        [ 0.0693,  0.1900,  0.0013,  ..., -0.0348,  0.1541,  0.1372],
        [ 0.1672, -0.0086,  0.0189,  ...,  0.0926,  0.1545,  0.0934],
        [-0.0773,  0.0645, -0.1544,  ..., -0.1130,  0.0213, -0.0613]])

在新模型加载原来模型参数的基础上，继续训练，观察loss值，是在之前训练的最终loss，继续下降，说明模型继续训练成功。

epoch = 10
for i in range(epoch):
    output = new_model(rand1)
    my_loss = loss(output, label1)
    new_optimizer.zero_grad()
    my_loss.backward()
    new_optimizer.step()
    print("epoch:{} loss:{}".format(i, my_loss))

epoch:0 loss:2.0036799907684326
epoch:1 loss:1.965193271636963
epoch:2 loss:1.924098253250122
epoch:3 loss:1.881495714187622
epoch:4 loss:1.835693359375
epoch:5 loss:1.7865667343139648
epoch:6 loss:1.7352293729782104
epoch:7 loss:1.6832704544067383
epoch:8 loss:1.6308385133743286
epoch:9 loss:1.5763107538223267

同样，在这里我发现一个问题，因为之前随机产生了2组数据，之前模型训练使用的rand1，这里只有继续训练rand1，之前模型的参数才有效，如果使用rand2，模型相当于从0训练（如下loss），这是因为，两组数据都是随机生成的，数据分布几乎不一样，所以上一组数据训练的模型在第二组数据几乎无效。

epoch:0 loss:2.523787498474121
epoch:1 loss:2.469816207885742
epoch:2 loss:2.4141526222229004
epoch:3 loss:2.379054069519043
epoch:4 loss:2.3563807010650635
epoch:5 loss:2.319946765899658
epoch:6 loss:2.271805763244629
epoch:7 loss:2.2274367809295654
epoch:8 loss:2.186885118484497
epoch:9 loss:2.144239902496338

但是在真实情况中，由于batch数据都是假设同一分布，所以不用考虑这个问题，

那么以上，就完成了pytorch的模型保存，加载和继续训练的三种重要过程，希望能够帮到您！！！

祝您训练愉快。

Original: https://blog.csdn.net/weixin_42327752/article/details/125405980
Author: Weiyaner
Title: pytorch的模型保存加载和继续训练

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/627071/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【Pytorch】MNIST 图像分类代码 – 超详细解读

【Pytorch】MNIST 图像分类代码 – 超详细解读目录【Pytorch】MNIST 图像分类代码 – 超详细解读前言一、代码框架二、实现代…

人工智能 2023年7月5日
0090
数分/机器学习算法面试题(技术面)—总结

一、 *商科技公司二欧洲艾盛集团ISV公司 BI笔试题 2.结构化思维考题： 3.电商生态认知题三、闪****车新能源科技公司2. 一个箱子中有10个不同颜色的球，在里面随机…

人工智能 2023年6月15日
0061
Tensorflow-gpu安装超详细！！！

在安装Tensorflow之前，首先我们需要准备一些东西。Anaconda安装包、Anaconda换源文件等等。若是不想去官网下载，我会在文章最后给出百度云链接。对自己显卡没有…

人工智能 2023年5月26日
0082
Layer的输入和输出是什么

问题：Layer的输入和输出是什么？详细介绍：在机器学习和深度学习中，神经网络模型通常由多个层（Layer）组成。每个层都有一些输入和输出，它们在神经网络中传递并进行计算和转换…

人工智能 2024年1月5日
0040
【统计学习方法】K近邻对鸢尾花(iris)数据集进行多分类

本文摘要 · 理论来源：【统计学习方法】第三章 K近邻· 技术支持：pandas(读csv)、collections.Counter(统计)、numpy、sklearn.neigh…

人工智能 2023年7月2日
0067
Windows 下安装CUDA和CUDNN以及验证是否安装成功

一、CUDA和CUDNN安装参见下面一篇博客：深度学习之CUDA+CUDNN详细安装教程二、验证是否安装成功首先验证CUDA，win+R进入CMD，在命令行输入nvcc -V…

人工智能 2023年5月23日
00108
【一起读论文系列1】基于压缩感知的语音编解码方向研究

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月25日
0075
R语言医学数据分析实战（二）数据框的操作

文章目录一、用基本包处理数据框 * – 1）查看数据框里的内容 2）选取数据框的子集 3）将数据框按照某个变量的值排序 4）查看和删除重复数据 5）在数据框中添加和删…

人工智能 2023年6月11日
00180
LinuxC实现FTP云盘

目录基础知识实现思路服务器客户端实现功能服务器功能客户端功能运行展示服务器客户端完整代码服务器客户端相关调用函数 socket()：创建一个网络通信端点…

人工智能 2023年6月29日
0050
水位报警仪电极式传感器感知水位分级式水位监测

水位报警仪由水位探测器、雨量传感器、报警灯、扩音器、太阳能板和采集传输控制器组成。实时采集水位等级，三个水位探测器对应3个水位等级，当现场水面浸没相应探测器时，本机会实时发出语音报…

人工智能 2023年6月27日
0097
ds18b20温度转换指令_分享大学课程设计~时钟温度语音播报系统设计

时钟温度语音播报系统的设计 [En] Design of clock temperature Voice broadcast system 【内容摘要】本系统采用宏晶公司的STC8…

人工智能 2023年5月27日
00119
keras中model.compile()基本用法

compile参数介绍 model.compile( optimizer, loss = None, metrics = None, loss_weights = None, sa…

人工智能 2023年7月5日
00131
【OpenCV 学习笔记】第七章: 图像平滑处理

第七章: 图像平滑处理 1、什么是图像平滑处理图像平滑处理就是，将图像中与周围像素点的像素值差异较大的像素点调整成和周围像素点像素值相近的值。 2、为什么要进行平滑处理？…

人工智能 2023年7月19日
0087
小熊猫C++中配置OpenCV

要准备的东西有: OpenCV源码, 小熊猫C++, 小熊猫C++下载链接:小熊猫C++ (gitee.io)https://royqh1979.gitee.io/redpanda…

人工智能 2023年7月19日
00138
C++猜数字

程序设计题7:猜数字. 1问题描述要求编写一个程序，实现猜数字的游戏。游戏规则如下:(1)首先程序随机生成一个0-9999的数。(2)玩家每次输入一个4位数，程序告诉玩家两个信息…

人工智能 2023年6月30日
0087
OpenCV（十五）边缘检测1 — Sobel算子（一阶微分算子，X、Y方向边缘检测）

目录一、边缘检测基础理论 1、作用： 2、分类 1、基于搜索 2、基于零穿越 3、算子比较二、Sobel算子基础理论 1、作用 2、原理及推导 3、更详细推导 4、Sobel函…

人工智能 2023年6月20日
0093

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytorch的模型保存加载和继续训练

大家都在看