pytoch中class定义神经网络的参数保存与加载

2023年7月13日下午7:40 • 人工智能 • 阅读 62

一、定义一个容易识别的网络

在正式介绍模型的保存和加载之前，我们首先定义一个基本的网络Net，它只包含一个全连接层：

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.layer = nn.Linear(1, 1)
        self.layer.weight = nn.Parameter(torch.FloatTensor([[10]]))
        self.layer.bias = nn.Parameter(torch.FloatTensor([1]))

    def forward(self, x):
         y = self.layer(x)
        return y

二、保存Net的参数值

保存模型参数之前，需要知道 Net的参数值存储在其state_dict（状态字典）属性中，我们查看一下net的state_dict包含哪些参数：

print(net.state_dict())

我们将会得到 net包含的所有参数名称与参数值：

包含一个weight和一个bias，对应的值分别是10和1，和我们之前定义的全连接层一致。我们需要保存的就是这个state_dict，保存的函数为”torch.save()”， 参数是我们需要保存的dict和存储路径：

torch.save(obj=net.state_dict(), f="models/net.pth")

这有可能会报错TypeError: state_dict() missing 1 required positional argument: ‘self’

报错原因是上面定义的class是一个类，不能直接obj=,正确的形式是obj=Net()

现在，同级目录models下将会出现net.pth文件，pth文件中的内容就是net的参数名称和值对应的state_dict，如下：

三、加载Net参数值并用于新的模型

最后一个步骤就是从pth文件中重新获取Net参数值，并把参数值装载到新定义的Model对象中。这里我们重新定义一个结构和Net类相同的类Model， 区别仅仅是Model参数初始值和Net不同，代码如下：

class Model(nn.Module):
    def __init__(self):
        super(Model, self).__init__()
        self.layer = nn.Linear(1, 1)
        self.layer.weight = nn.Parameter(torch.FloatTensor([[0]]))
        self.layer.bias = nn.Parameter(torch.FloatTensor([0]))

    def forward(self, x):
        out = self.layer(x)
        return out

这里将Model的初始值权重w和偏差都设置为0，查看其state_dict：

model = Model()
print(model.state_dict())

得到的w和b值与预期相同，均为0，如下：

现在，我们将model对象的参数值设置为net.pth中的值，需要 使用”model.load_state_dict()”函数重置model的参数值为”torch.load(models/ net.pth)”中的参数值，如下：

model.load_state_dict(torch.load("models/net.pth"))
print(model.state_dict())

至此，model的w和b值就不再是0了，而是net中w和b对应的10和1，如下：

其中参数值重载的核心函数为”model.load_state_dict()”，每个继承自nn.Module的网络都能通过这个函数设定参数值。

四、优化器与epoch的保存

保存优化器参数值和epoch值的主要目的是用于继续训练，保存的流程依旧是先”torch.save()”再”torch.load_state_dict()”，我们首先定义一个Adam优化器、一个任意的epoch值与net如下：

net = Net()
Adam = optim.Adam(params=net.parameters(), lr=0.001, betas=(0.5, 0.999))
epoch = 96

现在， 创建一个字典来保存所有的对象，并用save函数保存这个字典：

all_states = {"net": net.state_dict(), "Adam": Adam.state_dict(), "epoch": epoch}
torch.save(obj=all_states, f="models/all_states.pth")

所有的对象都被保存到models文件夹下了：

可以使用load()函数把所有的对象再次提取出来：

reload_states = torch.load("models/all_states.pth")
print(reload_states)

五、总结

pytorch中state_dict()和load_state_dict()函数配合使用可以实现状态的获取与重载，load()和save()函数配合使用可以实现参数的存储与读取。其中最重要的部分是”字典”的概念，因为参数对象的存储是需要”名称”——”值”对应（即键值对），读取时也是通过键值对读取的。

Original: https://blog.csdn.net/m0_67635646/article/details/124349777
Author: m0_67635646
Title: pytoch中class定义神经网络的参数保存与加载

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/690489/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Opencv—训练自己的级联分类器（附数据集)

任务：在本文章，我们将进行苹果检测。我们需要创建一个自己的级联分类器，该分类器是后缀为xml文件，使用它也很简单，只需要文件存放的路径，和cv2.CascadeClassifier…

人工智能 2023年7月19日
0060
【YOLOv5-6.x】设置可学习权重结合BiFPN（Concat操作）

本文将尝试直接进行Concat操作来结合BiFPN。修改yaml文件（以yolov5s为例）本文以 yolov5s.yaml为例进行修改，原作者在YOLOv5-6.1版本中已经…

人工智能 2023年6月17日
0079
关系代数(关系代数的五个基本操作)

五种基本关系代数运算是？五种基本关系代数运算是并、差、投影、交、选择、投影。 1、并：设有两个关系R和S，它们具有相同的结构。R和S的并是由属于R或属于S的元组组成的集合，运算符…

人工智能 2023年7月27日
0051
【MindSpore】简单使用Resnet50实现狗狼图片分类。附全部代码下载。

本文章用的例子来自MindSpore官网教程，这里主要是分享一下个人理解和整合一下相关代码。个人博客网站查看环境配置： windows10 MindSpore1.6.1 CPU…

人工智能 2023年5月28日
0076
tSNE-python代码实现及使用讲解

在读基于深度学习的机械故障诊断论文时，不免会看到如下所示的t-SNE 可视化图，看着比较高级。那这个图又是如何绘制出来的呢？本文将通过mnist手写数据集来实现t-SNE ; 代码…

人工智能 2023年7月5日
0071
matlab基础知识总结，持续更新中……

matlab基础知识总结，持续更新中…… 仅供参考! 函数用法请以matlab帮助（help）为主!! 如有错误，敬请指出! matlab基础知识总结，持续…

人工智能 2023年6月21日
0095
OpenCV-Python实战（番外篇）——利用 K-Means 聚类进行色彩量化

OpenCV-Python实战（番外篇）——利用 K-Means 聚类进行色彩量化 * – 前言 – 利用 K-Means 聚类进行色彩量化 –…

人工智能 2023年5月26日
0075
手把手教你使用LabVIEW OpenCV dnn实现物体识别（Object Detection）含源码

文章目录前言一、物体识别算法原理概述 * 1、物体识别的概念 2、Yolo算法原理概述二、opencv调用darknet物体识别模型（yolov3/yolov4） * 1、d…

人工智能 2023年7月19日
0075
代码随想录算法训练营第52天 | 300.最长递增子序列 674. 最长连续递增序列 718. 最长重复子数组

动态规划篇 —— 最长子序列 class Solution: def lengthOfLIS(self, nums: List[int]) -> int: if len(nu…

人工智能 2023年6月26日
0079
opencv学习(9):cv::Scalar、cv::Mat::zeros

1 cv::Scalar cv::Scalar是opencv的一个结构体，其定义如下：（c++中的结构体如下，可以存放1~4个数值。） //! various constructo…

人工智能 2023年5月26日
0071
springboot基于知识图谱的短视频推荐系统设计与实现毕业设计源码231115

5 系统操作流程 5.1用户登录流程 5.2信息添加流程对于基于知识图谱的短视频推荐系统，需要随时添加所需要的数据信息，对于用户添加信息，需要根据添加界面，根据选框的内容进行填写…

人工智能 2023年6月1日
0073
【毕业设计】LSTM天气预测系统（时间序列预测）

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年6月15日
0059
TEASEL: A Transformer-Based Speech-Prefixed Language Model 论文阅读

前言好吧我又来更新sota 论文了这个是多模态情感分析的sota 而且和第二名相差很大。摘要多模态语言分析是NLP的一个新兴领域，旨在同时建模说话人的单词语义、语音和面部表…

人工智能 2023年5月31日
0064
pytorch、torch下载与安装

如果不知道自己的电脑的cuda版本号是多少，可以在cmd输入以下命令查看： nvcc -V 用Aaconda Prompt或者cmd命令cd到文件下载的目录进行安装（两种安装方式…

人工智能 2023年6月17日
0074
数字图像处理-图像基础-复习总结

文章目录数字图像处理复习总结 * 数字图像基础 – 数字图像基础概念采样和量化非均匀采样与量化数字图像常见失真类型数字图像处理基础 – 数字图像处…

人工智能 2023年6月17日
0063
基于Java+Vue+uniapp微信小程序实现餐厅校园订餐平台

博主介绍： ✌全网粉丝20W+,csdn特邀作者、博客专家、CSDN新星计划导师、java领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技…

人工智能 2023年6月21日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

pytoch中class定义神经网络的参数保存与加载

大家都在看