paddlepaddle模型的保存和加载

2023年10月9日上午11:11 • Python • 阅读 90

导读

深度学习中模型的计算图可以被分为两种， 静态图和 动态图，这两种模型的计算图各有优劣。

静态图需要我们先定义好网络的结构，然后再进行计算，所以静态图的计算速度快，但是debug比较的困难，因为只有当给计算图输入数据之后模型的参数才会有值。

而 动态图则是边运行边构建，动态图的优点在于可以在搭建网络的时候看见变量的值便于检查，缺点就是前向计算不方便优化，因为不知道下一步计算是做什么。

针对于这两种不同的计算图， paddlepladdle提供了多种不同的方式来保存和加载

模型保存和加载

paddle.save：模型参数和超参的保存，支持 动态图和静态图
paddle.load：模型参数和超参的加载，支持 动态图和静态图
paddle.jit.save： 动态图模型参数和结构的保存
paddle.jit.load： 动态图模型参数和结构的加载
paddle.static.save_inference_model： 静态图模型参数和结构的保存
paddle.static.load_inference_model： 静态图模型参数和结构的加载

除此之外，paddlepaddle还提供了 动态图转静态图来训练和保存模型，用来加快模型的训练效率。

; 模型参数的保存和加载

模型训练

定义一个线程的二元一次方程，通过随机生成一些输入数据来计算输出，来训练模型

import paddle
import numpy as np
from paddle import optimizer,nn

np.random.seed(28)

num_samples = 1000

epoch = 10
batch_size = 512
class_num = 1
input_size = 2
learing_rate = 0.01

class LinearData(paddle.io.Dataset):
    def __init__(self,num_samples,input_size):
        super(LinearData, self).__init__()
        self._num_samples = num_samples

        w = np.random.rand(input_size)
        b = np.random.rand()

        self._x = np.random.rand(num_samples,2).astype("float32")
        self._y = np.sum(w * self._x,axis=1) + b
        self._y = self._y.reshape(-1,class_num).astype("float32")

    def __getitem__(self, idx):
        return self._x[idx],self._y[idx]

    def __len__(self):
        return self._num_samples

class SimpleNet(nn.Layer):
    def __init__(self,input_size,num_classes=class_num):
        super(SimpleNet, self).__init__()
        self._linear = nn.Linear(input_size,class_num)

    def forward(self, x):
        output = self._linear(x)
        return output

def train(data_loader,model,loss_fn,opt):

    for epoch_idx in range(epoch):
        for batch_idx,batch_data in enumerate(data_loader):
            batch_x, batch_y = batch_data
            pred_batch_y = model(batch_x)

            batch_loss = loss_fn(pred_batch_y,batch_y)

            batch_loss.backward()
            opt.step()
            opt.clear_grad()

            print("epoch:{},batch idx:{},loss:{:.4f}".format(epoch_idx,batch_idx
                  ,np.mean(batch_loss.numpy())))

dataset = LinearData(num_samples,input_size)
data_loader = paddle.io.DataLoader(dataset,shuffle=True,batch_size=batch_size)

model = SimpleNet(input_size,class_num)

loss_fn = paddle.nn.loss.MSELoss()

opt = paddle.optimizer.sgd.SGD(learning_rate=learing_rate,
                               parameters=model.parameters())

train(data_loader,model,loss_fn,opt)

动态图的参数保存

通过 paddle.save函数来保存模型的参数和优化器的参数


paddle.save(model.state_dict(),"model.pdparams")

paddle.save(opt.state_dict(),"opt.pdparams")

参数的加载

通过 paddle.load来从磁盘中加载模型和优化器的参数


model.set_state_dict(paddle.load("model.pdparams"))

opt.set_state_dict(paddle.load("opt.pdparams"))

静态图模型参数和结构的保存

构建一个静态图模型
构建了一个简单的静态图模型，只包含了输入和输出

import paddle

paddle.enable_static()

input = paddle.static.data(name="input",shape=[None,10],dtype="float32")

output = paddle.static.nn.fc(input,2)

place = paddle.CPUPlace()

exe = paddle.static.Executor(place)

exe.run(paddle.static.default_startup_program())

保存静态图的模型和参数

prog = paddle.static.default_startup_program()

paddle.save(prog.state_dict(),"static.pdparams")

paddle.save(prog,"static.pdmodel")

静态图模型的加载和初始化


prog = paddle.load("static.pdmodel")

params = paddle.load("static.pdparams")

prog.set_state_dict(params)

动态图转静态图的模型保存和加载

为了便于构建模型和调试，我们通常会选择动态图的方式来构建模型，如果想要加快模型的训练效率以及方便在训练完成之后保存模型的结构，这时候我们可以将动态图转换成为静态图来解决这两个问题。
针对这种情况paddlepaddle提供了两种方式来实现：

先将动态图转换成为静态图模型进行训练，然后再保存
采用动态图进行训练，训练完成之后再保存模型
动态图转静态图进行训练
这种方法的优点就是通过将动态图转换为静态图进行训练，可以提升模型的训练效率，缺点就是 不方便调试
paddle提供了一种比较简单的方法，只需要通过 paddle.jit.to_static来装饰 forward方法即可，非常简单


class SimpleNet(nn.Layer):
    def __init__(self,input_size,num_classes=class_num):
        super(SimpleNet, self).__init__()
        self._linear = nn.Linear(input_size,num_classes)

    @paddle.jit.to_static
    def forward(self, x):
        output = self._linear(x)
        return output

然后保存模型的时候使用 paddle.jit.save方法即可

paddle.jit.save(model,"model")

保存成功之后会生成三个文件 model.pdiparams、 model.pdiparams.info、 model.pdmodel，如果使用 paddle.jit.to_static装饰了多个 forward方法，则会生成多个模型文件。

如果想要让保存的模型能够支持动态输入，只需要指定 InputSepc参数即可

from paddle.static import InputSpec

class SimpleNet(nn.Layer):
    def __init__(self,input_size,num_classes=class_num):
        super(SimpleNet, self).__init__()
        self._linear = nn.Linear(input_size,num_classes)

    @paddle.jit.to_static(input_spec=[InputSpec(shape=[None, input_size], dtype='float32')])
    def forward(self, x):
        output = self._linear(x)
        return output

模型的加载和预测


model = paddle.jit.load("model")

print(model.state_dict())

input_array = np.array([[1,2],[3,4],[5,6]],dtype=np.float32)
inputs = paddle.to_tensor(input_array,place=paddle.CUDAPlace(0),stop_gradient=False,dtype=paddle.float32)
print(inputs)

predit = model(inputs)
print(predit)

动态图训练保存模型
相比于动态图转静态图进行训练而言，我们不需要给模型添加装饰方法，只需要使用 paddle.jit.save来保存模型即可，在保存模型的时候只需要指定一下模型输入的shape即可

paddle.jit.save(model,"model",input_spec=[InputSpec(shape=[None,input_size],dtype="float32")])

注意：在使用 Layer构建模型的时候，不要把loss的计算写到forward方法中

Original: https://blog.csdn.net/sinat_29957455/article/details/127080526
Author: 修炼之路
Title: paddlepaddle模型的保存和加载

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/794727/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【使用pytest重构项目】pytest：setup和teardown的5种应用

前言一直想学习自动化测试，但是都没行动，业余时间学习零零碎碎并记录20210420。 6、使用pytest重构项目 pytest框架介绍 pytest标记 pytest参数处理 …

Python 2023年9月13日
0051
VScode-TodoTree 待办事项插件的定制和使用

将配置写入 json 文件的最下面即可 "todo-tree.regex.regex": "(//|#| Original: https://www….

Python 2023年6月6日
00108
Django设置路由的分发规律

目录 1、创建应用的路由文件（子路由）urls.py （1）创建index应用的路由文件（2）创建commodity应用的路由文件（3）创建shopper应用的路由文件 2…

Python 2023年8月6日
0037
可信AI年度观察 | 生成式AI技术及产品快速迭代，生成内容质量及安全性仍需提升

自2021年起，生成式人工智能（以下简称”生成式AI”）连续两年入选Gartner《Hype Cycle for Artificial Intelligen…

Python 2023年11月4日
0044
FastAPI 快速入门

👑 FastAPI 快速入门文章目录 👑 FastAPI 快速入门 😉前言 * 一、👻FastApi？？ – 1.😎FastAPI可以做什么 2.🚲为什么要学习 Fa…

Python 2023年8月14日
0061
1数据类型作业+2流程控制语句作业1

1、用print函数打印多个值2、用print函数不换行打印3、导入模块的方式有哪些4、python有哪六种数据类型？不可变数据类型有哪些？可变数据类型有哪些？5、python3中…

Python 2023年9月15日
0076
pytest+requests+uiautomator2实例展示 ——1、了解业务背景及框架构成介绍

一. 业务背景介绍本例是以扫地机器人展开的，其中有一个功能是APP点击”立即升级’按钮，扫地机会开始固件版本的升级（固件版本：指扫地机内置的算法版本） 1…

Python 2023年9月11日
0067
Python Flask Web 高并发实现

Flask超高并发，Flask多进程gevent ，Flask非gunicorn gevent多进程 1. flask + gevent + multiprocess + wsgi…

Python 2023年8月11日
0049
如何创建Django项目

创建Django 项目前置条件：已完成 Python环境和 PyCharm安装 Django的安装和项目的创建 | 在命令行输入pip 命令安装 pip install -i ht…

Python 2023年10月30日
0047
java启动scrapy爬虫_如何用脚本方式启动scrapy爬虫

众所周知，直接通过命令行scrapy crawl yourspidername可以启动项目中名为yourspidername的爬虫。在python脚本中可以调用cmdline模块来…

Python 2023年10月3日
0040
豆瓣高分电影爬取

仅供学习交流研究参考 1. 爬取基本步骤：发送请求，确定url地址，然后发送请求获取请求，获取服务器返回的响应数据解析数据，获取我们想要的数据保存数据多页数据爬取 2. …

Python 2023年6月15日
0065
搭建Python+Django+Requests+Pytest+Alure接口自动化框架

1.新建Django项目以及项目配置一、新建app python manage.py startapp app 二、settings文件配置 ALLOWED_HOSTS = [&…

Python 2023年8月6日
00106
python爬虫，将天气预报可视化

文章目录 * – 🏅 前言 – ⚔ 结果展示 – ⚔ 程序代码 – ⚔ 期望 – ⚔ 完善（2022.1.5） 🏅 前言…

Python 2023年8月30日
0050
scrapy启动流程图（3）——engine.py的内部运作图(1)

这就是回调地狱！！！同志们不要学！！！所有的异常和数据处理下载等都被绑在request相关的deferred对象里了本文解释了运行 scrapy crawl xxspider …

Python 2023年10月5日
0047
使用django框架对mysql数据库进行操作

1.确保本机已经安装了mysql，可以使用mysql –version查看 2.在pycharm中用下列命令创建django项目 python manage.py st…

Python 2023年8月6日
0076
pandas按条件过滤_python – pandas：按多个条件过滤组？

我有一个如下所示的数据框： df = pd.DataFrame([ {‘id’: 123, ‘date’: ‘2016-…

Python 2023年8月18日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

paddlepaddle模型的保存和加载

导读

模型保存和加载

; 模型参数的保存和加载

静态图模型参数和结构的保存

动态图转静态图的模型保存和加载

大家都在看