tensorflow笔记(二十六）——tf.estimator模型文件保存和加载

2023年5月25日下午2:18 • 人工智能 • 阅读 87

Estimator可以保存 ckpt和 saved_model两种格式的模型。
ckpt方式与session.run模型下保存模型格式一样（在sess.run模式下，通常使用saver = tf.train.Saver()和saver.save()保存模型)，这种模型文件需要原始模型代码才能运行，一般用于训练中保存/加载权重。
saved_model格式是一种轻量化的模型，不仅包含权重值，还包含计算。它不需要原始模型构建代码就可以运行，因此，对共享和部署（使用 TFLite、TensorFlow.js、TensorFlow Serving 或 TensorFlow Hub）非常有用。比如使用spark进行infer的时候可以加载这种格式的模型，或者用TensorFlow Serving在线推理。（用于推理的模型导出格式还有FrozenGraph、HDF5、tfLite等，可以参考tensorflow 模型导出总结)

1.1 ckpt文件

整个模型其实包含4个文件：

model.ckpt-xxxxx.data-00000-of-00001：保存当前参数值。比如网络的权值，偏置，操作等等。
model.ckpt.index ：保存当前参数名。二进制或者其他格式，不可直接查看。一个不可变的字符串表，每一个键是张量的名称，它的值是一个序列化的BundleEntryProto，每个BundleEntryProto描述张量的元数据：”数据”文件中的哪个文件包含张量的内容，该文件的偏移量，校验和，一些辅助数据等等。
model.ckpt.meta：某个ckpt的meta数据二进制或者其他格式不可直接查看，保存了TensorFlow计算图的结构信息。model.ckpt-200.meta：保存图结构。通俗地讲就是神经网络的网络结构。
checkpoint：文本文件，记录了保存的最新的checkpoint文件以及其它checkpoint文件列表。

如何保存ckpt文件？train()中包含了ckpt的保存，直接调用train就好，不需要额外的保存操作：


run_config = tf.estimator.RunConfig(
        model_dir=args.model_dir,
        save_checkpoints_steps=1000,
        keep_checkpoint_max=3)

estimator = tf.estimator.Estimator(model_fn=model_fn, config=run_config)

estimator.train(input_fn=train_input_fn)

1.2 saved_model文件

包含saved_model.pb文件和一个variables目录，该目录下有两个文件：variables.data-00000-of-00001和variables.index两个文件。

saved_model.pb：保存模型结构
variables.data-00000-of-00001：保存变量值
variables.index：保存变量名

需要显式调用export_saved_model函数来保存，需要制定保存路径，制定数据input的格式（推理的时候需要根据格式处理数据），as_text指定是否按照ASCII编码格式写入到文件里。

estimator.train(input_fn=train_input_fn)

estimator.export_saved_model(
                args.pb_export_dir,
                tf.estimator.export.build_parsing_serving_input_receiver_fn(
                    feature_spec),
                as_text=False)

关于saved_model，我们后面再写一篇用spark加载saved_model模型进行离线infer的文章，这里知道不再细讲。

正如tf.estimator没有显式地保存ckpt模型，也不需要显式地load_model，而是通过定义Estimator的时候来指定模型路径 model_dir，训练、评估、预测都会用到这个model_dir，具体来说训练的时候保存到model_dir，评估和预测从model_dir读取模型文件。
指定model_dir也有两种方式，一是通过RunConfig配置，二是Estimator初始化参数model_dir传递，如下：


run_config = tf.estimator.RunConfig(
        model_dir=args.train_log_dir,
        session_config=config,
        save_checkpoints_steps=args.check_point_num,
        log_step_count_steps=args.log_every_n_steps)
estimator = tf.estimator.Estimator(model_fn=model_fn, config=run_config)

tf.estimator.Estimator(model_fn, model_dir=None, config=None, params=None, warm_start_from=None)

之前一次测试的时候，发现预测概率全部在0.5左右，最后发现是模型加载没有成功，预测结果其实是随机初始化的模型预测结果，所以概率都是0.5。怎么发现是模型没有加载成功呢？我把模型路径下的文件清空了之后预测，没有报错且预测概率就是0.5附近。然后为什么没有加载成功呢，是因为我的模型从平台存储空间上拷贝到测试机上时，只拷贝了model.ckpt-30000.data-00000-of-00001文件，这是不完整的。为什么没有模型也能预测呢？
看estimator.predict函数源码注释：

 def predict(self,
              input_fn,
              predict_keys=None,
              hooks=None,
              checkpoint_path=None,
              yield_single_examples=True):

checkpoint_path: Path of a specific checkpoint to predict. If None, the latest checkpoint in model_dir is used. If there are no checkpoints in model_dir, prediction is run with newly initialized Variables instead of ones restored from checkpoint.

注释清楚地说如果model_dir路径下没有checkpoint文件，就用最新初始化的参数进行预测，那预测出来的结果就是随机了。
为什么要这样设计？我猜测是在训练和评估的时候，计算loss的时候也要调用predict来计算输出值，但计算loss的时候未必有checkpoint，所以也是需要在没有模型的情况下来预测的。

Original: https://blog.csdn.net/hongxingabc/article/details/119977777
Author: starxhong
Title: tensorflow笔记(二十六）——tf.estimator模型文件保存和加载

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/514568/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

单目 3D 目标检测——SMOKE

😸 SMOKE 主要工作：提出一种端到端的 单目 3D 目标检&am…

人工智能 2023年7月10日
0044
卷积层是否会引起过拟合问题？如何应对过拟合

问题描述在卷积神经网络（Convolutional Neural Network, CNN）中，卷积层是其中一个核心组成部分。然而，在使用卷积层时，我们常常会面临过拟合（over…

人工智能 2024年1月5日
0042
目标检测：树莓派运行YOLOv5，成功运行，附完整镜像源

树莓派：目标检测一、前言二、树莓派深度学习环境镜像：三、基于深度学习环境镜像搭建YOLOv5 * 1、将python设置成默认python3 2、安装pytorch 3、安装…

人工智能 2023年6月16日
00198
python深度学习机器学习必备的学习网站集合！

文章目录目录文章目录前言一、Papers With Code 推荐理由适合人群二、DLab教学与实训平台推荐理由适合人群优质教程(可选) 基于PyTorch搭建C…

人工智能 2023年6月26日
0051
OpenCV-Python＜八＞图像平滑处理

消除图像中的噪音成分，叫做图像的平滑处理或者图像滤波。即在尽量保留图像细节特征的情况下对目标图像的噪声进行抑制。它是图像预处理过程中不可缺少的步骤。处理效果的好坏将直接影响到后续图…

人工智能 2023年7月19日
0061
【深度学习】肺结节分割项目实战一：处理数据集

主要参考此教程完成的实验一、LIDC-IDRI数据集简介官方网站肺图像数据库协会的图像收集(LIDC-IDRI)包括诊断和带有病变注释标记的肺癌筛查胸部CT。这是一个网络…

人工智能 2023年6月17日
0065
头歌Python实训答案——函数二

第1关：函数的参数 – 搭建函数房子的砖编程要求本关的编程任务是补全 src/Step1/plus.py文件的代码，实现相应的功能。具体要求如下：定义函数 plu…

人工智能 2023年7月5日
00106
样本不平衡的解决方案（很详细）

举个例子，在广告CTR预估场景中，正负样本的占比可以达到1：500，点击的正样本是少数类，没点击的负样本为多数类。如果直接拿这个比例去训练模型的话，很容易学出一个把所有样本都…

人工智能 2023年6月15日
0063
蟒蛇书学习笔记——Chapter 09 Section 01 创建和使用类【第九章 1/3】

9.1.1 创建Dog类根据Dog类创建的每个实例都将存储名字和年龄，我们赋予了每条小狗蹲下(sit( ))和打滚(roll_over( ))的能力： class Dog: &q…

人工智能 2023年6月4日
0096
对话预训练_NLP中的预训练语言模型（一）—— ERNIE们和BERT-wwm

随着bert在NLP各种任务上取得骄人的战绩，预训练模型在这不到一年的时间内得到了很大的发展，本系列的文章主要是简单回顾下在bert之后有哪些比较有名的预训练模型，这一期先介绍几个…

人工智能 2023年6月10日
0080
解决 error: (-215:Assertion failed) _src.empty() in function ‘cv::cvtColor‘

im, im_info = decode_image(im, im_info) File “D:\PyCharm\Deployment\deploy_water\pyt…

人工智能 2023年6月18日
0081
基于R语言的数据分析报告

基于R语言的数据分析报告（很多同学私信反馈通过kaggle没办法下载数据集，我把数据集上传到百度云供大家取用，链接:https://pan.baidu.com/s/1S48WWm…

人工智能 2023年6月19日
0092
opencv-python学习笔记（十一）：HOG+SVM进行行人检测全过程

引言本次是接着python-opencv学习笔记（七）：滑动窗口与图像金字塔一起在实验楼所做实验，为啥中间隔了四篇才接着发出来，主因是我发文比较随意（懒），当时这部分并没有总结…

人工智能 2023年5月28日
0067
RNA-seq Review：RNA-seq数据分析

文献：RNA-seq数据分析最佳实践调查 Genome Biology 2016 ReviewA survey of best practices for RNA-seq data…

人工智能 2023年7月16日
0058
pandas取dataframe特定行/列

1.按列取、按索引/行取、按特定行列取 python;gutter:true; import numpy as np from pandas import DataFrame im…

人工智能 2023年6月2日
0068
图像处理之空间滤波二: 平滑滤波器

图像处理之空间滤波二: 平滑滤波器平滑滤波器平滑滤波器用于模糊处理和降低噪声. 常应用于预处理任务中, 例如在大目标提取之前去除图像中的一些琐碎细节, 以及桥接直线或曲线的…

人工智能 2023年6月20日
0079

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

tensorflow笔记(二十六）——tf.estimator模型文件保存和加载

1.1 ckpt文件

1.2 saved_model文件

大家都在看