【Pytorch-从一团乱麻到入门】：6、Pytorch 选择最终模型的方式：save best model & early stop

2023年7月23日上午2:08 • 人工智能 • 阅读 87

在模型训练时一般会进行多轮，那么到底哪一轮训练出来的模型是最优的呢？如果在脚本中挑选出最合适的模型呢？

针对上述问题，一般会有如下几种解决方法；

1、最占用存储但是却是最稳妥的方法：每一轮的模型都保存，模型保存方式为：

torch.save(model, "model.pkl")

2、早停机制，即在训练时保存效果在一定范围内不再提升时的模型。

早停机制是一种正则化的手段，用于避免训练数据集上的过拟合。早期停止会跟踪验证损失（val_loss），如果损失连续几个 epoch 停止下降，训练就会停止。

pytorch提供了实现早停机制的相遇脚本：pytorchtool.py ，下载路径为：

其中的 EarlyStopping 类用于创建一个对象，以便在训练 PyTorch 模型时跟踪验证损失。每次验证丢失减少时，它都会保存模型的一个检查点，在EarlyStopping类中设置了patience参数，即在最后一次验证损失改善后，我们希望在中断训练循环之前等待多少个epochs，在等待了patience个epoch后，如果模型效果不下降，那么这次模型则被保存为best-model.

具体使用方式为：

下载earlystop 脚本，然后将脚本放在模型训练脚本同一路径下，具体使用方式为：

import EarlyStopping

from pytorchtools import EarlyStopping

在模型训练中：

early_stopping = EarlyStopping(patience=20, verbose=True) ###20次都不下降则为best model

early_stopping(val_loss, model)

if early_stopping.early_stop:
            print("The Early stopping epoch is this：",epoch)
            #stop_epoch=epoch
            break
#####保留last  checkpoint with the best model
model.load_state_dict(torch.load('checkpoint.pt'))

程序会自动搜索loss不再下降的点，持续训练patience次后不再下降即停止并保存模型。

此部分参考如下：

3、保存损失函数不再下降的模型/保存测试集准确性最高的模型/保存测试集AUC最高的模型

此方法实现起来较为简单，根据实际情况在模型训练时记录每次产生的loss/acc/AUC值，每次进行一次判断，例如：若loss变低，则保留此次模型，若loss值变高，则保持上次保存的模型。

备注：此方法容易选出极端模型结果，使用时需要小心。

具体使用方法为：

best_acc=0.0

#####复制模型的参数
best_model_wts=copy.deepcopy(model.state_dict())

###拷贝模型最高精度下的参数
if val_acc_all[-1]>best_acc:
    best_acc=val_acc_all[-1]
    best_model_wts=copy.deepcopy(model.state_dict())
    time_use=time.time()-since
    print("Train and val complete in {:.0f}m {:.0f}s".format(time_use//60,time_use%60))
###使用最好模型的参数
model.load_state_dict(best_model_wts)

Original: https://blog.csdn.net/qq_40815731/article/details/123099603
Author: 李毛线的博客
Title: 【Pytorch-从一团乱麻到入门】：6、Pytorch 选择最终模型的方式：save best model & early stop

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/709927/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

数据科学必备Python使用Pandas数据重塑及透视表

大家好，我是Mr数据杨。让我们一起走进Python的世界，揭开它在数据处理中的神秘面纱。让我带你走进《三国演义》，看看Python在三国演义中的应用。想象一下，假如诸葛亮在草船借箭…

人工智能 2023年7月7日
0063
win10系统上安装pytorch3D

首先感谢前人的经验文章，使我少走不少弯路。最近三维视觉的文章越来越多，CVPR2022的三维视觉文章已经有了很大的比重。而最近关于点云的文章越来越多的使用pytorch3D来直接训…

人工智能 2023年7月23日
0060
C++类模板的重载

由于在看 QT5.15.2中的 connect方法中的 typedef QtPrivate::FunctionPointer<func1> SignalType;&lt…

人工智能 2023年6月29日
0067
召回率（rec），准确率（acc），精确率（pre），F1值

这几天在看有关ABSA论文的代码，而代码跑出来的结果除了有输出loss的值以外还有一个acc的值和一个F1的值。查看了网上对于一些博客以后，对于模型的这三个评价指标有了一个新的认识…

人工智能 2023年6月15日
0082
轻量化网络总结[1]–SqueezeNet，Xception，MobileNetv1~v3

笔者还写了《轻量化网络总结[2]–ShuffleNetv1/v2，OSNet，GhostNet》，点击即可查看轻量化网络 * – 1. SqueezeNet &#8…

人工智能 2023年7月13日
0049
pandas-21 Series和Dataframe的画图方法

pandas-21 Series和Dataframe的画图方法前言在pandas中，无论是series还是dataframe都内置了.plot()方法，可以结合plt.show…

人工智能 2023年6月2日
0098
DLA模型(分类模型+改进版分割模型) + 可变形卷积

Deep Layer Aggregation (DLA) 是一种网络特征融合方法，发表于CVPR 2018。相比传统串联的卷积网络，其典型特点是实现了不同层级的深度融合，相比目标检…

人工智能 2023年7月29日
0055
《智能计算系统》实验-7-1-YOLOv3

在做《智能计算系统》综合实验7-1-YOLOv3时，遇到了很多问题，实验书过程不全，现将整个实验流程梳理如下，以对其他读者有所裨益：一、搭建环境新建容器v7（非v7-updat…

人工智能 2023年7月27日
0061
本科生学深度学习-史上最容易懂的RNN文章

好的，这是一个文本分类的任务，我们可以使用 RNN_来实现。首先，我们需要下载Reuters –21578数据集，可以从这个链接下载：https://archive….

人工智能 2023年7月13日
0052
AttributeError: ‘DataFrame‘ object has no attribute ‘ix‘解决办法

问题原因 pandas版本0.20.0及其以后版本中，ix已经不被推荐使用问题解决使用loc和iloc替换 loc loc从索引中获取具有特定标签的行（或列）。这里的关键是：标…

人工智能 2023年7月8日
00105
残差块与Normalize的作用

ResNet 残差神经网络：假如某个神经网络的最优网络层数是18层，但是我们在设计的时候并不知道到底多少层是最优解，本着层数越深越好的理念，我们设计了32层，那么32层神经网络中有…

人工智能 2023年7月13日
0069
[论文研读] 2021A01 知识图谱在小米的应用与探索

知识图谱在小米的应用与探索，作者为小米公司的彭力(小米公司)，发表在开放知识图谱公众号, 日期为 2020.11.18。作者彭力，ID小米AI Lab知识图谱高级软件工程师，参与I…

人工智能 2023年6月1日
0082
对于迷宫图像的信息提取以及A*路径规划

笔者目前需要对获得的图像进行处理，提取一些关于通道的信息，并且对于通道进行一个路径规划，规划一个最优路径，但是在使用A*路径规划的过程中出行一些问题，希望有大佬能解决问题。笔者在…

人工智能 2023年7月19日
0071
matlab训练神经网络模型并导入simulink详细步骤

之前的神经网络相关文章： Matlab-RBF神经网络拟合数据 Matlab RBF神经网络及其实例 4.深度学习(1) –神经网络编程入门本文介绍一下怎么把训练好的…

人工智能 2023年7月12日
0091
什么是目标检测？有哪些应用？终于有人讲明白了

导读：计算机视觉（Computer Vision，CV）是一门教计算机如何”看”世界的学科。计算机视觉包含多个分支，其中图像分类、目标检测、图像分割、目标跟…

人工智能 2023年6月24日
00100
matlab添加文件夹语音_Matlab批量处理指定文件夹下的所有音频文件

filedir=’E:/source/Wavfile/*.wav’; % 设置路径 outfiledir=’E:/output/Wavfile/…

人工智能 2023年5月27日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【Pytorch-从一团乱麻到入门】：6、Pytorch 选择最终模型的方式：save best model & early stop

大家都在看