Pytorch-Lightning中的训练器—Trainer

2023年7月27日下午11:54 • 人工智能 • 阅读 41

参数名称含义默认值接受类型

添加回调函数或回调函数列表None(

默认值)Union[List[Callback], Callback, None]

是否使用callbacksTruebool

使用的gpu数量(int)或gpu节点列表(list或str)None(不使用GPU)Union[int, str, List[int], None]

指定训练精度32(

)Union[int, str]

模型保存和日志记录默认根路径None(

)Optional[str]

设置日志记录器(支持多个)，若没设置logger的

，则使用

True(默认日志记录)Union[LightningLoggerBase, Iterable[LightningLoggerBase], bool]

最多训练轮数(指定为**-1

无限次**)None(1000)Optional[int]

最少训练轮数None(1)Optional[int]

最大网络权重更新次数-1(禁用)Optional[int]

最少网络权重更新次数None(禁用)Optional[int]

权重保存路径(优先级高于

未定义路径时将使用该路径None(

)Optional[str]

更新n次网络权重后记录一次日志50int

自动搜索最佳batch_size并保存到模型的

中FalseUnion[str, bool]

自动搜索最佳学习率并存储到

FalseUnion[str, bool]

每k次batches累计一次梯度NoneUnion[int, Dict[int, int], None]

每n个train epoch执行一次验证1int

开始训练前加载n个验证数据进行测试，k=-1时加载所有验证数据2int

这里 max_steps/min_steps中的step就是指的是优化器的step，优化器每step一次就会更新一次网络权重
梯度累加(Gradient Accumulation)：受限于显存大小，一些训练任务只能使用较小的batch_size，但一般batch-size越大(一定范围内)模型收敛越稳定效果相对越好；梯度累加可以先累加多个batch的梯度再进行一次参数更新，相当于增大了batch_size。

Trainer.fit()

训练数据加载器None

验证数据加载器None

ckpt文件路径(从这里文件恢复训练)None

None

使用该参数指定一个模型ckpt文件（需要保存整个模型，而不是仅仅保存模型权重），Trainer将从ckpt文件的下一个epoch继续训练。

net = MyNet(...)
trainer = pl.Trainer(...)

trainer.fit(net, train_iter, val_iter, ckpt_path='./ckpt/myresult.ckpt')

请不要使用Trainer()中的resume_from_checkpoint参数，该参数未来将被丢弃，请使用Trainer.fit()的ckpt_path参数

Trainer.test()

None(使用fit()传递的模型)

是否打印测试结果True

测试数据加载器(可以使用

)None

ckpt文件路径(从这里文件恢复训练)None

None

Original: https://blog.csdn.net/qq_27135095/article/details/122635743
Author: 奈何桥边摆地摊
Title: Pytorch-Lightning中的训练器—Trainer

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/719378/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

百度PaddleOCR识别与训练及部署

1、安装python-3.9版本链接：https://pan.baidu.com/s/1IgF1RwGyV7Qu-FqspeloYg提取码：pn9k 2、安装PaddlePa…

人工智能 2023年7月12日
0067
python+OpenCv笔记（十一）：中值滤波

中值滤波：原理：中值滤波是一种典型的非线性滤波技术，基本思想是用像素点邻域灰度值的中值来代替该像素点的灰度值。应用：中值滤波对椒盐噪声来说尤其有用，因为它不依赖于邻域内那些…

人工智能 2023年5月28日
0077
【中文论文1】基于BERT-BIGRU的短文本多分类情感分析

BERT刚出来的时候发这篇论文还行，现在的话就毫无创新了。因为有了代码的经验，再看之前的那些论文似乎就觉得很容易了，今天这篇是很简单的一篇《基于 BERT-BiLSTM 的短文本…

人工智能 2023年7月3日
0072
Python输出字典的键和值

【小白从小学Python、C、Java】【Python全国计算机等级考试】【Python数据分析考试必会题】● 标题与摘要Python输出字典的键和值items()方法 ● 选择题…

人工智能 2023年7月5日
0096
方差分析ANOVA、单因素方差分析、协变量方差分析ANCOVA、重复测量方差分析、双因素方差分析（ two-way ANOVA）、多元方差分析MANOVA、多元协方差分析MANCOVA

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月11日
0057
深度学习面试题汇总大全（转）

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月16日
0070
第二十课.DeepGraphLibrary(一)

目录 DGL安装图 * 图与图的创建从外部源创建图异构图在GPU上运行DGL 消息传递范式 * 内置函数和消息传递API – 消息函数聚合函数更新函数单独…

人工智能 2023年6月1日
0061
机器学习之为什么要数据预处理？如何预处理数据？

在现实生活问题中，我们得到的原始数据往往非常混乱、不全面，机器学习模型往往无法从中有效识别并提取信息。数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限而已，在采集完数据…

人工智能 2023年6月15日
0097
基于C++和MATLAB实现的语音信号的处理与滤波

资源下载地址：https://download.csdn.net/download/sheziqiong/85793757资源下载地址：https://download.csdn….

人工智能 2023年5月27日
0058
入行数据分析要知道什么是统计

大家好，我是Mr数据杨！今天我要给大家介绍的是数据分析师学习笔记教程。听起来似乎有点枯燥？没关系，让我用《三国演义》中的例子来给大家讲解。想象一下，郭嘉是个数据分析师。他需要使用…

人工智能 2023年7月16日
0047
强化学习之AC、A2C和A3C

阅读本文可参考我以前的文章《强化学习实践教学》https://tianjuewudi.gitee.io/2021/07/16/qiang-hua-xue-xi-shi-jian-j…

人工智能 2023年7月13日
0053
关于ImportError: No module named ‘tensorflow‘报错的解决

问题：在使用pycharm运行python程序时报错： ImportError: No module named ‘tensorflow’ 环境： win10 64 python…

人工智能 2023年5月23日
0084
【Pandas】笔记内容001：“FutureWarning: The default value of regex will change from True to False…“解释说明

全志R16平台的Android6系统下调通rtl8189es 2017/8/28 9:41 版本：V1.1 1、干掉BT选项： Q:\r16m\rtl8189es_r16m\And…

人工智能 2023年7月5日
0077
【语音识别】Kaldi相关工具包及示例数据介绍

语言:Bahasa Indonesia,Bahasa Melayu,Deutsch,English,Filipino,Français,Kiswahili,Nederlands,N…

人工智能 2023年5月25日
0060
coco数据类型与voc数据类型的相互转换以及这两种类型的详细介绍。

声明：本文为作者将多篇文章以及自己的理解缝合而出的文章，仅用于交流与学习，本文代码均为转载，如有不正确之处敬请指正，侵删。参考文章：将coco数据集转换为voc格式_迷若烟雨的博客…

人工智能 2023年7月9日
0099
AttributeError: cannot assign module before Module.__init__() call

诸神缄默不语-个人CSDN博文目录运行环境，报错信息和查找到的错误内容：Linux系统Python 3.8（使用anaconda管理的虚拟环境）PyTorch 1.11+cuda…

人工智能 2023年7月21日
0046

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

Pytorch-Lightning中的训练器—Trainer

Trainer.fit()

Trainer.test()

大家都在看