torch.optim.lr_scheduler 不同的学习率调整策略

2023年7月23日上午5:11 • 人工智能 • 阅读 65

torch.optim.lr_scheduler. StepLR(optimizer, step_size, gamma=0.1, last_epoch=- 1, verbose=False)

函数作用：

每隔step_size个epoch，将学习率衰减为（上一次的学习率 * gamma）

参数说明：

optimizer (Optimizer) – 训练过程中使用的优化器.
step_size (int) – 学习率每隔多少个epoch衰减一次
gamma (float) – 学习率的衰减系数，默认为0.1
last_epoch (int) – 没太搞懂，文档中只说了设置值为-1时，将初始的学习率设置为optimizer中使用的学习率
verbose (bool) – 如果为真，每次学习率更新时在控制台打印相应信息，默认为false。

使用方式如下：

def stepLr():
    lr = 0.1
    model = nn.Linear(10, 1)
    optimizer = torch.optim.Adam(model.parameters(), lr=lr)
    scheduler = lr_scheduler.StepLR(optimizer, step_size=3, gamma=0.1)

    print(optimizer.state_dict())

    for epoch in range(100):
        optimizer.step()
        scheduler.step()
        print(optimizer.state_dict()['param_groups'][0]['lr'])

打印结果：

{'param_groups': [{'weight_decay': 0, 'eps': 1e-08, 'betas': (0.9, 0.999), 'amsgrad': False, 'lr': 0.1, 'initial_lr': 0.1, 'params': [139656888615128, 139658298281128]}], 'state': {}}
0.1
0.1
0.010000000000000002
0.010000000000000002
0.010000000000000002
0.0010000000000000002
0.0010000000000000002
0.0010000000000000002

torch.optim.lr_scheduler. LambdaLR(optimizer, lr_lambda, last_epoch=- 1, verbose=False)

函数作用：

根据设定的lambda表达式，设定每个epoch的学习率

参数说明：

optimizer (Optimizer) – 训练过程中使用的优化器.
lr_lambda (function or list) – 一个lambda表达式，用来计算当前epoch的学习率
last_epoch (int) – 同上
verbose (bool) – 同上

使用方式如下：

def lambdaLr():
    lr = 0.1
    model = nn.Linear(10, 1)
    optimizer = torch.optim.Adam(model.parameters(), lr=lr)
    lambda1 = lambda epoch: epoch / 10
    scheduler = lr_scheduler.LambdaLR(optimizer, lambda1)

    print(optimizer.state_dict())

    for epoch in range(5):
        optimizer.step()
        scheduler.step()
        print(optimizer.state_dict()['param_groups'][0]['lr'])

打印结果：

{'param_groups': [{'lr': 0.0, 'betas': (0.9, 0.999), 'params': [140612683161816, 140614092827816], 'initial_lr': 0.1, 'weight_decay': 0, 'amsgrad': False, 'eps': 1e-08}], 'state': {}}
0.010000000000000002
0.020000000000000004
0.03
0.04000000000000001
0.05

torch.optim.lr_scheduler. MultiStepLR(optimizer, milestones, gamma=0.1, last_epoch=- 1, verbose=False)

函数作用：

可以设置多个epoch断点，当达到设定的epoch时，按照给定的gamma衰减（可以参考StepLR）

参数说明：

optimizer (Optimizer) – 训练过程中使用的优化器.
milestones (list) – 一个设定断点的epoch列表，列表中元素必须递增
gamma (float) – 学习率的衰减系数，默认为0.1
last_epoch (int) – 同上
verbose (bool) – 同上

使用方式如下：

def multiStepLr():
    lr = 0.1
    model = nn.Linear(10, 1)
    optimizer = torch.optim.Adam(model.parameters(), lr=lr)
    scheduler = lr_scheduler.MultiStepLR(optimizer, milestones=[3, 8], gamma=0.1)

    print(optimizer.state_dict())

    for epoch in range(10):
        optimizer.step()
        scheduler.step()
        print(optimizer.state_dict()['param_groups'][0]['lr'])

打印结果：

{'param_groups': [{'betas': (0.9, 0.999), 'eps': 1e-08, 'initial_lr': 0.1, 'weight_decay': 0, 'params': [140349444681944, 140350854339752], 'amsgrad': False, 'lr': 0.1}], 'state': {}}
0.1
0.1
0.010000000000000002
0.010000000000000002
0.010000000000000002
0.010000000000000002
0.010000000000000002
0.0010000000000000002
0.0010000000000000002
0.0010000000000000002

其他的一些像torch.optim.lr_scheduler.ExponentialLR，torch.optim.lr_scheduler.CosineAnnealingLR均是随着epoch的变化来调整学习率的

torch.optim.lr_scheduler. ReduceLROnPlateau(optimizer, mode=’min’, factor=0.1, patience=10, threshold=0.0001, threshold_mode=’rel’, cooldown=0, min_lr=0, eps=1e-08, verbose=False)

函数作用：

根据一些设定的指标改变学习率

参数说明：

optimizer (Optimizer) – 训练过程中使用的优化器.
mode (str) –选择max或min。选择min后，当检测指标停止下降后，学习率会衰减；选择max后，当检测指标停止上升后，学习率会衰减。
factor (float) –学习率的衰减因子。new_lr = lr * factor，默认为0.1
patience (int) –当设定的指标没有进一步提升时设置在几个epoch之后执行学习率衰减。默认设为10.
threshold (float) – 一般不用
threshold_mode (str) – 一般不用
cooldown (int) – 一般不用
min_lr (float or list) – 一般不用
eps (float) –学习率的最小衰减，如果新的学习率和旧的学习率之差小于设定值，则不进行学习率的更新（此时学习率太小，梯度下降没有意义）
verbose (bool) – 同上

使用方式如下：

optimizer = torch.optim.SGD(model.parameters(), lr=0.1, momentum=0.9)
scheduler = ReduceLROnPlateau(optimizer, 'min')
for epoch in range(10):
    train(...)
    val_loss = validate(...)
    # Note that step should be called after validate()
    scheduler.step(val_loss)

Original: https://blog.csdn.net/weixin_47062807/article/details/121581468
Author: weiweiweimengting
Title: torch.optim.lr_scheduler 不同的学习率调整策略

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/710125/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

torch.load()加载模型及其map_location参数

函数格式为： torch.load(f, map_location=None, pickle_module=pickle, **pickle_load_args)，一般我们使用的时…

人工智能 2023年6月23日
0062
回归特征选取_Meta回归分析的原理与应用

最近有两篇论文，分别是发表于2018年的A History of Meta-regression：Technical， Conceptual， and Practical Deve…

人工智能 2023年6月18日
00134
linux上的tensorflow 2.4.1-gpu c++接口编译并用其运行.pb模型

System information OS Platform and Distribution : ( Ubuntu 18.04)TensorFlow installed from…

人工智能 2023年5月25日
0090
pip使用中科大源、清华源或修改默认源为中科大源、清华源

临时使用中科大源、清华源 (windows、ubuntu 下均可) 1、下载某一个文件的时候，临时使用中科大源，加上如下后缀就行 -i https://pypi.mirrors.u…

人工智能 2023年6月17日
00138
神经网络水印（文章解读Dataset Inference: Ownership Resolution in Machine Learning）

这篇发在ICPR上。介绍了一种数据集推理的方法（dataset inference）。实际上也是模型水印方法，但是却属于完全不同的大类。之前介绍的模型水印的方法，其实大概就两种，一…

人工智能 2023年7月13日
0070
一维信号的频域特征分析python

频域分析是按照频率观察信号特征。在一般情况下，我们分析信号习惯从时域方向开始，因为时域的分析更加直观，但频域的表示更加简洁，从这方面去分析对信号了解更加深刻。通过分析振动信号…

人工智能 2023年6月23日
00126
【深度学习】基于卷积神经网络（tensorflow）的人脸识别项目（一）

活动地址：CSDN21天学习挑战赛目录前言基本思路关于环境 OpenCV * OpenCV具有的特征 OpenCV具有的功能安装OpenCV 关键API &#8211…

人工智能 2023年6月18日
0089
Hypergraph Neural Networks超图神经网络

摘要：提出了一种超图表示学习的超图卷积网络，包括一种新的超图卷积操作来挖掘用户之间的关系。引言：图神经网络可以使用数据图结构，编码不同数据。传统GCN存在的问题：①不能表达成…

人工智能 2023年7月13日
0074
YOLOFastestv2 训练自己的数据集—辛酸仨小时

首先下载YOLOFastestv2：https://github.com/dog-qiuqiu/FastestDet 我是训练的行人目标检测。yolofastestv2需要数据集格…

人工智能 2023年6月29日
0079
车辆行驶PID控制C#仿真（自动驾驶）

C#窗体程序仿真直线自动驾驶界面平台：1.visual studio20192.C#窗体应用（.NET Framework 4.7.2）3.附带文件中已经放入了.NET Fram…

人工智能 2023年6月10日
0094
python 因子分析

目录一、算法作用二、案例 1、关于数据 2、数据标准化 3、适用性检验 3.1 KMO和Bartlett球形检验 4、因子提取 4.1 数据原始特征值、方差贡献率 5 因子旋转…

人工智能 2023年6月24日
0084
【深度学习】Pytorch实现CIFAR10图像分类任务测试集准确率达95%

文章目录 * – 前言 – CIFAR10简介 – Backbone选择 – 训练+测试 – + 训练环境及超参设置 +…

人工智能 2023年6月16日
00100
pandas用均值填充nan_pandas DataFrame：用列的平均值替换nan值

小编典典你可以直接使用DataFrame.fillna来nan直接填充： In [27]: df Out[27]: A B C 0 -0.166919 0.979728 -0.6…

人工智能 2023年7月8日
0076
人工智能基础：机器学习常见的算法介绍

目录监督学习 1.1 分类 1.2 回归无监督学习 2.1 聚类 2.2 降维 3、半监督学习 4、迁移学习 5、强化学习（ReinforcementLearning， RL）…

人工智能 2023年6月26日
0083
图像基础操作——读取、显示、保存

一幅被定义为二维函数f（x，y）坐标的图像，亮度为任何坐标（x，y）处的振幅。当f的x，y和振幅都是有限且离散的量时，称为数字图像。一、读取图像：imread（’f…

人工智能 2023年7月19日
0080
NLP-二分类的应用-区分外卖评论好评/差评

目录一、概念二、二分类实战-划分好评/差评 * – 1.处理步骤 2.实战代码一、概念文本分类一般可以分为二分类、多分类、多标签分类三种情况。二分类是指将一组…

人工智能 2023年5月31日
00100

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

torch.optim.lr_scheduler 不同的学习率调整策略

大家都在看