Pytorch lr_scheduler.LambdaLR()的简单理解与用法

2023年7月21日下午2:53 • 人工智能 • 阅读 105

官方文档：https://pytorch.org/docs/1.10.1/generated/torch.optim.lr_scheduler.LambdaLR.html

在python中，有个东西叫做匿名函数(lambda表达式)，能够用于很方便的定义各种规则，这个LambdaLR也就可以理解成自定义规则去调整网络的学习率。从另一个角度理解，数学中的λ \lambda λ一般是作为系数使用，因此这个学习率调度器的作用就是 将初始学习率乘以人工规则所生成的系数λ \lambda λ。

函数结构如下：

torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda, last_epoch=-1, verbose=False)

参数：

optimizer：被调整学习率的优化器
lr_lambda：用户自定义的学习率调整规则。可以是lambda表达式，也可以是函数
last_epoch：当前优化器的已迭代次数，后文我们将其称为epoch计数器。默认是-1，字面意思是第-1个epoch已完成，也就是当前epoch从0算起，从头开始训练。如果是加载checkpoint继续训练，那么这里要传入对应的已迭代次数
verbose：是否在更新学习率时在控制台输出提醒

一个例子如下。 考虑epoch从0算起，比如我们想每3个epoch(即在第2，5，8个epoch 结束后)将学习率减半，代码如下：

import torch
from torch import nn
import math

class Net(nn.Module):
    def __init__(self):
        super().__init__()
        self.conv = nn.Conv2d(in_channels=1,out_channels=1,kernel_size=2,stride=1,padding=0)
    def forward(self,x):
        out = self.conv(x)
        return out

net = Net()

def rule(epoch):
    lamda = math.pow(0.5, int(epoch / 3))
    return lamda
optimizer = torch.optim.SGD([{'params': net.parameters(), 'initial_lr': 0.1}], lr = 0.1)
scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda = rule)

for i in range(9):
    print("lr of epoch", i, "=>", scheduler.get_lr())
    optimizer.step()
    scheduler.step()

输出如下：

lr of epoch 0 => [0.1]
lr of epoch 1 => [0.1]
lr of epoch 2 => [0.1]
lr of epoch 3 => [0.05]
lr of epoch 4 => [0.05]
lr of epoch 5 => [0.05]
lr of epoch 6 => [0.025]
lr of epoch 7 => [0.025]
lr of epoch 8 => [0.025]

理解LambdaLR的核心在于，自定义规则函数只有一个参数，即当前的epoch，这个参数是scheduler自己传进去的。如果没有特殊指明的话，是从 0开始(因为外面的超参last_epoch-1表示-1已结束，因此从0开始)，每step一次加1；可以验证如下，在rule里面加一行：

def rule(epoch):
    print("current epoch =>", epoch)
    lamda = math.pow(0.5, int(epoch / 3))
    return lamda

为了方便这里观察，在输出的时候加了换行：

for i in range(9):
    print()
    print("lr of epoch", i, "=>", scheduler.get_lr())
    optimizer.step()
    scheduler.step()

结果如下：

current epoch => 0

current epoch => 0
lr of epoch 0 => [0.1]
current epoch => 1

current epoch => 1
lr of epoch 1 => [0.1]
current epoch => 2

current epoch => 2
lr of epoch 2 => [0.1]
current epoch => 3

current epoch => 3
lr of epoch 3 => [0.05]
current epoch => 4

current epoch => 4
lr of epoch 4 => [0.05]
current epoch => 5

current epoch => 5
lr of epoch 5 => [0.05]
current epoch => 6

current epoch => 6
lr of epoch 6 => [0.025]
current epoch => 7

current epoch => 7
lr of epoch 7 => [0.025]
current epoch => 8

current epoch => 8
lr of epoch 8 => [0.025]
current epoch => 9

这个传入的rule函数会在三种情况下调用：

scheduler被创建时。因此可以看到一开始输出了个current epoch => 0。
调用get_lr()方法时。这里有一点特别需要注意，get_lr()本质上就是将内置的epoch计数器传进rule方法，然后拿一个lambda出来，lambda乘以初始学习率就是当前学习率。而get_last_lr()则不会有这一过程。
调用scheduler.step()方法时。这个时候内置的epoch计数器会加一，并依据规则更新学习率。

而要恢复训练也很简单，只需要修改两个地方。首先，在恢复训练的情况下，被乘以的初始学习率由必须由优化器的’initial_lr’值指定：

optimizer = torch.optim.SGD([{'params': net.parameters(), 'initial_lr': 0.1}], lr = 0.1)

initial_lr是可以覆盖掉lr的。其次，last_epoch值修改为已完成的epoch数。比如我们想从第5个epoch开始，那么last_epoch就是4，修改如下：

scheduler = torch.optim.lr_scheduler.LambdaLR(optimizer, lr_lambda = rule, last_epoch=4)

并修改用于训练的while循环：

for i in range(5, 9):
    print()
    print("lr of epoch", i, "=>", scheduler.get_lr())
    optimizer.step()
    scheduler.step()

结果如下：

current epoch => 5

current epoch => 5
lr of epoch 5 => [0.05]
current epoch => 6

current epoch => 6
lr of epoch 6 => [0.025]
current epoch => 7

current epoch => 7
lr of epoch 7 => [0.025]
current epoch => 8

current epoch => 8
lr of epoch 8 => [0.025]
current epoch => 9

可以看到同样在第5个epoch结束后调整了学习率。

Original: https://blog.csdn.net/qq_40714949/article/details/126287769
Author: xiongxyowo
Title: Pytorch lr_scheduler.LambdaLR()的简单理解与用法

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/707256/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

第十一课：树莓派语音控制空调

目录一、硬件平台准备二、软件平台准备三、空调解码 (1) 第一步：编解码模块与TTL串口连接 (2)获取空调解码值（遥控器对着编解码模块按下）四、语音模块(采用云平台设置语…

人工智能 2023年5月25日
00104
【Python】循环遍历Numpy中的Array

引言 Numpy是Python中常见的数据处理库。Numpy是 Numerical Python的缩写，它是数据科学中经常使用的库。Numpy专门用于处理矩阵运算，因为它包含各式各…

人工智能 2023年7月5日
0084
智能家居项目开发准备工作

智能家居功能细节拆分：控制端支持语音设备的输入（用到之前所学习的LD3320语音识别模块）或者是socket客户端（这个客户端可以是ftp项目的客户端也可以是Android的ap…

人工智能 2023年5月25日
00110
CutMix原理与代码解读

paper： CutMix: Regularization Strategy to Train Strong Classifiers with Localizable Featur…

人工智能 2023年7月28日
00108
S2ANet(Align Deep Features for Oriented Object Detection)解读

; S2ANet解读开始入门遥感方向，第一篇看了S2ANet，看了下网上的博客基本就很浅薄地谈了谈Abstract里面的内容，也没有对其进行argue，然后我来做这件事。如果有错…

人工智能 2023年7月10日
0067
目标检测算法——YOLOV7——详解

1、主要贡献主要是现有的一些trick的集合以及模块重参化和动态标签分配策略，最终在 5 FPS 到 160 FPS 范围内的速度和准确度都超过了所有已知的目标检测器。当前目标…

人工智能 2023年5月26日
0057
将数据导入R语言

背景介绍大家平时在使用R语言的时候，首先要做的事将数据导入进来R，然后进行一系列的数据处理，作图等等！那么有没有一种比较简单的、快速的将数据（Excel中的数据，Text文本中…

人工智能 2023年7月16日
0068
365天深度学习训练营-第P1周：实现mnist手写数字识别

🍨 本文为🔗365天深度学习训练营内部限免文章（版权归 K同学啊所有） 🍦 参考文章地址： 🔗第P1周：实现mnist手写数字识别 | 365天深度学习训练营 🍖 作者：K同学…

人工智能 2023年6月30日
00100
数字图像处理——实验五基于图像分割的车牌定位识别

数字图像处理——实验五基于图像分割的车牌定位识别一、实验目的二、实验主要仪器设备三、实验原理四、实验指导 * 4.1 车牌定位 4.2 分割区域灰度化、二值化 4.3 车…

人工智能 2023年7月27日
0048
OpenEuler安装保姆级教程 | 附可视化界面

文章目录 OpenEuler介绍与安装 * 一、OpenEuler简介 – （一）什么是欧拉（二）欧拉的优势二、安装的前期准备三、安装OpenEuler 四、安装…

人工智能 2023年7月26日
0083
自动驾驶中的多种卡尔曼滤波算法及推导详解，值得一读！

鉴于卡尔曼滤波算在多传感器融合系统中使用的普遍性，本文将单独就卡尔曼滤波算法及自动驾驶中常用的改进卡尔曼滤波算法进行详细介绍。首先介绍卡尔曼滤波的基本方法，然后介绍针对非线性系统…

人工智能 2023年6月16日
0086
【论文阅读】Hierarchical Multi-modal Contextual Attention Network for Fake News Detection — 虚假新闻检测，多模态

本博客系本人阅读该论文后根据自己理解所写，非逐句翻译，欲深入了解该论文，请参阅原文。论文标题：Hierarchical Multi-modal Contextual Attent…

人工智能 2023年7月3日
0068
上传项目代码到Github|Gitee

上传项目代码到Github|Gitee 文章目录上传项目代码到Github|Gitee * 1、前置准备 – 1.1 Git 安装 1.2 在 Git 中设置用户名 …

人工智能 2023年7月30日
0078
YOLO算法的发展历程

一目标检测问题目标检测问题是模式识别问题的一种，它主要解决从图像中获取需要的物体类型以及位置的问题，输入一幅图像或者一帧视频，要输出图像中要求物体的类别和位置，其中的位置通常用…

人工智能 2023年7月12日
0076
深度学习之使用Tensorflow搭建一个神经网络

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月23日
0080
简单回归之电表预测

文章目录前言一、场景描述二、落地实践三、完整代码总结前言以下内容是在学习过程中的一些笔记，难免会有错误和纰漏的地方。如果造成任何困扰，很抱歉。一、场景描述描述：这…

人工智能 2023年6月18日
0075

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Pytorch lr_scheduler.LambdaLR()的简单理解与用法

大家都在看