优化算法之间的关系及各自特点的简单分析

2023年6月6日下午2:36 • 人工智能 • 阅读 78

1 优化算法

https://tangshusen.me/Dive-into-DL-PyTorch/#/chapter07_optimization/7.4_momentum

1.1 动量法

动量法是梯度下降法的改进。梯度下降法的自变量的迭代方向仅仅取决于自变量当前位置，这会带来问题。

动量法对之前 1 / (1 − γ)个时间步进行利用指数加权移动平均，使得自变量的更新方向更加一致，从而降低发散的可能。

1.2 AdaGrad算法

AdaGrad 同样是梯度下降法的改进。梯度下降法中目标函数自变量的每一个元素在相同时间步都使用同一个学习率来自我迭代，当存在梯度值相差较大的元素存在问题。

AdaGrad 通过维护 S t 变量对学习率 _η_进行调整，实现根据不同元素应用不同的学习率。具体作用表现为：如果目标函数有关自变量中某个元素的偏导数一直都较大，那么该元素的学习率将下降较快；反之，如果目标函数有关自变量中某个元素的偏导数一直都较小，那么该元素的学习率将下降较慢。

AdaGrad 存在缺点，由于 S t 一直在累加按元素平方的梯度，自变量中每个元素的学习率在迭代过程中一直在降低（或不变）。所以，当学习率在迭代早期降得较快且当前解依然不佳时，AdaGrad 算法在迭代后期由于学习率过小，可能较难找到一个有用的解。

1.3 RMSProp算法

RMSProp 是 AdaGrad 的改进。如上文所言，当学习率在迭代早期降得较快且当前解依然不佳时，AdaGrad算法在迭代后期由于学习率过小，AdaGrad 可能较难找到一个有用的解。

RMSProp 利用动量法中的指数加权移动平均思想对 AdaGrad 中维护的 S t 变量做指数加权移动平均，其可以看作是最近 1 / (1 − γ)个时间步的小批量随机梯度平方项的加权平均。如此一来，自变量每个元素的学习率在迭代过程中就不再一直降低（或不变）。

1.4 AdaDelta算法

AdaDelta 是 RMSProp 的改进。RMSProp 需要设定超参数学习率，AdaDelta 不需要。

AdaDelta 维护一个 Δx t 变量，代表有关自变量更新量平方的指数加权移动平均的项，使其代替学习率。

1.5 Adam算法

Adam 是 RMSProp 算法与动量法的结合。

Adam 可以看作是在 RMSProp 算法的基础上对 1 / (1 − γ) 个时间步内的小批量随机梯度也做了指数加权移动平均。

2 优化算法之间的关系

Original: https://www.cnblogs.com/tangzj/p/15602722.html
Author: MoSalah
Title: 优化算法之间的关系及各自特点的简单分析

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/576693/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

Meetup回顾｜星策社区FeatureStore Meetup V2

继2021年12月11日举办第一次Feature Store Meetup之后，星策开源社区于2022年4月10日举办了第二期「FeatureStore Meetup V2 」，本…

人工智能 2023年7月17日
0079
DDD领域驱动设计实战(六)-理解领域事件(Domain Event)

如何将领域事件建模成对象，何时应该为领域事件创建唯一的身份标识? 哪些组件用于发布事件，哪些组件用于订阅事件为什么我们需要一个事件存储?如何实现事件存储、如何使用事件存储? 如何…

人工智能 2023年6月1日
0095
【OpenCV 例程200篇】224. 特征提取之提取骨架

OpenCV 例程200篇总目录【youcans 的 OpenCV 例程 300篇】224. 特征提取之提取骨架目标特征的基本概念通过图像分割获得多个区域，得到区域内的像素…

人工智能 2023年6月17日
0083
80行快乐代码与你窥探爬虫的数据深渊——教你如何高效快速任意爬虫（附大量项目案例和语法解析文章）

目录爬虫之迷惑？小白疑问？爬虫到底是什么？学习爬虫从初识爬虫开始初识爬虫之概念认知篇初识爬虫之安装准备篇 Python语法入门到精通初识爬虫之基本原理篇初识爬虫之爬…

人工智能 2023年6月20日
00111
Knowledge graph embedding with hierarchical relation structure

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0078
【GAM全文翻译及代码实现】Global Attention Mechanism: Retain Information to Enhance Channel-Spatial Interactions

paper：https://arxiv.org/pdf/2112.05561v1.pdf 目录 1. Introduction 2. Related Works 3. Global…

人工智能 2023年6月18日
00180
【矩阵论】3. 矩阵运算与函数——矩阵函数的计算

矩阵论1. 准备知识——复数域上矩阵,Hermite变换)1.准备知识——复数域上的内积域正交阵1.准备知识——Hermite阵，二次型，矩阵合同，正定阵，幂0阵，幂等阵，矩阵的秩…

人工智能 2023年6月29日
0088
百度飞桨数据处理 API 数据格式 HWC CHW 和 PIL 图像处理之间的关系

使用百度飞桨 API 例如：Resize Normalize，处理数据的时候。 Resize：如果输入的图像是 PIL 读取的图像这个数据格式是 HWC ，Resize 就需要 H…

人工智能 2023年6月4日
00107
计算机二级真题练习

1、下面不符合软件设计准则的是（）。 A、设计单入口、单出口的模块 B、模块规模尽可能小 C、提高模块的独立性 D、减少模块接口和界面的复杂性正确答案:B 笞疑:【解析】软件设计…

人工智能 2023年6月28日
0096
matlab的find()函数的一些用法(快速查找符合条件的值)

有些时候，有一组数据，而任务呢，则是需要我们在这一组数据中找到符合某种规则的数据的位置，比如大于一个数，或者是等于一个数，或者是某个数的倍数等等。诸如此此类的问题有时也会令我们…

人工智能 2023年7月6日
00131
《遥感原理与应用》总结——遥感图像自动识别分类

目录遥感图像自动识别分类 1.基础知识 2.特征变换及特征选择 3.监督分类 4.非监督分类 5.非监督分类与监督分类的结合 6.分类后处理和误差分析 7.提高分类精度的方法 8…

人工智能 2023年7月2日
0093
在simulink中运行离线训练之后的BP神经网络

本贴内容如题所示，如何将训练好的BP神经网络加入到simulink中去运行，这只是我个人使用的，能够正常运行的办法，肯定不是最优的，大佬们请赐教。以一个简单的sin函数曲线拟合为例…

人工智能 2023年7月12日
0049
WiFi语音智能家居控制系统（一）

LU-ASR01语音识别文章目录 LU-ASR01语音识别前言一、语音识别技术二、语音识别 * 1.天问Block软件介绍 2.模块介绍 3.实现总结前言这款离线语音…

人工智能 2023年5月27日
0093
使用recognize_google（）出现 RequestError: recognition connection failed: [WinError 10060] 由于连接方在一段时间后没有

重新运行：(获取我的音频文件的内容) [En] Rerun: (got the contents of my audio file) ‘the stale smell of old…

人工智能 2023年5月23日
0093
【OpenCV 例程200篇】219. 添加数字水印（盲水印）

OpenCV 例程200篇总目录【youcans 的 OpenCV 例程 300篇】219. 添加数字水印（盲水印） 8.2 添加数字盲水印数字水印，是指将特征信息嵌入音频、…

人工智能 2023年7月19日
0064
提前做好网络安全分析，运维真轻松（二）

背景某汽车总部已部署NetInside流量分析系统，使用流量分析系统提供实时和历史原始流量。汽车配件电子图册系统是某汽车集团的重要业务系统。本次分析重点针对汽车配件电子图册系统进…

人工智能 2023年7月30日
0053

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31