梯度下降算法

一、基本概念

梯度下降法,就是利用负梯度方向来决定每次迭代的新的搜索方向,使得每次迭代能使待优化的目标函数逐步减小。梯度下降法是2范数下的最速下降法。 最速下降法的一种简单形式是:x(k+1)=x(k)-a*g(k),其中a称为学习速率,可以是较小的常数。g(k)是x(k)的梯度。

二、导数

(1)定义

设有定义域和取值都在实数域中的函数

梯度下降算法。若 梯度下降算法 在点 梯度下降算法 的某个邻域内有定义,则当自变量 梯度下降算法梯度下降算法 处取得增量 梯度下降算法(点 梯度下降算法 仍在该邻域内)时,相应地函数 梯度下降算法 取得增量 梯度下降算法;如果 梯度下降算法梯度下降算法 之比当 梯度下降算法 时的极限存在,则称函数 梯度下降算法 在点 梯度下降算法可导,并称这个极限为函数 梯度下降算法 在点 梯度下降算法 处的 导数,记为 梯度下降算法,即:

也可记作

梯度下降算法梯度下降算法梯度下降算法梯度下降算法

对于一般的函数,如果不使用增量的概念,函数

梯度下降算法 在点 梯度下降算法 处的导数也可以定义为:当定义域内的变量 梯度下降算法 趋近于 梯度下降算法 时,

梯度下降算法

的极限。也就是说,

梯度下降算法

导数反应的变化率

一个函数在某一点的导数描述了这个函数在这一点附近的变化率。导数的本质是通过极限的概念对函数进行局部的线性逼近。当函数

梯度下降算法的自变量在一点梯度下降算法上产生一个增量梯度下降算法时,函数输出值的增量与自变量增量梯度下降算法的比值在梯度下降算法趋于0时的极限如果存在,即为梯度下降算法梯度下降算法处的导数,记作梯度下降算法梯度下降算法梯度下降算法

(2)几何意义:

梯度下降算法

一个实值函数的图像曲线。函数在一点的导数等于它的图像上这一点处之切线的斜率,导数是函数的局部性质。不是所有的函数都有导数,一个函数也不一定在所有的点上都有导数。若某函数在某一点导数存在,则称其在这一点可导,否则称为不可导。如果函数的自变量和取值都是实数的话,那么函数在某一点的导数就是该函数所代表的曲线在这一点上的切线斜率。

具体来说:

当函数定义域和取值都在实数域中的时候,导数可以表示函数的曲线上的切线斜率。如下图所示,设

梯度下降算法为曲线上的一个定点,梯度下降算法为曲线上的一个动点。当梯度下降算法沿曲线逐渐趋向于点梯度下降算法时,并且割线梯度下降算法的极限位置梯度下降算法存在,则称梯度下降算法为曲线在梯度下降算法处的切线。

若曲线为一函数

梯度下降算法的图像,那么割线梯度下降算法(蓝色)的斜率为:

梯度下降算法处的切线梯度下降算法(红色),即梯度下降算法的极限位置存在时,此时梯度下降算法梯度下降算法,则梯度下降算法的斜率梯度下降算法为:

上式与一般定义中的导数定义完全相同,也就是说

梯度下降算法,因此,导数的几何意义即曲线梯度下降算法在点梯度下降算法处切线的斜率

梯度下降算法

(3)导函数

导数是一个数,是指函数

梯度下降算法 在点 梯度下降算法 处导函数的函数值,若函数 梯度下降算法 在其定义域包含的某区间 梯度下降算法 内每一个点都可导,那么也可以说函数梯度下降算法 在区间 梯度下降算法 内可导,这时对于 梯度下降算法 内每一个确定的梯度下降算法 值,都对应着 梯度下降算法 的一个确定的导数值,如此一来就构成了一个新的函数梯度下降算法,这个函数称作原来函数 梯度下降算法导函数,记作:梯度下降算法梯度下降算法 或者 梯度下降算法,通常也可以说导函数为导数

梯度

1、相关概念

假如一个空间中的每一点的属性都可以以一个标量来代表的话,那么这个场就是一个标量场。

假如一个空间中的每一点的属性都可以以一个向量来代表的话,那么这个场就是一个向量场

标量场中某一点上的梯度指向标量场增长最快的方向,梯度的长度是这个最大的变化率。

梯度_一词有时用于 _斜度,也就是一个曲面沿着给定方向的 _倾斜_程度。

2、计算

一个标量函数

梯度下降算法的梯度记为:

梯度下降算法梯度下降算法

其中

梯度下降算法(nabla)表示矢量微分算子。

在三维情况,该表达式在直角坐标中扩展为

梯度下降算法

六、梯度下降法

梯度下降法,基于这样的观察:如果实值函数

梯度下降算法 在点 梯度下降算法 处可微且有定义,那么函数 梯度下降算法梯度下降算法 点沿着梯度相反的方向

梯度下降算法 下降最快。

因而,如果

梯度下降算法

对于

梯度下降算法 为一个够小数值时成立,那么 梯度下降算法

考虑到这一点,我们可以从函数

梯度下降算法 的局部极小值的初始估计 梯度下降算法 出发,并考虑如下序列 梯度下降算法 使得

梯度下降算法

因此可得到

梯度下降算法

如果顺利的话序列

梯度下降算法 收敛到期望的极值。注意每次迭代 步长 梯度下降算法 可以改变。

Original: https://www.cnblogs.com/kex1n/p/9038858.html
Author: 小 楼 一 夜 听 春 雨
Title: 梯度下降算法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/549316/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球