梯度下降算法

一、基本概念

梯度下降法,就是利用负梯度方向来决定每次迭代的新的搜索方向,使得每次迭代能使待优化的目标函数逐步减小。梯度下降法是2范数下的最速下降法。 最速下降法的一种简单形式是:x(k+1)=x(k)-a*g(k),其中a称为学习速率,可以是较小的常数。g(k)是x(k)的梯度。

二、导数

(1)定义

设有定义域和取值都在实数域中的函数

梯度下降算法。若 梯度下降算法 在点 梯度下降算法 的某个邻域内有定义,则当自变量 梯度下降算法梯度下降算法 处取得增量 梯度下降算法(点 梯度下降算法 仍在该邻域内)时,相应地函数 梯度下降算法 取得增量 梯度下降算法;如果 梯度下降算法梯度下降算法 之比当 梯度下降算法 时的极限存在,则称函数 梯度下降算法 在点 梯度下降算法可导,并称这个极限为函数 梯度下降算法 在点 梯度下降算法 处的 导数,记为 梯度下降算法,即:

也可记作

梯度下降算法梯度下降算法梯度下降算法梯度下降算法

对于一般的函数,如果不使用增量的概念,函数

梯度下降算法 在点 梯度下降算法 处的导数也可以定义为:当定义域内的变量 梯度下降算法 趋近于 梯度下降算法 时,

梯度下降算法

的极限。也就是说,

梯度下降算法

导数反应的变化率

一个函数在某一点的导数描述了这个函数在这一点附近的变化率。导数的本质是通过极限的概念对函数进行局部的线性逼近。当函数

梯度下降算法的自变量在一点梯度下降算法上产生一个增量梯度下降算法时,函数输出值的增量与自变量增量梯度下降算法的比值在梯度下降算法趋于0时的极限如果存在,即为梯度下降算法梯度下降算法处的导数,记作梯度下降算法梯度下降算法梯度下降算法

(2)几何意义:

梯度下降算法

一个实值函数的图像曲线。函数在一点的导数等于它的图像上这一点处之切线的斜率,导数是函数的局部性质。不是所有的函数都有导数,一个函数也不一定在所有的点上都有导数。若某函数在某一点导数存在,则称其在这一点可导,否则称为不可导。如果函数的自变量和取值都是实数的话,那么函数在某一点的导数就是该函数所代表的曲线在这一点上的切线斜率。

具体来说:

当函数定义域和取值都在实数域中的时候,导数可以表示函数的曲线上的切线斜率。如下图所示,设

梯度下降算法为曲线上的一个定点,梯度下降算法为曲线上的一个动点。当梯度下降算法沿曲线逐渐趋向于点梯度下降算法时,并且割线梯度下降算法的极限位置梯度下降算法存在,则称梯度下降算法为曲线在梯度下降算法处的切线。

若曲线为一函数

梯度下降算法的图像,那么割线梯度下降算法(蓝色)的斜率为:

梯度下降算法处的切线梯度下降算法(红色),即梯度下降算法的极限位置存在时,此时梯度下降算法梯度下降算法,则梯度下降算法的斜率梯度下降算法为:

上式与一般定义中的导数定义完全相同,也就是说

梯度下降算法,因此,导数的几何意义即曲线梯度下降算法在点梯度下降算法处切线的斜率

梯度下降算法

(3)导函数

导数是一个数,是指函数

梯度下降算法 在点 梯度下降算法 处导函数的函数值,若函数 梯度下降算法 在其定义域包含的某区间 梯度下降算法 内每一个点都可导,那么也可以说函数梯度下降算法 在区间 梯度下降算法 内可导,这时对于 梯度下降算法 内每一个确定的梯度下降算法 值,都对应着 梯度下降算法 的一个确定的导数值,如此一来就构成了一个新的函数梯度下降算法,这个函数称作原来函数 梯度下降算法导函数,记作:梯度下降算法梯度下降算法 或者 梯度下降算法,通常也可以说导函数为导数

梯度

1、相关概念

假如一个空间中的每一点的属性都可以以一个标量来代表的话,那么这个场就是一个标量场。

假如一个空间中的每一点的属性都可以以一个向量来代表的话,那么这个场就是一个向量场

标量场中某一点上的梯度指向标量场增长最快的方向,梯度的长度是这个最大的变化率。

梯度_一词有时用于 _斜度,也就是一个曲面沿着给定方向的 _倾斜_程度。

2、计算

一个标量函数

梯度下降算法的梯度记为:

梯度下降算法梯度下降算法

其中

梯度下降算法(nabla)表示矢量微分算子。

在三维情况,该表达式在直角坐标中扩展为

梯度下降算法

六、梯度下降法

梯度下降法,基于这样的观察:如果实值函数

梯度下降算法 在点 梯度下降算法 处可微且有定义,那么函数 梯度下降算法梯度下降算法 点沿着梯度相反的方向

梯度下降算法 下降最快。

因而,如果

梯度下降算法

对于

梯度下降算法 为一个够小数值时成立,那么 梯度下降算法

考虑到这一点,我们可以从函数

梯度下降算法 的局部极小值的初始估计 梯度下降算法 出发,并考虑如下序列 梯度下降算法 使得

梯度下降算法

因此可得到

梯度下降算法

如果顺利的话序列

梯度下降算法 收敛到期望的极值。注意每次迭代 步长 梯度下降算法 可以改变。

Original: https://www.cnblogs.com/kex1n/p/9038858.html
Author: 小 楼 一 夜 听 春 雨
Title: 梯度下降算法

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/549316/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

  • 安装VMware Tools显示灰色的解决办法

    用VMware Workstation Pro好几年了,期间这个问题也遇到过好几次,这次把解决方案记录一下,若后续有其他情况其他解决方案将在此博文更新。 Step1:关闭虚拟机; …

    技术杂谈 2023年7月11日
    0120
  • 华为交换机如何配置SSH远程登录,一分钟秒学会

    从事网络运维工作的小伙伴们都知道,在交换机正式上线时,必须完成配置SSH远程登录,这样做目的是为了日后,维护方便,不需要每次登录设备都要跑到机房,这样既不现实,又费事。 远程登录方…

    技术杂谈 2023年6月21日
    074
  • WordPress中安装插件需要ftp怎么办?

    在初次搭建wordpress成功后,老季想安装wordpress中有趣的插件时缺发现需要ftp服务,同样的升级插件的话也需要输入ftp的用户名密码。其实不用真的搭建了一个ftp服务…

    技术杂谈 2023年6月1日
    091
  • python中整除后结果也是小数

    有人这么回答,这显然不对 先看个例子: ‘//’明明是整除,为什么结果不是整数,而会出现小数? 首先,关于除法有三种概念:传统除法、精确除法和地板除 #1、…

    技术杂谈 2023年7月25日
    068
  • 一款非常棒的十六进制编辑器 —— 010 Editor

    参考 https://zhuanlan.zhihu.com/p/96001673 插件 ELF.bt 用来分析ELF文件,用起来感觉像wireshark,可以高亮源文件中正常查看的…

    技术杂谈 2023年5月31日
    095
  • Linux 添加大于2TB磁盘扩容逻辑卷

    一、查看新添加磁盘以及分区情况 # lsblk 二、使用parted进行分区 # parted /dev/sdb // /dev/sdb 为上面查看到的新添加未分区的磁盘 (par…

    技术杂谈 2023年7月24日
    051
  • QT布局管理器

    QT主要布局管理器分类 QHBoxLayout(水平布局) 把子窗口从左到右排列在一个水平行上。 运行结果: QVBoxLayout(垂直布局) 把子窗口从上到下排列在一个垂直列上…

    技术杂谈 2023年6月1日
    078
  • 导出putty配置

    原文链接:http://downloadsquad.switched.com/2007/02/01/howto-transfer-your-putty-settings-betwe…

    技术杂谈 2023年6月1日
    091
  • 基于cefsharp的用户浏览器

    一、前言 使用cefSharp制作浏览器主要是一些页面无法通过自己的接口去控制,又不可能通过第三方去解决的时候,只能通过自己做的浏览器去分析界面,然后给出响应. 例如: xx的网页…

    技术杂谈 2023年5月31日
    079
  • java学习之SpringMVC

    Spring MVC 是 Spring 提供的一个基于 MVC 设计模式的轻量级 Web 开发框架,本质上相当于 Servlet。 Spring MVC 是结构最清晰的 Servl…

    技术杂谈 2023年6月21日
    078
  • 「Elasticsearch」SpringBoot快速集成ES

    Elastic Search 的底层是开源库 Lucene。但是Lucene的使用门槛比较高,必须自己写代码去调用它的接口。而Elastic Search的出现正是为了解决了这个问…

    技术杂谈 2023年7月24日
    060
  • 11-K8S部署普罗米修斯

    K8S-Kubernetes 集群部署 Prometheus 和 Grafana 1.实验环境 控制节点/master01 192.168.80.20 工作节点/node01 19…

    技术杂谈 2023年7月10日
    091
  • KMP算法学习记录

    Foreword: 初学KMP匹配算法,不得其门,总感觉自己想,想不出来,看书上文字解释晦涩难懂。不能准确的捕捉算法设计时候的灵光和思路 。于是自己试着完成了一遍,现将过程记录下来…

    技术杂谈 2023年6月21日
    082
  • form表单提交中文乱码的详细解析

    摘要:中文乱码主要是根据 get,post请求的不同,处理方式没选对引起的,当然也有小可能是tomcat的版本不同引起的 form表单提交中文乱码问题:首先 get,和 post …

    技术杂谈 2023年5月31日
    078
  • 每天一个 HTTP 状态码 201

    201 Created 表示请求成功,在服务器端创建了一个新资源… 201 Created 201 Created 表示客户端的请求已经成功完成,结果是创建了一个新资源…

    技术杂谈 2023年7月11日
    0107
  • 基于TCP与HTTP的RPC调用的区别

    基于TCP与HTTP的RPC调用的区别 RPC即远程服务调用 出现原因:随着项目越来越大,访问量越来越大,为了突破性能瓶颈,需要将项目拆分成多个部分,这样比起传统的项目都是本地内存…

    技术杂谈 2023年7月11日
    060
亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球