深度学习相关概念：梯度下降

2023年7月13日上午11:54 • 人工智能 • 阅读 47

深度学习相关概念：梯度下降法、动量法与自适应梯度

1. 梯度下降概念
2. 梯度下降的目的
3. 梯度下降的原理
4. 梯度计算
5. 梯度下降算法的类别及计算效率
*
5.1 批量梯度下降（BGD）
5.2 随机梯度下降（SGD）
5.3 小批量梯度下降（MBGD）
梯度下降概念

在深度学习中，你一定听说过”梯度下降”，在绝大部分的神经网络模型里有直接或者间接地使用了梯度下降的算法。深度学习的核心：就是把数据喂给一个人工设计的模型，然后让模型自动的”学习”，通过反向传播进而优化模型自身的各种参数，最终使得在某一组参数下该模型能够最佳的匹配该学习任务。那么如果想要这个模型达到我们想要的效果，这个”学习”的过程就是深度学习算法的关键。梯度下降法就是实现该”学习”过程的一种最常见的方式，尤其是在深度学习(神经网络)模型中，BP反向传播方法的核心就是对每层的权重参数不断使用梯度下降来进行优化。虽然不同的梯度下降算法在具体的实现细节上会稍有不同，但是主要的思想是大致一样的。

梯度下降的目的

梯度下降的原理

梯度下降就是寻找 损失函数的最低点。那么如何寻找损失函数的最低点呢？在这里，我们使用了微积分里导数，通过求出函数导数的值，从而找到 函数下降的方向或者是 最低点（极值点）。

计算梯度后如何找到最低点？如下图路线所示

; 4. 梯度计算

梯度的计算分为数值法和解析法：

梯度下降算法的类别及计算效率

5.1 批量梯度下降（BGD）

在梯度下降的每一步中，我们都用到了所有的训练样本，我们需要进行求和运算，在梯度下降中，在计算微积分时，每一个样本都需要计算，会导致运算速度比较慢。

; 5.2 随机梯度下降（SGD）

随机梯度下降法和批量梯度下降法是两个极端，批量梯度下降每次采用所有数据下降，随机梯度下降 每次用一个样本来梯度下降。

训练速度：随机梯度下降法由于每次仅仅采用一个样本来迭代， 训练速度很快。
精准度：随机梯度下降法每次训练仅仅用一个样本决定梯度的方向，可能 得到局部最小值，精准度不高。
收敛速度：由于随机梯度下降法一次迭代一个样本，导致迭代方向变化很大， 不能很快的收敛到局部最优解。

5.3 小批量梯度下降（MBGD）

小批量梯度下降每次迭代使用一个以上但又不是全部的样本。小批量梯度下降是集中了随机梯度下降（SGD）和批量梯度下降（BGD）的优点：使用多个样本相比SGD提高了梯度估计的精准度，小批量的估计。缺点：同SGD一样，每次梯度的方向不确定 加粗样式，可能 陷入局部最优。通常在使用MBGD之前 先将数据随机打乱，然后 划分Mini-batch，所以MBGD有时也称SGD。Mini-batch 大小的选择通常使用 2的幂数，可以获得更少的运行时间。

但是梯度下降3种算法都有缺点，都可能会陷入局部最优或者计算量大。应该如何改进？
目前人们已经提出动量法和自适应梯度来解决本文中的问题。详情见我的下一篇博客——深度学习相关概念：动量法与自适应梯度

Original: https://blog.csdn.net/muye_IT/article/details/123525536
Author: Jasper0420
Title: 深度学习相关概念：梯度下降

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/689751/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

统计知识 | 中心极限定理及偏差

总体和样本总体（population）是包含所研究的全部个体（数据）的集合样本（sample）是从总体中选取的一部分样本数量：有多少样本样本大小：每个样本里有多少数据 …

人工智能 2023年6月11日
0079
【自然语言处理】【知识图谱】利用属性、值、结构来实现实体对齐

《利用属性、值、结构来实现实体对齐》Exploring and Evaluating Attributes, Values, and Structures for Entity A…

人工智能 2023年6月1日
0090
是否可以解决冷启动问题

人工智能 2024年1月2日
0051
相机畸变＋张正友标定（含源代码）

希望2022能够自主学习。本文狠狠的借鉴了：相机标定之张正友标定法数学原理详解（含python源码） – 知乎和最详细、最完整的相机标定讲解_a083614的专栏-C…

人工智能 2023年5月26日
0094
神经网络实现MNIST手写数字分类

学习tensorflow使用神经网络实现MNIST手写数字分类的过程中遇到了很多问题，这里记录下来并总结环境： windows11下的VM15，Ubuntu20.04，tenso…

人工智能 2023年7月2日
0097
1 基于搜索的路径规划 —— Dijkstra算法(python)

文章目录算法讲解重要说明 * 栅格地图有权图 1 def main() * 1.1 设置机器人的起点和终点，栅格大小，机器人半径 1.2 设置障碍物的位置 1.3 绘制步骤1…

人工智能 2023年6月25日
0055
数据科学必备Pandas数据分组GroupBy方法汇总

大家好，我是Mr数据杨。今天我们将一同走进充满数字的Python世界，我想拿《三国演义》的例子来阐述一下学习笔记中的主题。首先得有数据。试想一下，如果三国的谋士们如诸葛亮，郭嘉，…

人工智能 2023年7月17日
0061
C++类模板的重载

由于在看 QT5.15.2中的 connect方法中的 typedef QtPrivate::FunctionPointer<func1> SignalType;&lt…

人工智能 2023年6月29日
0067
如何通过OpenCV创建显示窗口

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月18日
0070
研究生录取数据分析 Python123

本题附件包含500名国际高校的研究生申请人的相关信息和预测的录取概率数据。‪‬‪‬‪‬‪‬‪‬‮‬‭‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪…

人工智能 2023年7月15日
00138
聚类算法之密度聚类方法

密度聚类方法 DBSCAN DBSCAN算法的若干概念 DBSCAN具体实现步骤 DBSCAN的优缺点密度聚类方法的核心思想是，只要样本点的密度大于某阈值，则将该样本添加到最近的…

人工智能 2023年7月17日
0067
【AI作画】使用stable-diffusion-webui搭建AI作画平台

一、安装配置Anaconda 进入官网下载安装包https://www.anaconda.com/并安装，然后将Anaconda配置到环境变量中。打开命令行，依次通过如下命令创建…

人工智能 2023年6月24日
00151
一次用Python制作电影字幕的尝试

文章目录前言一、字幕文件二、思路整理 * 1.分离视频里的语音 2.将语音切片 3.调用引擎转成文字 4.调用谷歌翻译 5.生成SRT文件 6.视频嵌入字幕三、代码实现总…

人工智能 2023年5月23日
0075
安装Matplotlib

文章目录一、pip安装二、conda安装 * 1、anaconda navigator安装 2、condan命令安装 ; 一、pip安装运行如下的命令即可 pip insta…

人工智能 2023年7月14日
0079
spss之数据处理（离散化）

什么是离散化（数据分组）把无限空间有限个体映射到有限空间里有限白话：在不改变数据相对大小的条件下，对数据进行相对的缩小例如：原数据：7 1 4 3 处理后： 4 1 3 2原数据…

人工智能 2023年7月15日
00119
canopy+kmeans聚类模式

目录一、canopy算法二、canopy代码三、kmeans 四、整体思路 4.1、整体代码：一、canopy算法先看一个示意图 canopy示意图 canopy可以理解…

人工智能 2023年6月2日
00120

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

深度学习相关概念：梯度下降

深度学习相关概念：梯度下降法、动量法与自适应梯度

5.1 批量梯度下降（BGD）

; 5.2 随机梯度下降（SGD）

5.3 小批量梯度下降（MBGD）

大家都在看