机器学习：梯度下降算法及优化(python代码实践)

2023年6月15日下午2:53 • 人工智能 • 阅读 63

梯度下降算法及优化

1-梯度下降算法原理
2-算法的实现
3-梯度下降优化算法
4-参考

1-梯度下降算法原理

梯度下降算法(Gradient Descent):是一种用来求使函数 最小值时参数的值的算法。
_Loss损失函数_用来衡量机器学习模型的精确度。一般来说，损失函数的值越小，模型的精确度就越高。降低损失函数的值，我们一般采用梯度下降这个方法。所以，梯度下降的目的，就是为了最小化损失函数，此时的参数w,b便是最优的解。
梯度：梯度实际上函数的偏导数。
梯度下降的基本过程就和下山的场景很类似。
参考1下山的例子：
一个人被困在山的某处，他也不知道自己在那，需要从山上下来(找到山的最低点，也就是山谷)。但此时山上的浓雾很大，导致可视度很低；因此，下山的路径就无法确定，必须利用自己周围的信息一步一步地找到下山的路。这个时候，便可利用梯度下降算法来帮助自己下山。怎么做呢？

首先以他当前的所处的位置为基准，寻找这个位置最陡峭的地方，然后朝着下降方向走一步，然后又继续以当前位置为基准，再找最陡峭的地方，再走直到最后到达最低处；同理上山也是如此，只是这时候就变成梯度上升算法

算法原理：在算法中，首先，随机选取一个自变量的值，作为初始值，代表着在山的某一初始位置处。然后，在函数中自变量的初始位置计算函数对于自变量的梯度(偏导)，求这个地方最陡峭的地方。接下来，根据计算的梯度值对自变量进行更新。然后从改变过的自变量的位置处，对函数求梯度，再对进行调整更新。
每一次的调整被称为迭代（iteration）

流程：

定义自变量初始值x1（人在山的随机某处）
函数在x1处求梯度，参数更新（人找最陡峭的下一点x2）
函数在x2处求梯度，参数更新(找最陡峭的下一点x3)
不断迭代，直到约等最小值（到达谷底）

; 2-算法的实现

下面通过实例来应用梯度下降算法找到y = x 2 + 1 y=x^2+1 y =x 2 +1的最小值。
根据上述算法流程：

首先定义初始值x 0 = − 18 x_0=-18 x 0 =−1 8
接下来求该点的梯度值，求导得d y / d x = 2 x dy/dx=2x d y /d x =2 x,该点梯度值为-36，接下来参数更新，调整方式为x 1 = x 0 − l r ∗ x 0 x1=x0-lr*x0 x 1 =x 0 −l r ∗x 0,lr为学习率。学习率过大容易出现如下图所示现象，过小时间开销大
然后不断按照这种方式迭代，直到接近0.

python代码流程如下：
1，首先做准备，加载依赖库，定义函数，


import numpy as np
import matplotlib.pyplot as plt

def function(x):
    x = np.array(x)
    y = x ** 2 + 1
    return y

2，定义参数的初始值


epochs = 50

lr = 0.1

xi = -18

3，求解梯度，更新参数，不断训练。


def get_gradient(x):
    gradient = 2 * x
    return gradient

trajectory = []

def get_x_star(xi):
    for i in range(epochs):
        trajectory.append(xi)
        xi = xi - lr * get_gradient(xi)
    x_star = xi
    return x_star

get_x_star(xi)

4，进行显示。

x1 = np.arange(-20, 20, 0.1)
y = function(x1)

plt.plot(x1, y)
x_trajectory = np.array(trajectory)
y_trajectory = function(trajectory)

plt.scatter(x_trajectory, y_trajectory)
plt.show()

5，结果如下图所示：

3-梯度下降优化算法

在计算损失函数关于模型参数的梯度时，根据使用的训练集的数据量，梯度算法大致分为三类：

批量梯度下降batch gradient descent：计算梯度时使用训练集的全部数据，准确率高，效率低。
随机梯度下降stochastic gradient descent:每次只用训练集一个样本计算梯度，随时更新。效率高，学习率选择困难。
小批量梯度下降mini-batch gradient descnet:每次使用训练集中小部分数据，批尺寸。

梯度下降算法主要关注： 学习率，效率，基于次，在实际的应用中，常采用以下5种优化算法。

SGD:随机梯度下降算法。
Adagrad：适用于数据集的数据集特征较稀疏且样本参数较多。
Adadelta
RMSprop：默认学习率为0.001。
Adam

4-参考

1，梯度下降算法原理讲解——机器学习
2，史上最详细的梯度下降优化算法介绍（从SGD到Adam至Lookahead）

Original: https://blog.csdn.net/Alexa_/article/details/123804603
Author: Alexa2077
Title: 机器学习：梯度下降算法及优化(python代码实践)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/615011/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

一篇玩转mybatis-plus框架的详细讲解（入门必备）

🐼 个人主页：爪哇斗罗🐼 博主介绍：一名打工人🐼 签名：圣人之道，为而不争。🐼 一起交流，一起进步，一起互动。目录 1. MybatisPlus简介与特性 1.1 简介 1….

人工智能 2023年6月26日
0095
优化算法SGD与Adam

说来惭愧，一直在用的两个经典的优化器，几行代码就完成了参数更新，但是却一直没有深入的了解其中的原理。 improt torch … optimizer = torch.opti…

人工智能 2023年7月21日
0065
计算机视觉之边缘提取

目录复习一、边缘提取 * 1、什么是边缘？ 2、什么是边缘提取？ – (1)边缘检测 (2)高频信号&低频信号 (3)边缘检测的原理和步骤 (4)图像锐化 …

人工智能 2023年6月17日
0067
简单介绍一下tensorflow与pytorch的相互转换（主要是tensorflow转pytorch）

本文以一段代码为例，简单介绍一下tensorflow与pytorch的相互转换（主要是tensorflow转pytorch），可能介绍的没有那么详细，仅供参考。由于本人只熟悉py…

人工智能 2023年7月4日
0085
1.决策树C4.5算法

文章目录一、概述二、改进表现三、优缺点四、决策树 * 1.特征选择 2.决策树的生成 3.决策树的剪枝一、概述 C4.5是一系列用在机器学习和数据挖掘的分类问题中的算法。…

人工智能 2023年6月15日
0066
【图解AES加密算法】AES算法的Python实现 | Rijndael-128 | 对称加密 | 物联网安全

系列索引：【图解安全加密算法】加密算法系列索引 Python保姆级实现教程 | 物联网安全 | 信息安全完整代码已更新文章目录 * – 一、AES的前世今生 &#8…

人工智能 2023年6月19日
0070
讯飞AIUI智能机器人7—–文字识别

🍖🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖 🍖🍖🍖🍖🍖🍖🍖🍖…

人工智能 2023年6月23日
0090
pytorch学习之—squeeze()和unsqueeze()函数功能及使用

首先这个squeeze单词啥意思： 1.squeeze(1)和squeeze(-1)作用：两者的效果一样，都是给张量tensor降维，但不是啥张量都可以用这两个函数来降维，它只能…

人工智能 2023年7月22日
0047
深入分析若依数据权限@datascope （注解+AOP+动态sql拼接）【循序渐进，附分析过程】

笔者最近在努力的分析开源项目若依框架，今天看到了若依对数据权限进行控制的部分，自定义注解+AOP+动态SQL的注入，看的我是眼花缭乱，然后我又认真的复盘了一遍整个的实现过程，不由得…

人工智能 2023年5月30日
00505
工业蒸汽量预测-模型训练

本文改编自《阿里云天池大赛赛题解析-机器学习篇》的第一部分工业蒸汽量预测的第四章-模型训练的内容。根据原有内容进行了部分素材的替换和知识点的归纳总结。sklearn模型训练步骤的总…

人工智能 2023年6月18日
0076
【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍

【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍文章目录【Gazebo入门教程】第一讲 Gazebo的安装、UI界面、SDF文件介绍 * 一、Gaz…

人工智能 2023年7月26日
0050
jsp+ssm计算机毕业设计宠物寻回系统【附源码】

项目运行环境配置： Jdk1.8 + Tomcat7.0 + Mysql + HBuilderX （Webstorm也行）+ Eclispe（IntelliJ IDEA,Ecli…

人工智能 2023年7月30日
0051
nlp–常用分词方法

本文以介绍 nlp 常见分词方法为目的，具体效果请大家自行辨别 jieba 代码 jieba.enable_paddle() seg_list = jieba.cut(data, …

人工智能 2023年5月30日
0076
t

1、tf.constant 创建一个常量 2、tf.range 创建一个序列 tf.rang(开始，结束，步长）开始

人工智能 2023年5月26日
0074
电影音频自动剪辑语料

电影电视剧语音数据集剪辑工具前言一、语音识别任务二、代码实现 * 1.语音定位 2.根据时间剪辑对应音频总结前言 ASR语音识别任务通常使用开源数据集进行训练，为了补充语…

人工智能 2023年5月25日
0055
Titanic数据分析

背景题目参见：Titanic实际就是根据乘客的性别、年龄、舱位等级等信息预测乘客的成活率。很多人也说这个数据集比较小，使用一些tricky的技术提高准群率意义不大，但是作为练手的…

人工智能 2023年7月17日
0075

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

机器学习：梯度下降算法及优化(python代码实践)

梯度下降算法及优化

大家都在看