【机器学习】numpy实现NAG(Nesterov accelerated gradient)优化器

2023年8月30日上午6:52 • Python • 阅读 70

💥 项目专栏：【Python实现经典机器学习算法】附代码+原理介绍

文章目录

前言
一、NAG(Nesterov accelerated gradient)优化原理
二、更新规则
三、迭代过程
四、代码实践

前言

👑 最近粉丝群中很多朋友私信咨询一些决策树、逻辑回归等机器学习相关的编程问题，为了能更清晰的说明，所以建立了本专栏 专门记录基于原生Python实现一些入门必学的机器学习算法，帮助广大零基础用户达到轻松入门，为了更深刻算法的基本原理，本专栏没有采用第三方库来实现（sklearn），而是采用原生Python自己复现相关算法，从而帮助新手理解算法的内部细节。
👑 本专栏适用人群：🚨🚨🚨 机器学习初学者， 刚刚接触sklearn的用户群体，专栏将具体讲解如何基于原生Python来实现一些经典机器学习算法， 快速让新手小白能够对机器学习算法有更深刻的理解。
👑 本专栏内包含基于原生Python从零实现经典机器学习算法，通过自复现帮助新手小白对算法有更深刻的认识，理论与实践相结合，每一篇文章都附带有 完整的代码+原理讲解。

🚨 我的项目环境：

平台：Windows11
语言环境：Python 3.7
编译器：Jupyter Lab
Pandas：1.3.5
Numpy：1.19.3
Scipy：1.7.3
Matplotlib：3.1.3

💥 项目专栏：【Python实现经典机器学习算法】附代码+原理介绍

一、NAG(Nesterov accelerated gradient)优化原理

Momentum是基于动量原理的，就是每次更新参数时，梯度的方向都会和上一次迭代的方向有关，当一个球向山下滚的时候，它会越滚越快，能够加快收敛，但是这样也会存在一个问题，每次梯度都是本次和上次之和，如果是同向，那么将导致梯度很大，当到达谷底的时候很容易动量过大导致小球冲过谷底，跳过当前局部最优位置。

我们希望有一个更智能的球，一个知道它要去哪里的球，这样它知道在山坡再次向上倾斜之前减速。

Nesterov accelerated gradient是一种使动量项具有这种预见性的方法。我们知道我们将使用动量项来移动参数。因此，为我们提供了参数下一个位置的近似值（完全更新时缺少梯度），大致了解了参数的位置。我们现在可以通过计算梯度（不是我们当前参数的，而是我们参数的近似未来位置的）有效地向前看。
v t = γ v t − 1 + η ∇ θ J ( θ − γ v t − 1 ) θ = θ − v t v_t=\gamma v_{t-1}+\eta\nabla_{\theta}J(\theta-\gamma v_{t-1})\ \theta=\theta-v_t v t =γv t −1 +η∇θJ (θ−γv t −1 )θ=θ−v t
第一个公式分为两个部分看，第一项是动量部分，保持上次的梯度方向，第二项就是当前梯度，但是这个不太一样，梯度参数里面是 θ − γ ∗ v t − 1 \theta-\gamma * v_{t-1}θ−γ∗v t −1 ，由于我们希望小球可以知道自己何时停下，所以希望小球可以预测未来梯度的趋势，一旦发现前方的坡度上升，那么就应该减小步伐，以免冲出最低点，从公式角度理解，更新当前梯度时，我先按照上次梯度方向更新，计算一个大概未来的一个梯度，如果为正，那么说明本次更新后仍和我之前更行的方向一致，说明本次不会冲出去，保持更新即可，但是如果为负，说明本次更新后梯度方向变化了，即冲过了最优点，那么正好和上次的动量方向抵消一部分，因为两者异号，这样小球就知道自己此次更新会冲过去，所以两者抵消一部分导致本次更新步伐没有那么大。

【机器学习】numpy实现NAG(Nesterov accelerated gradient)优化器

我们再次将动量项的值设置为0.9左右。动量首先计算当前梯度（图3中的蓝色小矢量），然后在更新的累积梯度（蓝色大矢量）的方向上进行大跳跃，而NAG首先在先前累积梯度（棕色矢量）的方向上进行大跳跃，测量梯度，然后进行校正（绿色矢量）。此预期更新可防止我们进行得太快，从而提高响应能力，从而显著提高RNN在许多任务上的性能。

现在我们能够根据误差函数的斜率调整更新，并反过来加快SGD，我们还希望根据每个参数的重要性调整更新，以执行更大或更小的更新。

; 二、更新规则

NAG（Nesterov accelerated gradient）是一种基于动量的优化算法，它在 Momentum 的基础上提出了 Nesterov 加速梯度（Nesterov accelerated gradient）的概念，以进一步提高训练效率。

Nesterov 加速梯度的核心思想是，在计算梯度之前，先对参数进行一次预测，然后基于这个预测值来计算梯度。这样，可以更加准确地计算出梯度，并在更新参数时得到更好的结果。

具体地，NAG 的更新规则如下：

v t = γ v t − 1 + η ∇ θ J ( θ − γ v t − 1 ) v_t = \gamma v_{t-1} + \eta \nabla_{\theta} J(\theta – \gamma v_{t-1})v t =γv t −1 +η∇θJ (θ−γv t −1 )
θ t = θ t − 1 − v t \theta_t = \theta_{t-1} – v_t θt =θt −1 −v t

其中，v t v_t v t 表示在 t 时刻的动量，γ \gamma γ 是动量系数，η \eta η 是学习率，∇ θ J ( θ − γ v t − 1 ) \nabla_{\theta} J(\theta – \gamma v_{t-1})∇θJ (θ−γv t −1 ) 是关于参数 θ \theta θ 的损失函数 J 的梯度。需要注意的是，在计算梯度时，预测值 θ − γ v t − 1 \theta – \gamma v_{t-1}θ−γv t −1 用于计算损失函数的梯度。

在更新参数时，首先根据当前的梯度和上一次的动量计算出当前时刻的动量 v t v_t v t 。然后，根据学习率和动量来更新参数 θ t \theta_t θt 。这里需要注意的是，NAG 中使用的动量是基于预测值的动量，而不是基于当前梯度的动量。

NAG 的优点是可以加速训练过程，提高参数更新的准确性，并减小震荡。此外，NAG 也易于与其他算法进行结合，如 AdaGrad、RMSprop 和 Adam 等。

三、迭代过程

; 四、代码实践

import numpy as np
import matplotlib.pyplot as plt

class Optimizer:
    def __init__(self,
                 epsilon = 1e-10,
                 iters = 100000,
                 lamb = 0.01,
                 gamma = 0.0,
                ):
        self.epsilon = epsilon
        self.iters = iters
        self.lamb = lamb
        self.gamma = gamma

    def nag(self, x_0 = 0.5, y_0 = 0.5):
        f1, f2 = self.fn(x_0, y_0), 0
        w = np.array([x_0, y_0])
        k = 0
        v_t = 0.0

        while True:
            if abs(f1 - f2)  self.epsilon or k > self.iters:
                break

            f1 = self.fn(x_0, y_0)

            if k == 0:
                g = np.array([self.dx(x_0, y_0), self.dy(x_0, y_0)])
            else:
                g = np.array([self.dx(x_0 - v_t[0], y_0 - v_t[1]), self.dy(x_0 - v_t[0], y_0 - v_t[1])])

            v_t = self.gamma * v_t + self.lamb * g

            x_0, y_0 = np.array([x_0, y_0]) - v_t

            f2 = self.fn(x_0, y_0)

            w = np.vstack((w, (x_0, y_0)))
            k += 1

        self.print_info(k, x_0, y_0, f2)
        self.draw_process(w)

    def print_info(self, k, x_0, y_0, f2):
        print('迭代次数：{}'.format(k))
        print('极值点：【x_0】：{} 【y_0】：{}'.format(x_0, y_0))
        print('函数的极值：{}'.format(f2))

    def draw_process(self, w):
        X = np.arange(0, 1.5, 0.01)
        Y = np.arange(-1, 1, 0.01)
        [x, y] = np.meshgrid(X, Y)
        f = x**3 - y**3 + 3 * x**2 + 3 * y**2 - 9 * x
        plt.contour(x, y, f, 20)
        plt.plot(w[:, 0],w[:, 1], 'g*', w[:, 0], w[:, 1])
        plt.show()

    def fn(self, x, y):
        return x**3 - y**3 + 3 * x**2 + 3 * y**2 - 9 * x

    def dx(self, x, y):
        return 3 * x**2 + 6 * x - 9

    def dy(self, x, y):
        return - 3 * y**2 + 6 * y

"""
    函数: f(x) = x**3 - y**3 + 3 * x**2 + 3 * y**2 - 9 * x
    最优解: x = 1, y = 0
    极小值: f(x,y) = -5
"""
optimizer = Optimizer()
optimizer.nag()

Original: https://blog.csdn.net/m0_47256162/article/details/121576888
Author: Bi 8 Bo
Title: 【机器学习】numpy实现NAG(Nesterov accelerated gradient)优化器

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/763523/

转载文章受原作者版权保护。转载请注明原作者出处！

python

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

2022年最新大众点评的字体反爬，落地技术也是绝了，Python实现

📢📢📢📢📢📢💗 你正在阅读【梦想橡皮擦】的博客👍 阅读完毕，可以点点小手赞一下🌻 发现错误，直接评论区中指正吧📆 橡皮擦的第 621 篇原创博客从订购之日起，案例5年内保证更…

Python 2023年6月3日
00115
用python放烟花，节约又环保

Original: https://www.cnblogs.com/123456feng/p/16040139.htmlAuthor: 蚂蚁ailingTitle: 用python…

Python 2023年5月24日
0067
web框架总结（django、flask）

1.MVC解读 M：Model，模型，和数据库进行交互 V：View，视图，负责产生Html页面 C：Controller，控制器，接收请求，进行处理，与M和V进行交互，返回应答。…

Python 2023年8月6日
0050
pytest测试框架系列 – 一文搞定pytest-html自定义优化HTML测试报告!

前言在我们自动化测试过程中，我们最终肯定会生成一个测试报告，测试报告可能为一个txt、xml、json文件、Excel或者HTML报告，大家基本上都偏向于HTML报告，pytes…

Python 2023年9月10日
0051
pandas办公自动化

1.读取excle文件 import pandas as pd pd = pd.read_excel(r’D:\01.xlsx’) ##文件路径 print(pd) 2.数据结构 …

Python 2023年8月22日
0050
用Excel将中文转成大驼峰拼音

示例： 1333-为适应大批量资产的录入 -> 1333-WeiShiYingDaPiLiangZiChanDeLuRu vbnet;gutter:true;getpy方法需…

Python 2023年6月3日
0077
pthread_mutex_t & pthread_cond_t 总结

pthread_mutex_t & pthread_cond_t 总结一、多线程并发 1.1 多线程并发引起的问题我们先来看如下代码： #include #includ…

Python 2023年10月18日
0048
项目场景： gyp verb check python checking for Python executable python2 in the PATH

node v16.15.0 npm 8.5.5 npm install 报错 gyp verb check python checking for Python execu…

Python 2023年8月1日
0052
pychram运行调试flask出现 ValueError: signal only works in main thread

可能与socketio包有关解决办法:加上 –no-reload Original: https://www.cnblogs.com/tastepy/p/1450609…

Python 2023年6月6日
0075
在C++中，为什么部分程序员喜欢在循环中写‘++i’而不是‘i++’？

自入行以来，无论是查阅资料、技术博客亦或是同事间的技术交流，都有一个共识: 在循环的时候，务必使用前置操作符，因为其性能优于后置操作符，久而久之，这个就像一个不成文的规定，大家都在…

Python 2023年9月17日
0058
Pytest框架 — 07、Pytest的Fixture（部分前后置）(二)

4、Fixture的相互调用示例： import pytest 第一层fixture @pytest.fixture() def fixture_1(): data = &quo…

Python 2023年11月1日
0038
最受欢迎的Python科学类库

作为一种免费的，跨平台的，通用的和高级的编程语言，Python已被科学界广泛采用。科学家重视Python的精确和有效的语法，相对平坦的学习曲线以及它与其他语言（例如C / C ++…

Python 2023年8月18日
0058
一行代码网页变灰

背景想必大家都感受到了，很多网站、APP 在前两天都变灰了。先来感受一下变灰后的效果。 .让网页变为黑白配色，是个常见的诉求。而且往往是突如其来的诉求，是无法预知的。当发生这样的…

Python 2023年10月27日
0042
Django+HTML+MYSQL

虚拟环境创建django 安装virtualenv模块（虚拟环境）：pip install virtualenv 创建一个项目文件夹：mkdir mysite01 切换到项目文件夹…

Python 2023年8月4日
0051
#yyds干货盘点#循环中的 break、continue else 子句

Python 2023年5月24日
0060
Python3 collections模块的使用

collections 介绍 collections是Python内建的一个集合模块，提供了许多有用的集合类和方法。可以把它理解为一个容器，里面提供Python标准内建容器 &l…

Python 2023年6月10日
00102

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

【机器学习】numpy实现NAG(Nesterov accelerated gradient)优化器

文章目录

大家都在看