梯度下降实验报告

2023年7月14日下午12:37 • 人工智能 • 阅读 43

Experimental content

Experiment One: coding the gradient descent algorithm with the following example

Experiment Three: coding the gradient descent algorithm with the following example
梯度下降实验报告

; Experimental results

实验一：
代码实现：


'''
f(x) = w^2
the derivative of f(x): f`(x) = 2*w
Initilize w = 1, a = 0.4
'''
import matplotlib.pyplot as plt
import numpy as np

k = 4
w = [1]
a = 0.9

for i in range(k):
    w.append(w[-1] - a * 2 * w[-1])

plt.ion()
x = np.linspace(-1, 1, 30)
plt.plot(x, np.square(x))
for i in range(0, len(w)-1):
    plt.plot(w[i:i+2], np.square(w[i:i+2]), 'r-o')
    print(w[i], '---->', w[i+1])
    plt.pause(2)
plt.ioff()
print("绘制图像完成！")
plt.waitforbuttonpress()

绘制梯度图像：
学习率 a = 0.9：

学习率 a = 0.1：
梯度下降实验报告

实验二：
代码实现：


import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
'''
f(W) = w1^2 + w2^2
W = (1, 3)
a = 0.1
'''

w = np.array([[1, 3]])
a = 0.1
k = 20

for i in range(k):
    w = np.concatenate((w, np.array([[w[-1][0] - a * 2 * w[-1][0], w[-1][1] - a * 2 * w[-1][1]]])), axis=0)

w1 = np.linspace(-3, 3, 20)
w2 = np.linspace(-3, 3, 20)
plt.ion()
x, y = np.meshgrid(w1, w2)
fig = plt.figure()
ax = plt.gca(projection='3d')
ax.set_zlabel('Z', fontdict={'size': 15, 'color': 'red'})
ax.set_ylabel('Y', fontdict={'size': 15, 'color': 'blue'})
ax.set_xlabel('X', fontdict={'size': 15, 'color': 'green'})
ax.plot_surface(x, y, np.square(x)+np.square(y), alpha = 0.5)
print(w)
for i in range(len(w) - 10):
    ax.plot(w[i:i+2, 0], w[i:i+2, 1], [sum(np.square(w[i])), sum(np.square(w[i+1]))], 'r-o')
    print('x: ', w[i:i+2, 0], ' ---> y: ', w[i:i+2, 1],' ----> z: ',  [sum(np.square(w[i])), sum(np.square(w[i+1]))])
    plt.pause(0.5)
plt.ioff()
def press(event):
    if event.key == "escape":
        plt.close()
fig.canvas.mpl_connect('key_press_event', press)

plt.show()

绘制梯度图像：
学习率 a = 0.9：

学习率 a = 0.1:
梯度下降实验报告

Experimental analysis

首先本实验选择的损失函数是凸函数，只有一个最低点。那么影响找到全局最小的损失的因素主要是学习率，训练次数以及参数的初始化。
经过修改学习率，我发现当学习率较大时会导致损失可能变大，当学习率过小时，会导致学习的过程十分缓慢。
训练次数也会影响训练的效果，当训练次数较少时，得不到好的训练效果，当训练次数较大时，训练时间长。
最后就是参数的初始化，初始点没选好，可能会导致初始损失大，需要训练较长的训练时间才能得到较好的效果。

Conclusions

基本实现的实验的要求，实现了梯度下降的同时实现了梯度下降的可视化，对梯度下降有了基本的了解，同时也锻炼个人代码能力。在实现的过程中尽量的让自己使用numpy库以及矩阵运算，遇到了一些在没动手前没遇到过的问题，如矩阵形状误判导致的矩阵运算错误；在第二个实验中也因为对梯度下降的不熟悉，利用计算出的 梯度和来更新两个参数，得到的结果也是没有收敛到最低点（其实是不可以将梯度求和，应当分别对两个参数进行更新）
错误：
w = n p . c o n c a t e n a t e ( ( w , n p . a r r a y ( [ [ w [ − 1 ] [ 0 ] − a ∗ 2 ∗ s u m ( w [ − 1 ] ) , w [ − 1 ] [ 1 ] − a ∗ 2 ∗ s u m ( w [ − 1 ] ) ] ] ) ) , a x i s = 0 ) w = np.concatenate((w, np.array([[w[-1][0] – a * 2 * sum(w[-1]), w[-1][1] – a * 2 * sum(w[-1])]])), axis=0)w =n p .c o n c a t e n a t e ((w ,n p .a r r a y ([[w [−1 ][0 ]−a ∗2 ∗s u m (w [−1 ]),w [−1 ][1 ]−a ∗2 ∗s u m (w [−1 ])]])),a x i s =0 )
正确：
w = n p . c o n c a t e n a t e ( ( w , n p . a r r a y ( [ [ w [ − 1 ] [ 0 ] − a ∗ 2 ∗ w [ − 1 ] [ 0 ] , w [ − 1 ] [ 1 ] − a ∗ 2 ∗ w [ − 1 ] [ 1 ] ] ] ) ) , a x i s = 0 ) w = np.concatenate((w, np.array([[w[-1][0] – a * 2 * w[-1][0], w[-1][1] – a * 2 * w[-1][1]]])), axis=0)w =n p .c o n c a t e n a t e ((w ,n p .a r r a y ([[w [−1 ][0 ]−a ∗2 ∗w [−1 ][0 ],w [−1 ][1 ]−a ∗2 ∗w [−1 ][1 ]]])),a x i s =0 )

当然实验也有缺陷，可以不用记录训练过程中的所有损失，每次记录两个点，也可以可视化出过程，代码也可以封装起来等

Original: https://blog.csdn.net/qq_54804745/article/details/123645110
Author: 是丝豆呀
Title: 梯度下降实验报告

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/692069/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

OpenCV图像识别技术+Mediapipe与Unity引擎的结合

OpenCV图像识别技术+Mediapipe与Unity引擎的结合前言 * Demo效果展示认识Mediapipe 项目环境身体动作捕捉部分 * 关于身体特征点核心代码手…

人工智能 2023年6月19日
00122
pytorch快速上手（9）—–多GPU数据并行训练方法

pytorch提供了两种方式实现并行训练：单机多GPU可以使用 torch.nn.DataParallel接口(DP,旧的) 或者 torch.nn.parallel.Distr…

人工智能 2023年7月21日
0059
Numpy常用函数汇总

本文使用的是Jupyter notebook，因此仅在开头引入了Numpy，后续没有引入，如果在其他编译器中运行的话请确保引入了numpy import numpy as np 1…

人工智能 2023年7月5日
0051
玩转深度学习——pytorch实现Lenet网络

玩转深度学习——pytorch实现Lenet网络 * – 什么是LeNet网络 – LeNet网络pytorch实现 – 改进LeNet网络 &…

人工智能 2023年7月22日
0075
阿克曼移动机器人gazebo仿真项目开源

开源地址 ReadMe 安装一些功能包 Install some packages: sudo apt install ros-melodic-joint-state-publis…

人工智能 2023年6月2日
0080
目标检测学习笔记——NMS、置信度、IOU

一、NMS 非极大值抑制用在最后阶段，即所有边界框都已经回归调整过后，对图片每一类使用NMS防止一个目标出现多个边界框。1、非极大值抑制需要设置一个阈值2、使用时间是最后调整完预测…

人工智能 2023年6月17日
00211
机器学习强基计划1-1：图文详解感知机算法原理+Python实现

目录 0 写在前面 1 什么是线性模型？ 2 感知机概述 3 手推感知机原理 4 Python实现 * 4.1 创建感知机类 4.2 更新权重与偏置 4.3 判断误分类点 4.4 …

人工智能 2023年6月13日
0084
目标检测论文解读复现之四：改进YOLOv5算法在停车场火灾检测中的应用

目标检测论文解读复现文章目录目标检测论文解读复现前言一、摘要二、网络模型及核心创新点三、应用数据集四、实验效果五、实验结论六、投稿期刊介绍前言此前出了目标改进…

人工智能 2023年6月28日
0071
Python三目运算符（三元运算符）用法详解（含Python代码）

一、前言三目运算符，又称条件运算符，是计算机语言（c,c++,java等）的重要组成部分。它是唯一有3个操作数的运算符，有时又称为三元运算符。定义：对于条件表达式 b ? x…

人工智能 2023年7月4日
0047
pandas数据清洗：案例详解 fillna函数填补空缺值

pandas数据清洗：fillna函数填补空缺值 1 fillna函数简介 2 填补空缺值3种方法 * 2.1 构建学习数据 2.2 填补特定值 2.3 用前一个非空缺值填充 2….

人工智能 2023年7月7日
00128
DJL快速入门（纯Java跑深度学习模型）

文章目录 1. 本文介绍 2. DJL核心内容讲解 * 2.1 DJL简介 2.2 DJL核心API – 2.2.1 Criteria 2.2.2 Translator…

人工智能 2023年6月16日
0090
机器学习真能产生智能决策吗？

作者 | 刘礼出品 | AI科技大本营（ID：rgznai100）历经三年时间，我们在2022年完成了图灵奖获得者、加州大学洛杉矶分校计算机科学教授，美国国家科学院院士，被誉为…

人工智能 2023年6月23日
0096
神经网络案例

目录神经网络案例 * 数据加载数据处理模型构建模型编译模型训练模型测试模型保存总结神经网络案例学习目标能够利用tf.keras获取数据集能够构建多层神经网络…

人工智能 2023年5月25日
0043
【PAT甲级 – C++题解】1101 Quick Sort

✍个人博客：https://blog.csdn.net/Newin2020?spm=1011.2415.3001.5343📚专栏地址：PAT题解集合📝原题地址：题目详情 &#821…

人工智能 2023年6月27日
0052
ModuleNotFoundError: No module named ‘cv2‘解决方法

我遇到这个错误是在做YOLO3目标检测的时候，安装anaconda+tensorflow+pycharm后， pycharm命令终端提示ModuleNotFoundError: N…

人工智能 2023年7月10日
0038
ROS+Pytorch的联合使用示例（语义分割）

本篇根据 ROS图像的Deeplab v3+实时语义分割（ROS+Pytorch）进行踩坑记录，并附加一些对应操作的理解。（自觉有很多理解不到位的地方，若有大佬路过还请不吝赐教！…

人工智能 2023年7月22日
0056

2024 年 4 月
一	二	三	四	五	六	日
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

梯度下降实验报告

大家都在看