多项式回归——梯度下降

2023年6月17日上午11:31 • 人工智能 • 阅读 99

文章目录

前言
一、随机梯度下降是什么？
二、代码实现
*
1.引入库
2.建立训练集和测试集
3.多项式回归实现
–
三、实验过程
*
第一次实验
第二次实验
总结

前言

本文使用随机梯度下降，进行多项式回归参数估计，线性回归请参考
线性回归——梯度下降

一、随机梯度下降是什么？

梯度下降是迭代法的一种,可以用于求解最小二乘问题(线性和非线性都可以)。在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。在求解损失函数的最小值时，可以通过梯度下降法来一步步的迭代求解，得到最小化的损失函数和模型参数值。反过来，如果我们需要求解损失函数的最大值，这时就需要用梯度上升法来迭代了。在机器学习中，基于基本的梯度下降法发展了两种梯度下降方法，分别为随机梯度下降法和批量梯度下降法。

二、代码实现

1.引入库

代码如下（示例）：

import numpy as np
import matplotlib.pyplot as plt

2.建立训练集和测试集

代码如下（示例）：

建立训练集和测试集
data = [5.1, 8.2, 11.5, 13.9, 15.1, 16.2]
target = [2.14, 4.62, 8.24, 11.24, 13.99, 16.33]
test = [19.6, 23.3]
test_target = [19.23, 28.74]

该处使用的自定义数据集。

3.多项式回归实现

3.1初始参数

代码如下（示例）：


使用曲线u = w1*x²+w2*x +b 拟合

w1 = 1  #  权重1设置为0
w2 = 0  #  权重2设置为0
b1 = 0  # 截距设置为0

esum = 100
n = 1

使用曲线y = wx +b 拟合
w = 0  # 权重设置为0
b = 0  # 截距设置为0
esum = 100  # 训练集样本误差之和，初始值100
n = 1 # 训练次数

3.2计算最优参数

代码如下（示例）：

计算最优权重
while(abs(esum)>0.0000001):  # 当训练集误差之和的绝对值小于0.0000001时跳出循环
    i = np.random.randint(0,5)
    e = (data[i]*data[i]*w1 + data[i]*w2 +b1)-target[i]  # 计算误差
    w1= w1 - e*data[i]*w1*0.0001  # 随机下降梯度步长设置为0.0001，这里的权重变化与线性回归不同
    w2 = w2 - e*data[i]*0.0001
    b1 = b1-e*0.02
    for i in range(len(data)):  # 计算样本误差之和
        esum = (data[i]*data[i]*w1 + data[i]*w2 +b1)-target[i]
    # if n%100000 == 0:  # 结果呈现
    #     print("第{:}次".format(n))
    #     print("此时训练集误差之和为：%.2f"%esum)
    n+=1

3.3计算训练集和测试集误差

代码如下（示例）：


err = []
scount = []
err_train = []
scount_train=[]

计算训练样本误差
for i in range(len(data)):
    e = (data[i]*data[i]*w1 + data[i]*w2 +b1)-target[i]
    p = e/target[i]
    err_train.append(e)
    scount_train.append(p)

计算测试样本误差
for i in range(len(test)):
    e = (test[i]*test[i]*w1 + test[i]*w2 +b1)-test_target[i]
    p = e/test_target[i]
    err.append(e)
    scount.append(p)

3.4评价模型

代码如下（示例）：

sst = 0
sse = 0
sum =0

求target平均值
for i in range(len(test_target)):
    sum += test_target[i]
avg = sum/len(test_target)

评价模型
for i in range(len(test_target)):
        sst += (test_target[i] - avg)**2
        sse += ((test[i]*test[i]*w1 + test[i]*w2 +b1)-test_target[i])**2

3.4输出结果并显示图像

代码如下（示例）：

结果输出
print("随机梯度下降：线性回归")
print("测试集评价模型{}".format(1-sse/sst))
print('训练结束，共运行{}次，最后一次训练集总误差{}'.format(n, esum))
print(w1, w2 , b1)  # 输出参数
print('训练集样本误差和误差百分比：', end='')
print( err_train, scount_train)
print('测试集样本误差和误差百分比：', end='')
print( err, scount)

图像显示
x = data + test
x = np.reshape(x, newshape=(len(x), 1))
y = target + test_target
y = np.reshape(y, newshape=(len(y), 1))
plt.scatter(x, y)
plt.plot(x, x*x*w1 + x*w2 +b1)
plt.show()

三、实验过程

第一次实验

训练样本总误差设置为1时：
运行实现

结果分析：
此时各参数为w1 = 0.1236386691, w2 = -1.3383115579, b = 6.0582175292526905。发现对于训练集的误差总和可以达到1，但是测试集的误差平均在44%，

; 第二次实验

2、当把训练集总误差设置为0.0000001时
运行实现

结果分析：发现对于训练集的误差总和可以达到0.0000000744，但是测试集的误差平均在28%，，发现曲线只是更加拟合训练集，并没有对测试集有影响。由于数据集数量过少，导致结果并不精准。

总结

虽然在设置更小的总误差情况下，测试集误差出现下降趋势，但测试集误差仍然太大。所以，该曲线存在过拟合现象。
解决办法：1、使用更加简单的曲线。2、忽略某些点，但由于训练集过少，所以只能降维，即回到了第一个线性回归方法。

Original: https://blog.csdn.net/m0_47970623/article/details/124531020
Author: 不会就用洛必达
Title: 多项式回归——梯度下降

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/629937/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

物理信息驱动的深度学习方向重要进展与趋势

喜欢可点赞关注，并收藏，您的支持就是我的写作的动力物理信息驱动的深度学习(PINN)方向重要进展与趋势物理信息驱动的深度学习入门到详解近年来，物理信息驱动的深度学习方法发展迅…

人工智能 2023年6月17日
00112
mac自动给视频加字幕（ffmpeg，autosub）

mac python3.8 自动给视频加字幕（ffmpeg，autosub实现）安装ffmpeg 安装autosub 网课没字幕听起来不习惯，所以尝试给mp4视频文件加上字幕，内…

人工智能 2023年5月25日
0077
《Pytorch深度学习实践》课程合集（刘二大人）笔记

目录 2 线性模型 * 深度学习步骤 ML常用损失函数模型可视化 visdom包 3 梯度下降 4 反向传播 5 用pytorch 实现线性回归 * numpy中的自动广播机制 …

人工智能 2023年6月24日
0096
利用Tushare获取股票数据（全面详细，照着敲就可以）

一.tushare简介tushare是一个免费,开源的python财经数据接口包.主要实现对股票等金融数据从数据采集、清洗加工到数据存储的过程，能够为金融分析人员提供快速、整洁、和…

人工智能 2023年7月4日
00207
【机器学习算法】关联规则-1 关联规则的概念，Apriori算法，实例和优缺点

目录关联规则关联规则的概念：关联规则的评估指标-评估指标也就是支持度和置信度APriori算法Apriori的步骤Apriori算法的实例说明Apriori算法的实例的缺点及瓶颈…

人工智能 2023年6月19日
00144
YOLO-批量将xml转换为txt和利用txt在原图上重现标注框

有两个博主，选转载好像不能弄，不要脸的选了原创批量将xml转换为txt 原博主写的很好，需要注意的主要是文件的路径（点这个跳转）运行流程 1.你需要先把所有的.xml文件的文件…

人工智能 2023年7月10日
0089
知识图谱——从零开始用neo4j框架对csv文件构建知识图谱（三）——构建知识图谱

知识图谱——从零开始用neo4j框架对csv文件构建知识图谱（一）——安装neo4j知识图谱——从零开始用neo4j框架对csv文件构建知识图谱（二）——构建三元组1.构建实体文件…

人工智能 2023年6月10日
0090
Pandas 模块-操纵数据(6)-DataFrame 使用自定义函数

目录 6. DataFrame 使用自定义函数 6.1 操作整个 DataFrame 的函数：.pipe() 6.1.1 .pipe() 语法 6.1.2 .pipe() 范例 6…

人工智能 2023年7月6日
0091
「高效程序员的修炼」快速上手Shell编程、执行与定时任务

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月26日
0084
Metashape（Photoscan）【制作DOM和DEM】超级详细的步骤，文末有安装包

Metashape（Photoscan）【制作DOM和DEM】超级详细的步骤 1. Metashape软件操作简介 * 1.1.Metashape页面简介 1.2.Metashap…

人工智能 2023年6月17日
0083
pytorch 多分类中的损失函数

前言 pytorch 中的损失函数： CrossEntropyLoss LogSoftmax NLLLoss Softmax 在多分类的时候，我们希望输出是符合概率分布的，所以利用…

人工智能 2023年7月3日
00126
Python读取显示raw图片+numpy基本用法记录

这次任务是拿到了几张raw图片，没其他头文件或信息，需要对raw图片使用python打开并显示（作为了一个初学者，整天搞jpg、png，突然来了个raw，表示很头大） 1.获取r…

人工智能 2023年6月19日
00128
『Python』Excel文件的读取以及DataFrame的相关操作（2）

最近经常使用 p y t h o n python p y t h o n 对 E x c e l Excel E x c e l 文件进行 E T L ETL E T L 操作，…

人工智能 2023年7月6日
0060
高光谱、多光谱与全色遥感影像的成像原理及相互融合

consider the tradeoff between spectral resolution, spatial resolution, light throughput an…

人工智能 2023年6月18日
0083
chatGPT代码写的有点好啊，程序员要失业了？

最近，这个聊天机器人有点火啊，是OpenAI推出的chatGPT，它能够回答各种各样的问题，还能生成代码，修复bug。 ChatGPT 是一个基于对话的原型 AI 聊天机器人，12…

人工智能 2023年7月31日
0066
机器学习之二分类模型评价指标

机器学习之二分类模型评价指标一、二分类模型衡量指标 * 1.1 混淆矩阵：Confusion matrix – 1.1.1 原理 1.1.2 实现 1.2 精确度：A…

人工智能 2023年7月2日
00108

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

多项式回归——梯度下降

文章目录

1.引入库

2.建立训练集和测试集

3.多项式回归实现

3.1初始参数

3.2计算最优参数

3.3计算训练集和测试集误差

3.4评价模型

3.4输出结果并显示图像

第一次实验

; 第二次实验

大家都在看