（一）一元线性回归方程 & 梯度下降

2023年6月17日下午4:32 • 人工智能 • 阅读 52

学习目标：

I. 理解一元线性回归

II. 学会用 “梯度下降法” 和 “相关系数法”求解线性模型

III. 学会用代码来实现该过程

一.一元线性回归

（1） 如何理解”回归分析”？

回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法，是对具有因果关系的影响因素（自变量）和预测对象（因变量）所进行的数理统计分析处理。只有当变量与因变量确实存在某种关系时，建立的回归方程才有意义。因此，作为自变量的因素与作为因变量的预测对象是否有关，相关程度如何，以及判断这种相关程度的把握性多大，就成为进行回归分析必须要解决的问题。进行相关分析，一般要求出相关关系，以相关系数的大小来判断自变量和因变量的相关的程度。

（2）分类

标准1：据自变量和因变量之间的关系类型

线性回归分析和非线性回归分析

标准2：按照自变量的数量

一元回归分析和多元回归分析

一元线性回归的形式为y = a + b x

根据样本观察数据估计出a和b的数值之后，样本回归方程可作为预测模型，即一元线性回归预测模型

（3）求解回归预测模型参数的方法

方法一：根据相关系数与标准差求解

直线可以用公式表示：y=bx+a。

回归线斜率m的公式为：b = r * (SD of y / SD of x)。

转换：x和y值之间的相关系数（r），乘以y值的标准差（SD of y）除以x值的标准偏差（SD of x）。

将样本的均值点代入回归线求出 a

相关系数求解公式：

II.梯度下降法

梯度下降原理：

从一条随机线开始，比如说直线a，我们计算这条线的误差平方和，然后调整斜率和y轴截距，重新计算新行的误差平方和。继续调整，直到达到局部最小值，其中平方误差之和最小。

梯度下降法是一种通过多次迭代最小化误差平方和来逼近最小平方回归线的算法

成本：

” 成本”就是误差（预测值-实际值）的平方和

为了是预测模型更加准确（即成本最低），我们可以通过改变斜率和截距来寻找最佳拟合线

如何改变参数呢？

对其求偏导，可以得到下降最快的方向

我们便引入了梯度下降公式来改变参数值

关键是选择一个合适的学习速率（α ），如果学习速率过小，则会导致收敛速度很慢；如果学习速率过大，那么就会阻碍收敛，即在极值点附近会震荡。

学习速率调整（又称学习速率调度，Learning rate schedules），在每次更新过程中，改变学习速率，如退火。一般使用某种事先设定的策略或者在每次迭代中衰减一个较小的阈值。无论哪种调整方法，都需要事先进行固定设置，这便无法自适应每次学习的数据集特点。

（4）求解步骤

1、散点图判断变量关系（简单线性）；
2、求相关系数及线性验证；
3、求回归系数，建立回归方程；
4、回归方程检验；
5、参数的区间估计；
*6、预测；

实例如下：

import numpy as np
import matplotlib.pyplot as plt

class SimpleRegress(object):
    def __init__(self, x_data, y_data):

        self.x_data = x_data
        self.y_data = y_data
        self.b0 = 0
        self.b1 = 1

        return

    def calculate_work(self):       # 回归方程中b0、b1的求解

        x_mean = np.mean(self.x_data)   # x_mean= 14.0
        y_mean = np.mean(self.y_data)   # y_mean= 130.0
        x1 = self.x_data - x_mean   # x1= [-12.  -8.  -6.  -6.  -2.   2.   6.   6.   8.  12.]
        y1 = self.y_data - y_mean   # y1= [-72. -25. -42. -12. -13.   7.  27.  39.  19.  72.]
        s = x1 * y1     # s= [864. 200. 252.  72.  26.  14. 162. 234. 152. 864.]
        u = x1 * x1     # u= [144.  64.  36.  36.   4.   4.  36.  36.  64. 144.]
        self.b1 = np.sum(s) / np.sum(u)      # b1= 5.0
        self.b0 = y_mean - self.b1 * x_mean       # b0= 60.0

        return

    def test_data_work(self, text_data):    # 回归方程的建立与数值预测

        result = list([])
        for one_test in text_data:
            y = self.b0 + self.b1 * one_test
            result.append(y)
        return result

    def root_data_view(self):    # 绘制源数据可视化图
        plt.scatter(x_data, y_data, label='simple regress', color='k', s=5)  # s 点的大小
        plt.xlabel('x')
        plt.ylabel('y')
        plt.legend()
        plt.show()
        return

    def test_data_view(self):    # 绘制回归线
        # 绘制回归线两个点的数据
        x_min = np.min(self.x_data)
        x_max = np.max(self.x_data)
        y_min = np.min(self.y_data)
        y_max = np.max(self.y_data)
        x_plot = list([x_min, x_max])
        y_plot = list([y_min, y_max])
        # 绘制
        plt.scatter(x_data, y_data, label='root data', color='k', s=5)  # s 点的大小
        plt.plot(x_plot, y_plot, label='regression line')
        plt.xlabel('x')
        plt.ylabel('y')
        plt.legend()
        plt.title('simple linear regression')
        plt.show()
        return

x_data = list([2, 6, 8, 8, 12, 16, 20, 20, 22, 26])
y_data = list([58, 105, 88, 118, 117, 137, 157, 169, 149, 202])
test_data = list([16])

sr = SimpleRegress(x_data, y_data)
sr.calculate_work()
result = sr.test_data_work(test_data)       # result= [140.0]
#sr.root_data_view()
sr.test_data_view()

Original: https://blog.csdn.net/qq_53605735/article/details/121449333
Author: qq_53605735
Title: （一）一元线性回归方程 & 梯度下降

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/630975/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

ML之yellowbrick：基于titanic泰坦尼克是否获救二分类预测数据集利用yellowbrick对LoR逻辑回归模型实现可解释性(阈值图)案例

ML之yellowbrick：基于titanic泰坦尼克是否获救二分类预测数据集利用yellowbrick对LoR逻辑回归模型实现可解释性(阈值图)案例目录基于titanic泰…

人工智能 2023年7月1日
0069
非标准化疾病诉求的简单分诊方案总结

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年5月31日
0082
神经网络数据增强transforms的相关操作（持续更新）

transforms的相关操作（Pytorch）一、图像的相关变化 * 1、格式转换 – （1）transforms.ToTensor() （2）transforms…

人工智能 2023年6月24日
0081
目标检测（二）传统目标检测与识别的特征提取——基于Haar-like特征的Viola Jones检测原理

目录简介积分图训练最优弱分类器训练强分类器强分类器级联分类器简介 Viola Jones检测器由三个核心步骤组成，即Haar-like特征和积分图、Adaboost分…

人工智能 2023年7月12日
0062
训练千亿参数大模型，离不开四种GPU并行策略

作者｜Lilian Weng、Greg Brockman 翻译｜董文文 AI领域的许多最新进展都围绕大规模神经网络展开，但训练大规模神经网络是一项艰巨的工程和研究挑战，需要协调GP…

人工智能 2023年7月13日
0052
损失函数整理（分类和回归）

损失函数用来评价模型的预测值和真实值不一样的程度，损失函数越好，通常模型的性能越好。不同的模型用的损失函数一般也不一样。损失函数分为经验风险损失函数和结构风险损失函数。经验风险损…

人工智能 2023年7月2日
0075
最新最全面的Spring详解（一）——Spring概述与IOC容器

前言本文为【Spring】Spring概述与IOC容器相关知识，下边将对 Spring概述， IOC容&am…

人工智能 2023年7月31日
0057
递归层（Recurren

问题：递归层（Recurren）问题在机器学习和神经网络领域，递归层（Recurren）是一种重要的概念。本文将详细介绍递归层的算法原理、公式推导、计算步骤，并提供一个复杂的Py…

人工智能 2024年1月3日
0028
车路协同智能路侧设备网络安全接入技术要求

1 范围本文件包含智能路侧设备网络安全接入技术要求，包括智能路侧设备连接要求、接入要求、证书管理要求。本文件适用于智能路侧设备网络安全接入的设计与开发。 2 规范性引用文件下…

人工智能 2023年6月30日
0056
如何估算transformer模型的显存大小

在微调GPT/BERT模型时，会经常遇到” cuda out of memory”的情况。这是因为transformer是内存密集型的模型，并且内存要求也随…

人工智能 2023年7月13日
0073
OpenCV-Python实战（8）——直方图均衡化

OpenCV-Python实战（8）——直方图均衡化 * – 0. 前言 – 1. 灰度直方图均衡化 – 2. 颜色直方图均衡化 –…

人工智能 2023年7月19日
0057
python实现K均值聚类算法

之前做大作业的时候本来想用聚类法给点集分类的，但是太复杂了，于是最后没有采用这个方案。现在把之前做的一些工作整理出来写个小博客。 K-means聚类法原理：聚类是一个将数据集中在…

人工智能 2023年6月2日
0080
论文投稿之投稿信（Cover Letter）写法–附真实案例

1 Cover Letter 是什么？ Cover Letter, 即投稿信，是论文投递时与论文一起发送给编辑的信件，其目的是让编辑在阅读你的论文之前，简单了解你文章的基本情况。 …

人工智能 2023年6月24日
0080
VMware三种网络模式详解

VMware三种网络模式 linux重启网络服务命令： *service network restart 一、桥接模式原理：VMware和宿主机，处于同一网段、两者地位平等。（无…

人工智能 2023年6月29日
0069
Stata面板设置与面板数据多元线性回归与泊松回归命令

设置面板 [XT] xtset – Declare data to be panel data xtset panelvar timevar [, tsoptions] xtset…

人工智能 2023年6月17日
00115
WPF_基于ScottPlot的实时曲线绘制

1 安装ScottPlot 2 测试代码 2.1 MainWindow.cs using System; using System.Diagnostics; using Syste…

人工智能 2023年6月28日
0073

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

（一） 一元线性回归方程 & 梯度下降