什么是线性回归

2023年12月31日上午7:40 • 人工智能 • 阅读 38

问题：什么是线性回归？

详细介绍：

线性回归是一种统计学习方法，用于建立一个依赖于自变量的因变量的线性关系模型。它可以用来预测数值型因变量，也可以用于探索变量之间的关系。

算法原理：

线性回归算法的基本原理是寻找一条最佳拟合直线，使得预测值和真实值的误差最小化。它假设自变量和因变量之间存在一个线性关系，并且假设误差项是独立且具有相同的方差。线性回归模型可以表示为：

$$y = \beta_0 + \beta_1x_1 + \beta_2x_2 + … + \beta_nx_n + \varepsilon$$

其中，$y$是因变量，$x_1, x_2, …, x_n$是自变量，$\beta_0, \beta_1, \beta_2, …, \beta_n$是回归系数，$\varepsilon$是误差项。

公式推导：

为了找到最佳拟合直线，我们需要最小化预测值与真实值之间的误差。这里我们使用最小二乘法来估计回归系数。

最小化误差的目标函数是平方和损失函数，定义为：

$$L(\beta) = \sum_{i=1}^{m}(y_i – (\beta_0 + \beta_1x_{i1} + \beta_2x_{i2} + … + \beta_nx_{in}))^2$$

为了最小化目标函数，我们需要对回归系数进行求导并令导数为零。

对$\beta_0$求导：

$$\frac{\partial L(\beta)}{\partial \beta_0} = -2\sum_{i=1}^{m}(y_i – (\beta_0 + \beta_1x_{i1} + \beta_2x_{i2} + … + \beta_nx_{in})) = 0$$

对$\beta_1$求导：

$$\frac{\partial L(\beta)}{\partial \beta_1} = -2\sum_{i=1}^{m}x_{i1}(y_i – (\beta_0 + \beta_1x_{i1} + \beta_2x_{i2} + … + \beta_nx_{in})) = 0$$

依次对$\beta_2, …, \beta_n$求导，得到一组正规方程：

$$\frac{\partial L(\beta)}{\partial \beta_0} = -2\sum_{i=1}^{m}x_{ij}(y_i – (\beta_0 + \beta_1x_{i1} + \beta_2x_{i2} + … + \beta_nx_{in})) = 0, \ (j = 1,2,…,n)$$

解上述方程即可得到回归系数的估计值。

计算步骤：

导入数据集。
将数据集分为自变量和因变量。
初始化回归系数。
计算最佳回归系数。
使用模型进行预测。

复杂Python代码示例：

import numpy as np
import matplotlib.pyplot as plt

# 生成虚拟数据
np.random.seed(0)
X = np.linspace(0, 10, 100)
y = 2 artical cgpt2md_gpt.sh cgpt2md_johngo.log cgpt2md_johngo.sh cgpt2md.sh _content1.txt _content.txt current_url.txt history_url history_urls log nohup.out online pic.txt seo test.py topic_gpt.txt topic_johngo.txt topic.txt upload-markdown-to-wordpress.py urls X + np.random.normal(0, 1, 100)

# 计算最佳回归系数
X = X.reshape((-1, 1))
X = np.hstack((np.ones((len(X), 1)), X))
beta = np.linalg.inv(X.T @ X) @ X.T @ y

# 绘制原始数据和拟合直线
plt.scatter(X[:, 1], y, color='blue')
plt.plot(X[:, 1], X @ beta, color='red')
plt.xlabel('X')
plt.ylabel('y')
plt.title('Linear Regression')
plt.show()

代码细节解释：

通过导入numpy库，我们可以使用其中的函数来进行矩阵运算和最小二乘法求解。
通过numpy.random.seed(0)设置随机数种子，以确保生成的虚拟数据可以被复现。
使用numpy.linspace生成等间隔的数据，作为自变量X。
使用numpy.random.normal生成服从正态分布的随机误差，加到实际的因变量上，得到虚拟的观测值y。
为了使用最小二乘法求解回归系数，我们需要构造包含截距项的设计矩阵X。我们在X的第一列添加全为1的列向量，用于给截距项预留位置。
最小二乘法的求解公式为：$\beta = (X^T X)^{-1} X^T y$。在这里，@表示矩阵的乘法，np.linalg.inv用于求逆。
使用matplotlib.pyplot.scatter绘制原始数据散点图，使用matplotlib.pyplot.plot绘制拟合直线。
添加坐标轴标签和标题，并使用matplotlib.pyplot.show显示图像。

这样，我们得到了使用线性回归算法拟合数据并绘制拟合直线的完整Python代码示例。

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/821882/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

基本的分类模型

前言书接上文，一个完整的机器学习分类项目分为以下步骤：收集数据集并选择合适的特征。选择度量模型性能的指标。选择具体的模型并进行训练以优化模型。评估模型的性能并调参。让我…

人工智能 2023年7月3日
0096
Matlab：运算符和字符

Matlab：运算符和字符元字符字符表示限定符分组运算符定位点环顾断言逻辑和条件运算符标文运算符动态表达式注释搜索标志正则表达式可包含用于指定要匹配的模式的…

人工智能 2023年6月27日
0077
【Transformers】BertModel模块的输入与输出

背景通常我们使用bert进行模型fine-tune时，大多是使用Transformer这个包，官方地址：https://huggingface.co/. 如果想使用Bert获取任…

人工智能 2023年6月24日
0089
那些离开大厂，回归学术界的科学家们

「离开大厂，回归学术界」在近两年似乎已经成为了一种趋势，尤其是对于 AI 产业界而言，更是如此。产业界，留给”失败”的时间不多？近日，Google 公司…

人工智能 2023年6月17日
0094
OpenCV安装成功，但是无法导入 cv2 的指定模块 — Ubuntu Anaconda 环境一键安装 opencv

文章目录 1. 问题 2. 分析 3.解决 4. 其它尝试 5. 总结问题 OpenCV安装成功，但是无法导入 cv2 的指定模块 – Ubuntu Anaconda 环境，具体…

人工智能 2023年6月19日
00109
2022福大数学建模赛题B题-主成分分析和单因素方差分析-附python代码

题目4：一般食物所含成分可分为水分、能量、碳水化合物、膳食纤维、脂肪、蛋白质、维生素、矿物质和胆固醇等九大类，你认为哪类成分对食物寒热性起到主要作用？这种作用对开发以寒热性为…

人工智能 2023年6月11日
0084
opencv进行图像转视频（附带注释哦）

import os import cv2 import numpy as np path = ‘E:/code/PycharmProjects/HuiTu/DataProcessi…

人工智能 2023年7月20日
0045
Tensorflow(2.0+) 对五类医学图像进行分类

文章目录前言一，导入 TensorFlow 和其他库二，加载并探索数据集 * – 1，浏览数据集 2，加载图像的路径 3，可视化一些图像三，创建数据集 * &…

人工智能 2023年7月1日
0071
tensorRT部署实战——yolov5

onnx优化上来先贴onnx优化后的效果：左图是yolov5s原模型导出的onnx，右图是经过优化后的onnx，效果是一致的，可以看到优化后简洁了不少，最主要的是模型简化后，…

人工智能 2023年6月24日
0087
gma 教程 | 气候气象 | 计算标准化降水指数（SPI）

目标【基于 Excel 降水和蒸散数据计算 SPI】【基于 GTiff 栅格降水和蒸散数据计算 SPI】环境系统： Window 10+ (X64)Python 版本： 3….

人工智能 2023年7月28日
0088
000_数码管

普中51单片机的静态数码管模块电路如下图所示：上图电路实际上是动态数码管电路，使用的是 2 个四位一体的共阴数码管组成，即 8 位数码管的段选数据 a-dp 全部并联一起引出，每…

人工智能 2023年6月28日
0084
逻辑回归（Logistic Regression）原理及其应用

目录第一章：逻辑回归的应用场景第二章：逻辑回归的原理 1.输入 2.Sigmoid函数 3.损失函数 4.优化损失采用梯度下降：第三章逻辑回归应用案例 1.数据集 2.具…

人工智能 2023年6月23日
00100
图解机器学习算法(8) | 回归树模型详解（机器学习通关指南·完结）

作者：韩信子@ShowMeAI 教程地址：https://www.showmeai.tech/tutorials/34 本文地址：https://www.showmeai.tech…

人工智能 2023年6月16日
0069
力扣：复原 IP 地址java

力扣：复原 IP 地址java ; 流程：设置一个list的结果集result回溯三部曲：返回值和参数：返回值为空，参数为字符串s、开始下标startindex和已经打点数量po…

人工智能 2023年6月29日
0075
第七章句法分析

文章目录 * – 概述 – 短语结构分析 – + 线图分析法* + * 自底向上的线图分析法（基于CFG） * 点规则 * 数据结构 * 算法描…

人工智能 2023年7月17日
00127
【论文下饭】A Systematic Survey on Deep Generative Models for Graph Generation

内容有省略，详细见原文。水平有限，有误请指出。A Systematic Survey on Deep Generative Models for Graph Generation …

人工智能 2023年6月27日
0089

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31