求解线性回归方程

2023年6月18日下午2:16 • 人工智能 • 阅读 60

已知数据集( x 1 , y 1 ) , ( x 2 , y 2 ) . . . ( x N , y N ) {(x_1, y_1), (x_2, y_2)…(x_N, y_N)}(x 1 ,y 1 ),(x 2 ,y 2 )…(x N ,y N )
假设一元线性回归方程为y ^ = b ∗ x + a \hat y = bx+a y ^=b ∗x +a，接下来用最小二乘法求解a和b
损失函数 L ( a , b ) = Σ i = 1 N ( y ^ i − y i ) 2 = Σ i = 1 N ( b ∗ x i + a − y i ) 2 \displaystyle 损失函数\mathcal{L}(a, b) = \Sigma_{i=1}^N (\hat y_i-y_i)^2 = \Sigma_{i=1}^N (bx_i+a-y_i)^2 损失函数L (a ,b )=Σi =1 N (y ^i −y i )2 =Σi =1 N (b ∗x i +a −y i )2
∂ L ∂ a = Σ i = 1 N 2 ( b ∗ x i + a − y i ) = Σ i = 1 N 2 b x i + 2 a N − Σ i = 1 N y i = 2 b N x ‾ + 2 a N − N y ‾ = 2 N ( b x ‾ + a − y ‾ ) \displaystyle \frac {\partial \mathcal{L}} {\partial a} = \Sigma_{i=1}^N 2(b*x_i+a-y_i) = \Sigma_{i=1}^N 2bx_i + 2aN – \Sigma_{i=1}^N y_i =2bN \overline x +2aN-N \overline y = 2N(b \overline x +a- \overline y)∂a ∂L =Σi =1 N 2 (b ∗x i +a −y i )=Σi =1 N 2 b x i +2 a N −Σi =1 N y i =2 b N x +2 a N −N y =2 N (b x +a −y )
令∂ L ∂ a = 0 \displaystyle \frac {\partial \mathcal{L}} {\partial a} = 0 ∂a ∂L =0，求得a = y ‾ − b x ‾ a = \overline y-b \overline x a =y −b x，带入L ( a , b ) \mathcal{L}(a, b)L (a ,b )

L ( a , b ) = Σ i = 1 N ( b ∗ x i + y ‾ − b x ‾ − y i ) 2 = Σ i = 1 N [ b ( x i − x ‾ ) − ( y i − y ‾ ) ] 2 \displaystyle \mathcal{L}(a, b) = \Sigma_{i=1}^N (b*x_i + \overline y – b \overline x – y_i)^2 = \Sigma_{i=1}^N [b(x_i – \overline x) – (y_i – \overline y)]^2 L (a ,b )=Σi =1 N (b ∗x i +y −b x −y i )2 =Σi =1 N [b (x i −x )−(y i −y )]2

∂ L ∂ b = Σ i = 1 N 2 ( x i − x ‾ ) [ b ( x i − x ‾ ) − ( y i − y ‾ ) ] = Σ i = 1 N [ 2 b ( x i − x ‾ ) 2 − 2 ( x i − x ‾ ) ( y i − y ‾ ) ] = 2 b Σ i = 1 N ( x i − x ‾ ) 2 − 2 Σ i = 1 N ( x i − x ‾ ) ( y i − y ‾ ) = 2 b V a r ( x ) − 2 C o v ( x , y ) \displaystyle \frac {\partial \mathcal{L}} {\partial b} = \Sigma_{i=1}^N 2(x_i – \overline x )[b(x_i – \overline x) – (y_i – \overline y)] = \Sigma_{i=1}^N[2b(x_i – \overline x)^2 – 2(x_i – \overline x)(y_i – \overline y)] = 2b\Sigma_{i=1}^N (x_i – \overline x)^2 – 2\Sigma_{i=1}^N (x_i – \overline x)(y_i – \overline y) =2bVar(x) – 2Cov(x, y)∂b ∂L =Σi =1 N 2 (x i −x )[b (x i −x )−(y i −y )]=Σi =1 N [2 b (x i −x )2 −2 (x i −x )(y i −y )]=2 b Σi =1 N (x i −x )2 −2 Σi =1 N (x i −x )(y i −y )=2 b V a r (x )−2 C o v (x ,y )
令∂ L ∂ b = 0 \displaystyle \frac {\partial \mathcal{L}} {\partial b} = 0 ∂b ∂L =0，求得b = C o v ( x , y ) V a r ( x ) \displaystyle b = \frac {Cov(x, y)} {Var(x)}b =V a r (x )C o v (x ,y )

上面处理的是x i , y i ∈ R x_i, y_i \in R x i ,y i ∈R的情况，下面讨论多变量线性回归。假设 x i ∈ R 1 × D （行向量） , y i ∈ R , x ∈ R N × D , y ∈ R N \boldsymbol x_i \in R^{1 \times D}（\textbf {行向量}）, \boldsymbol y_i \in R, \boldsymbol x \in R^{N \times D}, \boldsymbol y \in R^N x i ∈R 1 ×D （行向量）,y i ∈R ,x ∈R N ×D ,y ∈R N，其中N为样本总个数，D为特征维数。
假设线性回归模型为y ^ = x ⋅ θ \hat \boldsymbol y = \boldsymbol x \cdot \boldsymbol \theta y ^=x ⋅θ，接下来用最小二乘法求解θ ∈ R D \boldsymbol \theta \in R^D θ∈R D
损失函数 L ( θ ) = ∣ ∣ x θ − y ∣ ∣ 2 = ∣ ∣ e ∣ ∣ 2 = e T e , ( e = x θ − y ) 损失函数\mathcal{L}(\boldsymbol \theta) = || \boldsymbol x \boldsymbol \theta – \boldsymbol y||^2 = ||\boldsymbol e||^2 = \boldsymbol e^\mathrm T \boldsymbol e, (\boldsymbol e = \boldsymbol x \boldsymbol \theta – \boldsymbol y)损失函数L (θ)=∣∣x θ−y ∣∣2 =∣∣e ∣∣2 =e T e ,(e =x θ−y )
根据链式法则
∂ L ∂ θ = ∂ L ∂ e ∂ e ∂ θ = 2 e T x = 2 ( x θ − y ) T x = 2 θ T x T x − 2 y T x \displaystyle \frac {\partial \mathcal{L}} {\partial \boldsymbol \theta} = \frac {\partial \mathcal{L}} {\partial \boldsymbol e} \frac {\partial \boldsymbol e} {\partial \boldsymbol \theta}= 2\boldsymbol e^\mathrm T\boldsymbol x = 2(\boldsymbol x \boldsymbol \theta – \boldsymbol y)^\mathrm T \boldsymbol x = 2\boldsymbol \theta^\mathrm T \boldsymbol x^\mathrm T \boldsymbol x – 2\boldsymbol y^\mathrm T \boldsymbol x ∂θ∂L =∂e ∂L ∂θ∂e =2 e T x =2 (x θ−y )T x =2 θT x T x −2 y T x

令∂ L ∂ θ = 0 \displaystyle \frac {\partial \mathcal{L}} {\partial \boldsymbol \theta} = 0 ∂θ∂L =0，得到θ T x T x = y T x \boldsymbol \theta^\mathrm T \boldsymbol x^\mathrm T \boldsymbol x = \boldsymbol y^\mathrm T \boldsymbol x θT x T x =y T x，两边同时转置，得到x T x θ = x T y \boldsymbol x^\mathrm T \boldsymbol x \boldsymbol \theta = \boldsymbol x^\mathrm T \boldsymbol y x T x θ=x T y
注意x T x ∈ R D × D \displaystyle \boldsymbol x^\mathrm T \boldsymbol x \in R^{D \times D}x T x ∈R D ×D是一个半正定对称矩阵，可逆。因此，最终的解为
θ = ( x T x ) − 1 x T y \boldsymbol \theta = (\boldsymbol x^\mathrm T \boldsymbol x )^{-1}\boldsymbol x^\mathrm T \boldsymbol y θ=(x T x )−1 x T y

mathematics for machine learning
http://detexify.kirelabs.org/symbols.html
https://www.jianshu.com/p/6de552393933

Original: https://blog.csdn.net/u011450367/article/details/121844479
Author: 小志8554
Title: 求解线性回归方程

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/635384/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

【人脸识别】基于facenet_pytorch实现人脸识别

该代码可以在Pycharm、Jupyter、Python等Python编译器中运行，本文我使用的是Pycharm。一、安装（一）安装pytorch（cpu）首先在Pychar…

人工智能 2023年5月26日
0066
pip安装ctypes、subprocess以及tensorflow-gpu2.4失败

(Window) ctypes、subprocess ERROR: Could not find a version that satisfies the requirement …

人工智能 2023年5月23日
0067
用makesense数据标注后.csv文件处理

data_dir = ‘D:\\Project\\test\\picture\\data.csv’ #数据路径 df = pd.read_csv(data_dir,header =…

人工智能 2023年7月7日
0098
机器学习笔记02（多元线性回归&logistics回归&正则化）

文章目录 01 引言(多元线性回归) * 多元线性回归 – + 梯度下降梯度下降技巧01-特征缩放梯度下降技巧02-学习率与终止迭代条件用多项式回归模型 02 N…

人工智能 2023年6月18日
0080
时间序列分析（3）| ARMA模型的拟合

本篇来介绍根据已有的时间序列数据来拟合ARMA模型。需要说明的是不同阶数的ARMA模型可能近似或完全等价，因此模型估计的结果也不是唯一的；筛选标准通常遵守简练性原则。 1 arim…

人工智能 2023年6月11日
0076
思维图形化：探索如何重塑知识？

我们学习到的某一个领域的知识，很少会孤立存在的。当我们有意识地去发掘的时候，便会惊讶地发现：它们之间存在联系。这也就是我写这一篇文章的目的，尝试去建立对于思维图形化的推理过程。显然…

人工智能 2023年6月1日
0077
骨传导和气传导那个更好？骨传导的概念及骨传导与空气传导的区别

骨传导耳机是一种通过骨骼传递声音的蓝牙耳机，具有普通蓝牙耳机的音乐播放和语音通信功能。同时，由于佩戴稳定，非常适合在运动场景中使用。它也受到了许多体育爱好者的喜爱。近日，一款名为《…

人工智能 2023年5月27日
0071
The Power of Scale for Parameter-Efficient Prompt Tuning及prefix tuning与prompt tuning的区别

1.本文贡献（1）提出prompt tuning，并在大型语言模型领域展示其与model tuning(fine tuning)的竞争力；（2）减少了许多设计选择，显示质量和鲁…

人工智能 2023年5月27日
0062
einops库中rearrange，reduce和repeat的介绍

用法介绍 einops是一个简洁优雅操作张量的库，并且支持对numpy，pytorch，tensorflow中的张量进行操作，该库最大的优点是函数的使用逻辑清晰明了，其中中常用的三…

人工智能 2023年5月23日
00125
使用sklearn-LDA分析微博评论数据并进行主题聚类可视化

最近从微博评论中获取了部分关于俄乌局势的评论，于是尝试根据评论内容进行简单的LDA主题聚类分析。主要涉及评论数据清洗、LDA数据分析、pyLDAvis可视化、困惑度计算。一、数据…

人工智能 2023年6月15日
0072
2022计算机保研夏令营记录

本科院校：BNU专业排名：4/50奖项：国奖（入营之后发现人均国奖），数学建模全国一，数学竞赛全国二，其他不重要奖项2333科研：一段国家大创参与，一项老师的课题参与，参营时是一篇…

人工智能 2023年5月30日
0065
时间序列突变点检测

我对时间序列异常点算法小结：当前异常检测类型：最重要的异常类型，例如意外的峰值、下降、趋势变化和水平转移我主要研究的是负荷预测的突变点，所以异常针对的是： STL分解: 你所…

人工智能 2023年6月16日
0068
PyTorch深度学习实践——多分类问题

多分类问题多分类问题 Softmax 在Minist数据集上实现多分类问题作业课程来源：PyTorch深度学习实践——河北工业大学《PyTorch深度学习实践》完结合集_哔…

人工智能 2023年6月4日
0094
Python实现K-Means聚类（案例：用户分类）

K-Means聚类算法介绍 K-Means聚类算法基础原理 K-Means聚类算法实现流程开始做一个简单的聚类数据导入数据探索开始聚类查看输出结果聚类质心 K-Mean…

人工智能 2023年7月3日
0070
【技术笔记】Python调用neo4j接口实现数据操作

在知识图谱工作处理中，难免会接触到图数据库，而neo4j在这个领域排名领先的厂商，因此在这里整理一些自己在工作中常见的数据处理函数。此处主要针对 Python开发语言的同仁们。欢迎…

人工智能 2023年6月1日
0089
基于python利用statsmodels实现一元线性回归、高阶回归以及自变量为分类变量的回归（逐行代码解读，超细节）

一元线性回归 #导入要用的包，没有下载包的要用pip install安装对应的包 import numpy as np import matplotlib.pyplot as pl…

人工智能 2023年6月17日
0092

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

求解线性回归方程

大家都在看