机器学习多元线性回归模型（公式推导以及代码实现）

2023年6月16日上午9:51 • 人工智能 • 阅读 110

一、理论部分

二、代码实现

三、感想

一、理论部分（公式推导）

1.1、线性回归

矩阵最小二乘法(参考高等代数)

这部分知识可以参考：

求C = y-Y 最小值–> C = y-XA (b = b

)

,…,

,y 通过已知数据获得。

在向量空间L（

,…,

）C垂直于 L（

,…,

）

只需且必须（C,

） = （C,

）=……=（C,

）= (C,

) = 0

联立方程求解就行了。详情请参考链接，里面有例题。（公式在博客里太难编辑了😭）

这里需要注意的是 A*A必须满秩。如果不满秩，方程组的解是一个基础解系，无穷多个解。

什么时候会出现这种情况：如训练集只有3组，而给的特征就有4个，这样上述求的解是无穷个的。（把矩阵化成上三角矩阵就可以看出）

1.2、非线性回归

二、代码实现

2.1、手写代码。（可直接运行）

2.2、代码解释。

    def fit(self, numpy_data, numpy_result):
        np_ones = np.ones((len(numpy_data), 1))
        numpy_data = np.c_[numpy_data, np_ones]
        data_transpose = numpy_data.transpose()
        A = np.matmul(data_transpose, numpy_data)
        b = np.matmul(data_transpose, numpy_result)
        self.result = np.linalg.solve(A, b)

了解公式原理，代码就简单了。

1、创建全为1 numpy类型，添加到数据里。把y = kx+b 中的b看作b乘以全为1的向量

2、求矩阵的转置，transpose（）

3、np.linalg.solve()联立方程组求解。

    def predict(self, data):
        numpy_result = np.zeros(len(data))
        for index, datas in enumerate(data):
            numpy_result[index] = np.sum(
                [data * self.result[index] for index, data in enumerate(datas)])
                 + self.result[-1]
        return numpy_result

这部分是预测，输入一个新的样本数据，我们通过建立的模型进行预测。

data1 = np.array([[3.6, 3.7, 3.8, 3.9]])
data2 = np.array([[i for i in range(1, 5)]])
result_tranpose = np.array([[1.0, 0.9, 0.85, 0.81]])
original_transpose = np.concatenate((data1, data2))
data_original = original_transpose.transpose()
data_result = result_tranpose.transpose()
print(data_original)
print(data_result)

[[3.6 1. ]
 [3.7 2. ]
 [3.8 3. ]
 [3.9 4. ]]

[[1.  ]
 [0.9 ]
 [0.85]
 [0.81]]

我们构造一些数据来进行验证。

    # &#x5EFA;&#x6A21;
    linear = LinearModel()
    linear.fit(data_original, data_result)
    print(linear.result) # &#x8BA1;&#x7B97;&#x7684;&#x7CFB;&#x6570;&#x503C;

    # &#x9884;&#x6D4B;
    predict = linear.predict([[3.6, 1], [3.7, 2]])
    print(predict)

[[ 0.24109375]
 [-0.08610938]
 [ 0.20117188]]

[0.983 0.921]

2.3、完整代码。

import numpy as np

class LinearModel():
    def __init__(self):
        super(LinearModel, self).__init__()

    def fit(self, numpy_data, numpy_result):
        np_ones = np.ones((len(numpy_data), 1))
        numpy_data = np.c_[numpy_data, np_ones]
        data_transpose = numpy_data.transpose()
        A = np.matmul(data_transpose, numpy_data)
        b = np.matmul(data_transpose, numpy_result)
        self.result = np.linalg.solve(A, b)

    def predict(self, data):
        numpy_result = np.zeros(len(data))
        for index, datas in enumerate(data):
            numpy_result[index] = np.sum(
                [data * self.result[index] for index, data in enumerate(datas)]) +
                 self.result[-1]
        return numpy_result

if __name__ == '__main__':
    # &#x6570;&#x636E;&#x96C6;&#x51C6;&#x5907;
    data1 = np.array([[3.6, 3.7, 3.8, 3.9]])
    data2 = np.array([[i for i in range(1, 5)]])
    result_tranpose = np.array([[1.0, 0.9, 0.85, 0.81]])
    original_transpose = np.concatenate((data1, data2))
    data_original = original_transpose.transpose()
    data_result = result_tranpose.transpose()
    # print(data_original)
    # print(data_result)

    # &#x5EFA;&#x6A21;
    linear = LinearModel()
    linear.fit(data_original, data_result)
    print(linear.result) # &#x8BA1;&#x7B97;&#x7684;&#x7CFB;&#x6570;&#x503C;

    # &#x9884;&#x6D4B;
    predict = linear.predict([[3.6, 1], [3.7, 2]])
    print(predict)

实现非线性也比较简单，只需对代码中numpy_result做相应的处理即可。

三、感想

第一次真正意义上写技术博客，说下感想：感谢csdn，基本解决了我所遇到99%的技术难题。也感谢各位大佬们的技术博客，我从中受益匪浅。为了初学者更好的学习，我也贡献一份力量。加油。

（吐槽下，这自带的公式编辑器真难用。小声bb）

Original: https://blog.csdn.net/qq_49560248/article/details/123657933
Author: 神仙罗辑
Title: 机器学习多元线性回归模型（公式推导以及代码实现）

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/623125/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

LIO-SAM从0到1运行自己的数据集

LIO-SAM从0到1运行自己的数据集前言笔者在学习LIO_SAM时踩了不少坑，在此记录从开始到最后整个踩坑过程。文中参考了很多大佬的文章，我只是个搬运工。可以直接跳到第二…

人工智能 2023年6月15日
00102
人工智能在脑电情感分类上干了啥?(二)

啊哦~你想找的内容离你而去了哦内容不存在，可能为如下原因导致： ① 内容还在审核中 ② 内容以前存在，但是由于不符合新的规定而被删除 ③ 内容地址错误 ④ 作者删除了内容。可…

人工智能 2023年7月1日
0071
k-medoids 聚类中距离度量函数的选取对聚类效果的影响

[TencentCloudSDKException] code:FailedOperation.ServiceIsolate message:service is stopped …

人工智能 2023年6月2日
0076
Kettle下载与安装教程【保姆版】

Kettle简介 Kettle最早是一个开源的ETL（Extract-Transform-Load的缩写）工具，全称为KDE Extraction, Transportation,…

人工智能 2023年7月18日
00153
pajek软件_科学知识图谱软件之使用技巧总结

抵扣说明： 1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。2.余额无法直接购买下载，可以购买VIP、C币套餐、付费专栏及课程。 Original: https:…

人工智能 2023年6月1日
0081
值得苦练的100道Python经典练手题，（附详细答案）

嗨喽大家好卷子又来了，100道Python经典练手题奉上花了一周的时间，整理了100道Python的练习题，如果你是一位初学者，那么这一份练习题将会给你带来极大的帮助，如果你能够…

人工智能 2023年7月6日
0079
python中字典推导式

一、字典推导式：二、语法： 1、语法一： 2、语法二：三、字典推导式实战： 1、在字典中提取或者修改数据，返回新的字典： 2、在字符串中提取数据，返回新的字典： 3、将字符串 …

人工智能 2023年7月6日
00112
在anaconda中创建、删除虚拟环境并安装卸载包等问题

一虚拟环境 virtual environment 它是一个虚拟化，从电脑独立开辟出来的环境。通俗的来讲，虚拟环境就是借助虚拟机docker来把一部分内容独立出来，我们把这部分独…

人工智能 2023年5月23日
00115
目标检测算法——YOLOv5结合CA注意力机制

深度学习Tricks，第一时间送达本文中，作者通过将位置信息嵌入到通道注意力中提出了一种新颖的移动网络注意力机制，将其称为” Coordinate Attention…

人工智能 2023年6月17日
0095
bp神经网络是什么网络,神经网络和bp神经网络

1、什么是BP神经网络？ BP算法的基本思想是：学习过程由信号正向传播与误差的反向回传两个部分组成；正向传播时，输入样本从输入层传入，经各隐层依次逐层处理，传向输出层，若输出层输出…

人工智能 2023年7月13日
0092
神经网络模型的参数量和计算量

其实模型的参数量好算，但浮点运算数并不好确定，我们一般也就根据参数量直接估计计算量了。但是像卷积之类的运算，它的参数量比较小，但是运算量非常大，它是一种计算密集型的操作。反观全连接…

人工智能 2023年6月4日
00101
【NeurIPS】神经成像时空回归模型的有效分层贝叶斯推理 Efficient Hierarchical Bayesian Inference

NeurIPS 今天分享的是NeurIPS 2021的一篇论文《神经成像时空回归模型的有效分层贝叶斯推理》原文链接：https://arxiv.org/abs/2111.0169…

人工智能 2023年6月17日
0052
2022 CCF BDCI 返乡发展人群预测 [0.9117+]

一、赛题介绍基于中国联通的大数据能力，通过使用对联通的信令数据、通话数据、互联网行为等数据进行建模，对个人是否会返乡工作进行判断 train.csv:包含全量数据集的70%（da…

人工智能 2023年6月13日
0086
利用python进行数据分析笔记

一、第一章：准备工作 1、引入惯例 Python社区已经广泛采取了一些常用模块的命名惯例： import numpy as np import matplotlib.pyplot …

人工智能 2023年7月16日
0063
【知识图谱系列】解耦Transformation和Propagation的深度图神经网络

作者：CHEONG公众号：AI机器学习与知识图谱研究方向：自然语言处理与知识图谱本文介绍一篇解耦合Transformation和Propagation操作的自适应深度图神经网络模…

人工智能 2023年6月10日
0095
springboot基于知识图谱的短视频推荐系统设计与实现毕业设计源码231115

5 系统操作流程 5.1用户登录流程 5.2信息添加流程对于基于知识图谱的短视频推荐系统，需要随时添加所需要的数据信息，对于用户添加信息，需要根据添加界面，根据选框的内容进行填写…

人工智能 2023年6月1日
0083

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

机器学习多元线性回归模型（公式推导以及代码实现）

一、理论部分

二、代码实现

三、感想

一、理论部分（公式推导）

1.1、线性回归

1.2、非线性回归

二、代码实现

2.1、手写代码。（可直接运行）

2.2、代码解释。

2.3、完整代码。

三、感想

大家都在看