使用python来完成数据的线性拟合

2023年6月15日上午2:50 • 人工智能 • 阅读 97

拟合，顾名思义就是通过对数据的分析，找到数据之间的数学关系，把这种关系的本质理解的越深，得到的拟合度就越高，越能清晰描述数据间的相互联系。拟合有线性拟合和非线性拟合（多项式拟合）。本文着重线性拟合的思想，因为非线性拟合通过一定方法可以转换为线性拟合。演示代码用python实现。

我们有一组点序列（x0,y0),(x1,y1),(x2,y2),…(xn,yn)。假如y与x是线性关系，可以表示为y=ax+b（直线方程），那么拟合就是要得到a和b这两个参数的值。得到最佳的a与b，从而使得点序列中所有点到此直线的距离之和最短。

完成一个拟合的练习，这里练习代码的思路是：

指定好a和b的值，即模型已知（便于对比最后结果的准确度)，生成一组数据X和Y。
给数据增加噪声，生成待拟合的样本数据。
本代码中提供了三种方法来拟合样本。

三种方法中选择1种进行拟合，从样本数据中计算权重参数a_和b_。

4.将拟合到的结果可视化

import numpy as np
from sklearn.linear_model import LinearRegression
from matplotlib import pyplot as plt

SAMPLE_NUM = 100
print("您当前的样本数目为:",SAMPLE_NUM)

先预设一个结果，假定拟合的结果为 y=-6x+10
X = np.linspace(-10, 10, SAMPLE_NUM)
a = -6
b = 10
Y = list(map(lambda x: a * x + b, X))
print("标准答案为：y={}*x+{}".format(a, b))

增加噪声，制造数据
Y_noise = list(map(lambda y: y + np.random.randn()*10, Y))
plt.scatter(X, Y_noise)
plt.title("data to be fitted")
plt.xlabel("x")
plt.ylabel("y")
plt.show()

A = np.stack((X, np.ones(SAMPLE_NUM)), axis=1)  # shape=(SAMPLE_NUM,2)
b = np.array(Y_noise).reshape((SAMPLE_NUM, 1))

print("方法列表如下:"
      "1.最小二乘法 least square method "
      "2.常规方程法 Normal Equation "
      "3.线性回归法 Linear regression")
method = int(input("请选择您的拟合方法: "))

Y_predict=list()
if method == 1:
    theta, _, _, _ = np.linalg.lstsq(A, b, rcond=None)
    # theta=np.polyfit(X,Y_noise,deg=1) 也可以换此函数来实现拟合X和Y_noise,注意deg为x的最高次幂，线性模型y=ax+b中，x最高次幂为1.

    # theta=np.linalg.solve(A,b) 不推荐使用
    theta = theta.flatten()
    a_ = theta[0]
    b_ = theta[1]
    print("拟合结果为: y={:.4f}*x+{:.4f}".format(a_, b_))
    Y_predict = list(map(lambda x: a_ * x + b_, X))

elif method == 2:
    AT = A.T
    A1 = np.matmul(AT, A)
    A2 = np.linalg.inv(A1)
    A3 = np.matmul(A2, AT)
    A4 = np.matmul(A3, b)
    A4 = A4.flatten()
    a_ = A4[0]
    b_ = A4[1]
    print("拟合结果为: y={:.4f}*x+{:.4f}".format(a_, b_))
    Y_predict=list(map(lambda x:a_*x+b_,X))

elif method == 3:
    # 利用线性回归模型拟合数据，构建模型
    model = LinearRegression()
    X_normalized = np.stack((X, np.ones(SAMPLE_NUM)), axis=1)  # shape=(50,2)
    Y_noise_normalized = np.array(Y_noise).reshape((SAMPLE_NUM, 1))  #
    model.fit(X_normalized, Y_noise_normalized)
    # 利用已经拟合到的模型进行预测
    Y_predict = model.predict(X_normalized)
    # 求出线性模型y=ax+b中的a和b，确认是否和我们的设定是否一致
    a_ = model.coef_.flatten()[0]
    b_ = model.intercept_[0]
    print("拟合结果为: y={:.4f}*x+{:.4f}".format(a_, b_))

else:
    print("请重新选择")

plt.scatter(X, Y_noise)
plt.plot(X, Y_predict, c='green')
plt.title("method {}: y={:.4f}*x+{:.4f}".format(method, a_, b_))
plt.show()

结果分析，代码中生成的样本为100个点，上图为得到的拟合结果。如果要得到更准确的拟合结果，不妨设置SAMPLE_NUM为更大的数，会得到更好的拟合效果。我这里做了一组测试对比：可以明显看出，随着样本点数目的增多，拟合结果越来越逼近 y= -6*x+10这个标准答案了。

拟合结果对比样本点数目ab5

-6.0153

10.6758

-5.9589

10.0761

500

-5.9856

9.9706

5000

-6.0021

10.0086

50000

-6.0002

10.0002

Original: https://blog.csdn.net/u010824101/article/details/122027055
Author: 布鲁斯度
Title: 使用python来完成数据的线性拟合

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/613470/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

pytorch :OSError: [WinError 1455] 页面文件太小，无法完成操作。 Error loading 【已解决】

OSError: [WinError 1455] 页面文件太小，无法完成操作。 Error loading “D:\ProgramData\Anaconda3\envs…

人工智能 2023年7月25日
0093
【节点分类】python实现：4种(GNN,GAN,SAGE,APPNP)图神经网络（-dgl库-pytorch-cuda-）

信息系统建模作业，要求是使用四种不同的节点表征方法两个3k+数据集环境：pytorch cuda11.1 dgl-0.6.1（cuda环境配置指路：我发的第一篇文章） dgl库各种…

人工智能 2023年7月12日
0085
3. Matplotlib基础学习库

1 什么是Matplotlib 是专门用于开发2D图表(包括3D图表) 以渐进、交互式方式实现数据可视化 2 为什么要学习Matplotlib 可视化是在整个数据挖掘的关键辅助工具…

人工智能 2023年7月17日
0066
JAVA整合Milvus矢量数据库及数据

背景：目前milvsu版本迭代至2.0，已经可以支持直接在docker环境下运行目录一、Milvus的基本情况什么是 Milvus 向量数据库？非结构化数据特征向量向量…

人工智能 2023年6月19日
00748
注意力机制模块

1.SENet SENet为通道注意力机制模块实现方式： 1.首先对输入进来的特征层进行一个全局池化，将【b,c,h,w】 -> 【b,c,1,1】 2.对全局池化后的特…

人工智能 2023年7月29日
0070
OpenCV图像处理入门

😊😊😊 欢迎来到本博客😊😊😊本次博客内容将继续讲解关于OpenCV的相关知识🎉 作者简介：⭐️⭐️⭐️ 目前计算机研究生在读。主要研究方向是人工智能和群智能算法方向。目前熟悉pyt…

人工智能 2023年6月17日
0073
keras重载继续训练的问题

colab的时间有限额，被中断后，要重新连接，加载模型继续训练。出现的问题是，每次重新加载模型后，训练开始的loss都会比中断前的loss大很大，训练几个batch后，loss会慢…

人工智能 2023年5月24日
0057
Spark性能调优案例-优化spark估计表大小失败和小表关联走 broadcast join

A任务中关联一张表，该表经过过滤和去重，数据量小于10MB，实际任务耗时较长。B任务关联一张小表，实际任务耗时较长 A任务排查查看spark UIsql界面：问题1：发现并没有走…

人工智能 2023年6月29日
0085
用Python实现九九乘法表的几种方式，入门必备案例！超级简单！

我们在学习Python的过程中需要不断的积累和练习，这样才能够走的更远，今天一起来学习怎么用Python写九九乘法表~ 第一种方法、for-for 代码： for i in ran…

人工智能 2023年7月5日
0065
ISODATA算法 python实现

文章目录前言一、ISODATA的流程 * 1.流程图（这里按迭代的奇偶来判断分裂或者合并）二、使用步骤 * 1.代码实现 2.迭代过程 3. 总结前言 ISODATA经常被…

人工智能 2023年5月31日
00100
Logistic回归做分类或预测（实战代码）

1.Logistic回归为什么可以用于分类？谈这个问题之前，先谈下：一般来说，我们如何用一个模型做分类？一般的，在机器学习中，使用一个模型做分类的前提，是根据数据（包含样本和…

人工智能 2023年7月3日
0064
R-CNN，SSD，YOLO算法简单对比

文章目录 * – 1.R-CNN – + 1.1 R-CNN + 1.2 Fast R-CNN + 1.3 Faster R-CNN + 1.4 Mask …

人工智能 2023年7月9日
0090
【FMCW雷达人体行为识别——多普勒谱提取】

雷达回波的多普勒谱提取之前写过一个基于FMCW雷达的目标轨迹的提取，感觉看的人还是蛮多的，这周准备写一下关于多普勒谱提取的相关内容。主要内容为英国格拉斯哥大学公开的一个人体行为的…

人工智能 2023年6月16日
0061
抗疫逆行者HTML网页作业感动人物网页代码成品最美逆行者网页模板致敬疫情感动人物网页设计制作

🎉精彩专栏推荐 💭文末获取联系✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主💂 作者主页: 【主页——🚀获取更多优质源码】🎓 web前端期末大作业：【📚毕设项目精品实战…

人工智能 2023年6月26日
00118
数据分析项目-合集-day04

第一部分：数据类型处理 – 数据加载 – 字段&…

人工智能 2023年7月7日
0060
Transformer综述(A Survey on Vision Transformer) 阅读学习笔记（二）– transformer在计算机视觉领域的发展和应用

论文综述：文章主旨：在本文中，我们回顾了这些视觉Transformer模型，将它们分为不同的任务，并分析了它们的优缺点。我们探讨的主要类别包括主干网络、高/中级视觉、低级视觉和视频…

人工智能 2023年5月28日
0086

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

使用python来完成数据的线性拟合

大家都在看