对波士顿数据集的回归分析

1.掌握建立模型的必要步骤,划分数据集、实例化模型、建立模型、评估模型

2.掌握回归算法的建模和评估

1.根据数据集找出哪3个特征对房屋价值影响最大

2.建立回归模型预测波士顿房屋价值

3.评估模型优势

1、 周一至周五晚上 7 点—晚上9点
2、 周六上午 9 点-上午 11 点
3、 周日下午 3 点-下午 6 点

1. 通过from sklearm import datasets

Boston=datasets.load_boston() 加载数据集

对波士顿数据集的回归分析

2. 按照回归模型建模

对波士顿数据集的回归分析

对波士顿数据集的回归分析

得到预测值和真实值的对比图

对波士顿数据集的回归分析

通过模型图可以看出该模型的拟合效果还是非常的准确但还是存在一定大的误差(也有可能是数据划分比例的问题,也有可能是数据集总量太少的问题)

3. 评估模型

对波士顿数据集的回归分析

对波士顿数据集的回归分析

4.数据标准化和划分训练集在模型预测中的先后顺序是否可以颠倒?

我认为是不可以颠倒的证明如下

在没有进行数据标准化是构建的模型以及对模型的评估所得到的结果

对波士顿数据集的回归分析

对波士顿数据集的回归分析

在进行了数据标准化所构建的模型以及对模型的评估数据

对波士顿数据集的回归分析

对波士顿数据集的回归分析

通过上面的两模型以及评估就可以明显的看到顺序颠倒的化可能会影响模型的预测分数。

5.根据模型建立结果说明哪三个特征对我们的模型影响最大

对波士顿数据集的回归分析

对波士顿数据集的回归分析

对波士顿数据集的回归分析

通过可视化图表分析,可以看到不同特征的取值范围有较大差异,有些取值范围从0到1,有些从1到100,还有0到400等等,为了消除不同量纲的影响,可对数据进行标准化处理。一般采用将数据减去数据组的平均数再除以标准差。z = (x – u) / s (u表示均值,s表示标准差)

对数据进行统一量纲处理,并求出相关系数最高的指标(这里进行了数据拟合)

对波士顿数据集的回归分析

对波士顿数据集的回归分析

对波士顿数据集的回归分析

通过结果以及这个表格对比可以得出对我们模型影响最大的三个指标是平均房间数、城镇中师生比列、地位较低的人所占百分比。

上面就是我对波士顿的数据进行的线性回归分析,写代码的时候也参考了一些网上的代码,希望自己能有所成长吧!

Original: https://blog.csdn.net/m0_61601582/article/details/121382803
Author: honey_023
Title: 对波士顿数据集的回归分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/639768/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球