文章目录
*
–
+
* 1、分析二变量的关系
* 2、多元线性回归
* 3、显著交互项的多元线性回归(汽车数据集)
数据使用的依然是state.x77数据集为例,探究一个州的犯罪率和其他因素的关系,包括人口、文盲率、平均收入和结霜天数(温度在冰点一下的平均天数)。
标签解释:Murder犯罪率、Population人口、Illiteracy文盲率、Income收入、Frost结霜天数
交互项的多元线性回归主要用mtcars数据中的汽车数据,对汽车重量和马力作为预测变量,并包含交互项来拟合回归模型。
其中,hp汽车功率,wt汽车重量。
实验过程:
1、分析二变量的关系
检测各变量的相关性,由此可见文盲率和犯罪率的关系是比较大的,达到约70%。
scatterplotMatrix()函数在非对角线绘制散点图,并添加了平滑和线性拟合曲线,对角线是绘制每个变量的密度图和轴须图。
其中谋杀率是双峰曲线,每个预测变量存在偏差,看谋杀率第一行图的数据,从拟合效果看,谋杀率随人口和文盲率的增加而增加,随收入水平和结霜天数下降而下降。
看最后一行图最后一个图,是结霜天数,曲线是结霜天数的拟合效果,纵轴为结霜天数,其他图为结霜天数的影响下的变量的变化,可以看出越冷的时候,文盲率越低,收入会越高
; 2、多元线性回归
预测变量不为1时,回归系数表明一个预测变量增加一个单位,其他预测变量保持不变时,因变量将要增加的数量。
①lm(Murder ~ Population + Illiteracy + Income + Frost,data=states)函数拟合多元线性回归
②在这次实验中,可以从结果看出,文盲率的回归系数为4.14(注:4.134e+00=4.134×10^0),所以说,在控制住人口、收入以及气温的情况下,文盲率上升1%,那么谋杀率会上升4.14%,它的系数在p
Original: https://blog.csdn.net/weixin_44692890/article/details/122790445
Author: 侬本多情。
Title: 多元线性回归的探索
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/634184/
转载文章受原作者版权保护。转载请注明原作者出处!