波士顿房价数据分析(R语言)
1 .数据变量解释
变量解释CRIM城镇人均犯罪率。ZN住宅用地超过 25000 平方英尺的比例。INDUS城镇非零售商用土地的比例。CHAS查理斯河空变量(如果边界是河流,则为1;否则为0)。NOX一氧化氮浓度。RM住宅平均房间数。AGE1940 年之前建成的自用房屋比例。DIS到波士顿五个中心区域的加权距离。RAD辐射性公路的接近指数。TAX每 10000 美元的全值房产税率。PTRATIO城镇师生比例。B1000(Bk-0.63)^ 2,其中 Bk 指代城镇中黑人的比例。LSTAT人口中地位较低者的比例。MEDV房价中位数,以千美元计。
2.非参数检验
boston read.csv("D:/Rlanguage/FCwork/boston_data.txt", sep="")
attach(boston)
library(ggplot2)
ggplot(data=boston,aes(x=MEDV,fill=as.factor(CHAS)))+
geom_density(alpha=.3)
CHAS是一个二值变量(即位于查尔斯河边记为1,否则记为0)。通过图1发 现,CHAS=1时的房价分布与CHAS=2时房价分布基本相同。为了探究这一变量 对房价是否有显著影响,接下来将通过一系列检验方法验证。 将样本数据分为两个部分,CHAS=1为一组,CHAS=0为另一组
CHAS1subset(boston,CHAS==1)
CHAS2subset(boston,CHAS==0)
2.1单样本检验
首先,通过Shapiro Wilk检验房价中位数是否服从正态分布。假设:
H0:房价中位数服从正态分布
H1:房价中位数不服从正态分布
shapiro.test(scale(MEDV))
由于P
Original: https://blog.csdn.net/weixin_45446297/article/details/114527560
Author: MAGICOLORUA
Title: 波士顿房价数据分析(R语言)
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/601151/
转载文章受原作者版权保护。转载请注明原作者出处!