波士顿房价数据分析(R语言)

波士顿房价数据分析(R语言)

1 .数据变量解释

变量解释CRIM城镇人均犯罪率。ZN住宅用地超过 25000 平方英尺的比例。INDUS城镇非零售商用土地的比例。CHAS查理斯河空变量(如果边界是河流,则为1;否则为0)。NOX一氧化氮浓度。RM住宅平均房间数。AGE1940 年之前建成的自用房屋比例。DIS到波士顿五个中心区域的加权距离。RAD辐射性公路的接近指数。TAX每 10000 美元的全值房产税率。PTRATIO城镇师生比例。B1000(Bk-0.63)^ 2,其中 Bk 指代城镇中黑人的比例。LSTAT人口中地位较低者的比例。MEDV房价中位数,以千美元计。

2.非参数检验

boston  read.csv("D:/Rlanguage/FCwork/boston_data.txt", sep="")
attach(boston)
library(ggplot2)
ggplot(data=boston,aes(x=MEDV,fill=as.factor(CHAS)))+
                                       geom_density(alpha=.3)

波士顿房价数据分析(R语言)
CHAS是一个二值变量(即位于查尔斯河边记为1,否则记为0)。通过图1发 现,CHAS=1时的房价分布与CHAS=2时房价分布基本相同。为了探究这一变量 对房价是否有显著影响,接下来将通过一系列检验方法验证。 将样本数据分为两个部分,CHAS=1为一组,CHAS=0为另一组
CHAS1subset(boston,CHAS==1)
CHAS2subset(boston,CHAS==0)

2.1单样本检验

首先,通过Shapiro Wilk检验房价中位数是否服从正态分布。假设:
H0:房价中位数服从正态分布
H1:房价中位数不服从正态分布

shapiro.test(scale(MEDV))

波士顿房价数据分析(R语言)
由于P

Original: https://blog.csdn.net/weixin_45446297/article/details/114527560
Author: MAGICOLORUA
Title: 波士顿房价数据分析(R语言)

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/601151/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球