第6章 Stata方差分析

目录

6.1单因素方差分析

6.2多因素方差分析

6.3协方差分析

6.4重复测量方差分析

当遇到多个平均数间的差异显著性检验时,我们可以采用方差分析法。方差分析法就是将索要处理的观测值作为一个整体,按照变异的不同来源把观测值总变异的平方和以及自由度分解为两个或者多个部分,从而获得不同变异来源的均方与误差平方:通过比较不同变异来源的均方与误差均方,判断各样本所属总体方差是否相等。方差分析主要包括单因素方差分析、多因素方差分析、协方差分析、重复测量方差分析等。

6.1单因素方差分析

单因素方差分析研究的时一个因素对于实验结果的影响和作用,这一因素可以有不同的取值或分组。单因素方差分析索要检验的问题就是当因素选择不同的取值或者分组时对结果有无显著的影响。

数据(案例6.1)给出看四种新型药物对柏树胰岛素分泌水平的影响测量结果。weight为重量,group为四种药物分类。试着分析四种药物对胰岛素水平的影响是否相同。

第6章 Stata方差分析
##旨在用单因素方差分析检验4中药物对胰岛素水平的影响是否相同
oneway weight group ,tabulate

第6章 Stata方差分析

结果如图所示,上半部分显示组别有4个,每组的平均值、标准差、频率。样本数总共40个,均值时83.425,标准差7.5319406。下半部分时方差分析结果chi2(3)=20.0858,Prob>chi2=0.000,说明拒绝等方差假设。也就是说四种药物对胰岛素水平的影响显著不相同。

案例延伸

1.针对部分数据进行单因素方差分析

oneway weight group if weight>72,tabulate

第6章 Stata方差分析

结果如图所示不再进行过多赘述。

6.2多因素方差分析

多因素方差分析的基本思路基本等同于单因素方差分析,不同之处在于其研究的时两个或多个因素对与实验结果的作用和影响,以及这些因素共同作用的影响。多因素方差分析所要研究的时多个因素的变化是否会导致实验结果的变化。由于三因素以及三因素以上方差分析较少用到,因此我们以双因素方差分析进行介绍。

数据(案例6.2)

第6章 Stata方差分析

变量分别为恢复度、缝合方法(两种方法)、缝合时间(一个月为1两个月为2)试着分析峰和方法和缝合后时间对恢复度是否有着显著影响

anova renew method time method#time

第6章 Stata方差分析

结果如图所示,我们可以看到一共有40个样本参与了分析,可决系数(R-squared)和修正的可决系数(Adj R-squared)–数值越大说明模型的拟合程度越高、也就是说模型的解释能力强。

Prob>F Model=0.0000,说命模型的整体时很显著的

Prob>F method=0.0000,说明变量method的主效应时非常显著的

···

Prob>F method#time=0.1506,说明变量method与变量time的交互效应不是显著的。

结论:说明缝合的方法和缝合后恢复的时间长短对着恢复度是有着显著的影响,而缝合方法和缝合后回复时间长短两者的共同影响对恢复度是没有显著影响的。

test method
test time
test method#time

###这个代码也是上述结果

在上面的例子中,因为method与time交互效应是不显著的,所以我们可以构建更加简单的方差分析模型。

anova renew method time

第6章 Stata方差分析

结果不再过多赘述。

案例延伸:

1.部分数据进行多因素方差分析

anova renew method time method#time if renew>11

第6章 Stata方差分析

结果如图所示不再进行过多赘述。

6.3协方差分析

协方差分析是将回归分析同方差分析结合起来,以消除混杂因素的影响,是对实验数据进行分析的一种分析方法。一般情况下,协方差分析研究比较一个或者几个因素在不同水平上的差异,但观测量同时还受到另一个难以控制的协变量的影响,在分析中剔除其影响,再分析各因素对观测变量的影响。

数据(案例6.3)

第6章 Stata方差分析

变量依次是年龄、之前的工资、现在的工资、职位高低(分为1、2、3终)、政策(实施为1未实施为0)用实施新政策后的工资来反映生活水平的提高,要求剔除实施新政策前的工资差异,试分析教室的级别和该新政策对年轻教师工资的提高是否有着显著影响。

anova nowsalary identity policy c.beforesalary
###c.beforesalary的意义是说明beforesalary是一个连续变量。

第6章 Stata方差分析

结果如图所示,我们可以看到一共30个样本参与了分析,可决系数(R-squared)以及修正的可决系数(Adj R-squared)都还是不错的,模型的解释能力比较强

Prob>F Model = 0.0000,说明模型的整体还是很显著的。

Prob>F identity = 0.2402,说明职位的主效应是不显著的。

Prob>F policy = 0.9321,说明政策的主效应是不显著的。

Prob>F beforesalary = 0.0000,说明变量beforesalalry的主效应是非常显著的。

结论:也就是说教师的级别和新政策是否实施对年轻教师工资的提高没有显著的影响,而实施新政策前的工资差异是对年轻教师的现有工资有显著影响。

在此基础上我们可以对模型进行改进,即引入变量的交互项进行深入的分析

anova nowsalary identity policy c.beforesalary c.beforesalary#identity c.beforesalary#policy policy#identity

第6章 Stata方差分析

结果如图所示,其中我们看到有两个交互项是没有作用的所以要去掉。

anova nowsalary identity policy c.beforesalary c.beforesalary#identity

第6章 Stata方差分析

结果如图所示,结论:教师的级别、新政策是否实施、实施新政策前的工资差异都对年轻教师的现有工资有着相助的影响,教师级别与实施政策前的工资差异的交互项也对年轻教师的现有工资有着显著影响

此外我们可以对上述结果进行回归分析。

regress

第6章 Stata方差分析

结果如图所示,我们可以看到一共有(obs=30)30个对象参与了分析,模型是非常显著的,可决系数以及修可决系数很好,模型解释能力很强。下半部分我们可以了解到我们是以nowsalary为因变量 下面的其他为自变量进行了一次回归分析。其中1.policy表示哪些具有同样教师级别以及同样改革前工资的年轻教师中,接受新政策改革的要比没有接受的现有工资第42.30769个百分点。此外我们还得到了每个系数的置信区间和单项T检验的结果,相比于单纯的方差分析,我们从这一结果中得到的信息要丰富很多。

6.4重复测量方差分析

在研究中我们经常需要对同一个观察对象重复进行多次观测,这样得到的数据称为重复测量资料;而对于重复测量资料进行方差分析就需要采用重复测量方差分析方法。重复测量方差分析与签数的方差分析最大区别在于:它可以考察测量指标是否会随着测量次数的增加而变化,以及是否会受时间的影响。

数据(案例6.4)网点变量设为number方案变量设为plan,并且把实施前定为1,实施后定为2,把销售量设为sale。试分析这种房安是否有校。

第6章 Stata方差分析
anova sale number plan,repeated(plan)

第6章 Stata方差分析

结果如图所示,可以看出一共40个样本参与了方差分析。可决系数(R-squared)以及修正的可决系数(Adj R-squared)都还是不错的–都在50%以上,模型的解释能力还是可以的。

Prob>F Model = 0.0067,说明模型的整体还是很显著的。

Prob>F number = 0.5121,说明number的主效应是不显著的。

Prob>F plan = 0.0000,说明plan的主效应是非常显著的。

结论:销售量的大小与网点是没有太大关系,网点的差异对销售量差异的影响程度很不显著。而方案的实施却对销售量的大小有显著影响

Original: https://blog.csdn.net/qq_45112156/article/details/118192514
Author: 查尔斯-狩乃
Title: 第6章 Stata方差分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/696041/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球