RDD断点回归-handbook

原理部分的说明可以参考陈强《高级计量经济学及stata应用》
!!注:搞清楚原理非常重要
重要概念辨析:
1 结果变量,因变量(Y, outcome variable; dependent variable)
2 分组变量(X,assignment variable;forcing variable;running variable)
3 处理变量(D,treatment variable)

Rd语法说明

rd outcomevar [treatmentvar] assignmentvar [if] [in] [weight] [, options]
其中,”outcomevar”为结果变量,”treatmentvar”为处理变量,assignmentvar为分组变量。
较为常用的Options:

  • “z0(real)”用来指定断点位置,默认值为”z0(0)”,即断点为原点。
  • “mbw(numlist)”用来指定带宽,默认值为”mbw(50 100 200)”(会给出最优带宽,最优带宽的1/2和2倍)。
  • “graph”表示根据所选的每一 带宽,画出其局部现行回归图。 “bdep”表示通过画图来考察断点回归估计量对带宽的依赖性。
  • “oxline”表示在此图的默认带宽上画一条直线,以便识别。
  • “Kernel(rectangle)”表示使用矩形核(即均匀核),默认使用三角核。
  • “cov(varlist)”用来指定加入局部线性回归的协变量。
  • “x(varlist)”表示检验这些协变量是否在断点处有跳跃(估计其跳跃值和显著性)
  • 还有cluster(varlist)等选项,可以通过stata help rd查看
  • 如果省略处理变量treatment variable,则默认为精确断点回归,并根据分组变量x来计算处理变量,即x≥断点,D=1,反之D=0。Options:strineq表示根据严格不等式来计算处理变量,即x>断点,D=1,反之D=0.

【注:对于rd的使用具体可以参考第四部分的第一个和第二个案例】

Rdrobust语法说明

rdrobust depvar runvar [if] [in] [, c(cutoff) p(pvalue) q(qvalue) deriv(dvalue) fuzzy(fuzzyvar [sharpbw]) covs(covars) kernel(kernelfn) weights(weightsvar) h(hvalueL hvalueR) b(bvalueL bvalueR) rho(rhovalue) scalepar(scaleparvalue) bwselect(bwmethod) scaleregul(scaleregulvalue) vce(vcemethod) level(level) all]
其中:
depvar is the dependent variable
runvar is the running variable
主要的options:

  • c(cutoff)指定RD跳跃点。 默认值为c(0)。
  • p(pvalue)指定用于构造点估计量的局部多项式的阶数。 默认值为p(1)(局部线性回归)。 (多项式选择与否)
  • q(qvalue)指定用于构造偏差校正的局部多项式的阶数。 默认值为q(2)(局部二次回归)。
  • Fuzzy(fuzzyvar [sharpbw])指定用于实现模糊RD估计的处理状态变量 covs(covars) ,
    kernel(kernelfn)同上
  • h(hvalueL hvalueR)指定要在跳跃点的左侧和右侧分别使用的主带宽h。 如果仅指定一个值,则在两侧都使用该值。如果未指定,则带宽h由伴随命令rdbwselect计算。
  • b(bvalueL bvalueR)指定偏置带宽b,分别在截止点的左侧和右侧使用。 如果仅指定一个值,则在两侧都使用该值。
  • 如果未指定,则带宽b由伴随命令rdbwselect计算。
  • bwselect(bwmethod)指定要使用的带宽选择过程。默认情况下,除非指定rho,否则它将同时计算h和b,在这种情况下,它将仅计算h并设置b = h / rho。
  • 其他的可自行通过help rdrobust查看

【rdrobust的使用具体可以参考第四部分第一个和第三个案例】

Rdcv语法说明

一般rdcv运行特别慢,很少用到,因此不做过多介绍。
【rdcv的使用具体可以参考第四部分的第一个案例】

Rdplot语法说明

rdplot depvar runvar [if] [in] [, c(cutoff) p(pvalue kernel(kernelfn) weights(weightsvar) h(hvalueL hvalueR) nbins(nbinsvalueL nbinsvalueR) binselect(binmethod) scale(scalevalueL scalevalueR) ci(cilevel) shade support(supportvalueL supportvalueR) genvars graph_options(gphopts) hide]
其中主要的options:

  • C(cutoff): 用于设定断点位置,默认为0;
  • P(pvalue):用于设定多项式阶数,默认为1,局部线性回归;
  • kernel(kernelfn):即表示设定多项式拟合时的核函数,kernelfn可以有三种选择:三角核函数triangular、Epanechnikov核函数、矩形核函数 uniform,默认为矩形核。
  • h(hvalueL hvalueR):指定主要带宽h,分别用在断点的左边和右边。如果只指定一个值,则该值在两边都使用。如果指定了两个带宽,则第一个带宽用于断点左侧的带宽,第二个带宽用于断点右侧的数据。如果没有指定,则选择它来跨数据的全部支持。
  • nbins(##)设定划分的区间数,提供两个数值,则分别为左右的区间数;提供一个数值,则断点左右使用共同的区间数。
  • ci( bilevel)可以根据设定的ci-level画出每个区间拟合点的置信区间,选加 shade置信区间用阴影表示。
  • shade:指定可选的图形选项,以用阴影区域替换置信区间。
  • support(supportvalueL supportvalueR)指定一个可选的扩展变量支持,用于构建容器。默认是sample范围。
  • generate()可以将划分的区间以及拟合的数值保存在相应的变量中
  • graph_options(gphopts)绘制图形命令的图形选项。 hide省略了RD图形
  • 其他的可自行通过helprdrobust查看

DCdensity语法说明

DCdensity assign_var,breakpoint(#) generate(Xj Yj r0 fhat se_fhat) graphname(filename)

  • assign_var 为分组变量
  • 必选项breakpoint(#)用来指定断点位置
  • generate(Xj Yj r0 fhat se_fhat)用来指定输出变量名 “Xj. Name of variable in which to store cell midpoints of histogram”
    “Yj. Name of variable in which to store cell heights of histogram”
    “r0. Name of variable in which to store evaluation sequence for local linear regression loop”
    “fhat. Name of variable in which to store local linear density estimate”
    *”se_fhat. Name of variable in which to store standard error of local linear density estimate”
  • graphname用来命名指定密度函数图
    【DCdensity的应用具体可以参考第四部分的第二个案例】

1 判断X和Y之间是否存在断点
画图:Rdplot
(画X和Y之间的关系)
2 判断是精确断点回归还是模糊断点回归
画图:rdplot
(画X和D之间的关系)
3 断点回归(精确断点和模糊断点)
4 稳健性检验
A 检验分组变量的条件密度在断点处是否连续
检验方法:DCdensity
B 检验协变量的条件密度在断点处是否连续
画图:rdplot (画协变量和Y的图)
回归:rdrobust
5 其他的稳健性检验:

“由于断点回归在操作上存在着不同选择,故在实践中,一般建议同时汇报以下结果,以保证结果的稳健性
(1)分别汇报三角核和矩形核的局部线性回归结果
(2)分别汇报使用不同带宽的结果(rdrobust一般会自动给出最优带宽,可以给出最优带宽的1/2或者两倍带宽的回归结果)
(3)分别汇报包含协变量余不包含协变量的情况 (4)进行模型设定检验,包括检验分组变量与协变量的条件密度是否在断点处连续。”
——来自陈强《高级计量经济学及Stata应用(第二版)》

1 连享会教程中的案例及回归结果的解释说明(文件:RDD_data1.dta和RDD_data2代码1.do)
注:案例中使用的是清晰断点回归方法,且只有一个断点和一个分配变量
地址:Stata: 断点回归 (RDD) 教程 – 知乎 (zhihu.com)
2 陈强《高级计量经济学及Stata应用(第二版)》课后代码(文件:RDD_data2.dta和RDD_data2_代码.do)
3 2021年《中国工业经济》《养老金对缓解农村居民医疗负担的作用——为何补贴收入的效果好于补贴医保》(文件:RDD_data3.dta和RDD_data3_代码.do)
4 张川川老师b站分享的教程(文件:RDD_data4.dta和RDD_data4_代码.do)
视频地址:RD(断点回归)估计及其在STATA中的实现_哔哩哔哩_bilibili

Original: https://blog.csdn.net/R7xiaoyou/article/details/119831208
Author: R7小優
Title: RDD断点回归-handbook

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/631290/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球