RDD断点回归-handbook

2023年6月17日下午6:08 • 人工智能 • 阅读 74

原理部分的说明可以参考陈强《高级计量经济学及stata应用》
！！注：搞清楚原理非常重要
重要概念辨析：
1 结果变量，因变量（Y, outcome variable; dependent variable）
2 分组变量（X，assignment variable；forcing variable；running variable）
3 处理变量（D，treatment variable）

Rd语法说明

rd outcomevar [treatmentvar] assignmentvar [if] [in] [weight] [, options]
其中，”outcomevar”为结果变量，”treatmentvar”为处理变量，assignmentvar为分组变量。
较为常用的Options：

“z0(real)”用来指定断点位置，默认值为”z0(0)”，即断点为原点。
“mbw(numlist)”用来指定带宽，默认值为”mbw(50 100 200)”（会给出最优带宽，最优带宽的1/2和2倍）。
“graph”表示根据所选的每一带宽，画出其局部现行回归图。 “bdep”表示通过画图来考察断点回归估计量对带宽的依赖性。
“oxline”表示在此图的默认带宽上画一条直线，以便识别。
“Kernel(rectangle)”表示使用矩形核（即均匀核），默认使用三角核。
“cov(varlist)”用来指定加入局部线性回归的协变量。
“x(varlist)”表示检验这些协变量是否在断点处有跳跃（估计其跳跃值和显著性）
还有cluster(varlist)等选项，可以通过stata help rd查看
如果省略处理变量treatment variable，则默认为精确断点回归，并根据分组变量x来计算处理变量，即x≥断点，D=1，反之D=0。Options：strineq表示根据严格不等式来计算处理变量，即x＞断点，D=1，反之D=0.

【注：对于rd的使用具体可以参考第四部分的第一个和第二个案例】

Rdrobust语法说明

rdrobust depvar runvar [if] [in] [, c(cutoff) p(pvalue) q(qvalue) deriv(dvalue) fuzzy(fuzzyvar [sharpbw]) covs(covars) kernel(kernelfn) weights(weightsvar) h(hvalueL hvalueR) b(bvalueL bvalueR) rho(rhovalue) scalepar(scaleparvalue) bwselect(bwmethod) scaleregul(scaleregulvalue) vce(vcemethod) level(level) all]
其中：
depvar is the dependent variable
runvar is the running variable
主要的options：

c（cutoff）指定RD跳跃点。默认值为c（0）。
p（pvalue）指定用于构造点估计量的局部多项式的阶数。默认值为p（1）（局部线性回归）。（多项式选择与否）
q（qvalue）指定用于构造偏差校正的局部多项式的阶数。默认值为q（2）（局部二次回归）。
Fuzzy（fuzzyvar [sharpbw]）指定用于实现模糊RD估计的处理状态变量 covs(covars) ,
kernel(kernelfn)同上
h（hvalueL hvalueR）指定要在跳跃点的左侧和右侧分别使用的主带宽h。如果仅指定一个值，则在两侧都使用该值。如果未指定，则带宽h由伴随命令rdbwselect计算。
b（bvalueL bvalueR）指定偏置带宽b，分别在截止点的左侧和右侧使用。如果仅指定一个值，则在两侧都使用该值。
如果未指定，则带宽b由伴随命令rdbwselect计算。
bwselect（bwmethod）指定要使用的带宽选择过程。默认情况下，除非指定rho，否则它将同时计算h和b，在这种情况下，它将仅计算h并设置b = h / rho。
其他的可自行通过help rdrobust查看

【rdrobust的使用具体可以参考第四部分第一个和第三个案例】

Rdcv语法说明

一般rdcv运行特别慢，很少用到，因此不做过多介绍。
【rdcv的使用具体可以参考第四部分的第一个案例】

Rdplot语法说明

rdplot depvar runvar [if] [in] [, c(cutoff) p(pvalue kernel(kernelfn) weights(weightsvar) h(hvalueL hvalueR) nbins(nbinsvalueL nbinsvalueR) binselect(binmethod) scale(scalevalueL scalevalueR) ci(cilevel) shade support(supportvalueL supportvalueR) genvars graph_options(gphopts) hide]
其中主要的options：

C(cutoff): 用于设定断点位置，默认为0；
P(pvalue)：用于设定多项式阶数，默认为1，局部线性回归；
kernel(kernelfn)：即表示设定多项式拟合时的核函数，kernelfn可以有三种选择:三角核函数triangular、Epanechnikov核函数、矩形核函数 uniform，默认为矩形核。
h(hvalueL hvalueR)：指定主要带宽h，分别用在断点的左边和右边。如果只指定一个值，则该值在两边都使用。如果指定了两个带宽，则第一个带宽用于断点左侧的带宽，第二个带宽用于断点右侧的数据。如果没有指定，则选择它来跨数据的全部支持。
nbins(＃＃)设定划分的区间数，提供两个数值，则分别为左右的区间数;提供一个数值，则断点左右使用共同的区间数。
ci( bilevel)可以根据设定的ci-level画出每个区间拟合点的置信区间，选加 shade置信区间用阴影表示。
shade：指定可选的图形选项，以用阴影区域替换置信区间。
support(supportvalueL supportvalueR)指定一个可选的扩展变量支持，用于构建容器。默认是sample范围。
generate()可以将划分的区间以及拟合的数值保存在相应的变量中
graph_options(gphopts)绘制图形命令的图形选项。 hide省略了RD图形
其他的可自行通过helprdrobust查看

DCdensity语法说明

DCdensity assign_var,breakpoint(#) generate(Xj Yj r0 fhat se_fhat) graphname(filename)

assign_var 为分组变量
必选项breakpoint(#)用来指定断点位置
generate(Xj Yj r0 fhat se_fhat)用来指定输出变量名 “Xj. Name of variable in which to store cell midpoints of histogram”
“Yj. Name of variable in which to store cell heights of histogram”
“r0. Name of variable in which to store evaluation sequence for local linear regression loop”
“fhat. Name of variable in which to store local linear density estimate”
*”se_fhat. Name of variable in which to store standard error of local linear density estimate”
graphname用来命名指定密度函数图
【DCdensity的应用具体可以参考第四部分的第二个案例】

1 判断X和Y之间是否存在断点
画图：Rdplot
（画X和Y之间的关系）
2 判断是精确断点回归还是模糊断点回归
画图：rdplot
（画X和D之间的关系）
3 断点回归（精确断点和模糊断点）
4 稳健性检验
A 检验分组变量的条件密度在断点处是否连续
检验方法：DCdensity
B 检验协变量的条件密度在断点处是否连续
画图：rdplot (画协变量和Y的图)
回归：rdrobust
5 其他的稳健性检验：

“由于断点回归在操作上存在着不同选择，故在实践中，一般建议同时汇报以下结果，以保证结果的稳健性
（1）分别汇报三角核和矩形核的局部线性回归结果
（2）分别汇报使用不同带宽的结果（rdrobust一般会自动给出最优带宽，可以给出最优带宽的1/2或者两倍带宽的回归结果）
（3）分别汇报包含协变量余不包含协变量的情况（4）进行模型设定检验，包括检验分组变量与协变量的条件密度是否在断点处连续。”
——来自陈强《高级计量经济学及Stata应用（第二版）》

1 连享会教程中的案例及回归结果的解释说明（文件：RDD_data1.dta和RDD_data2代码1.do）
注：案例中使用的是清晰断点回归方法，且只有一个断点和一个分配变量
地址：Stata: 断点回归 (RDD) 教程 – 知乎 (zhihu.com)
2 陈强《高级计量经济学及Stata应用（第二版）》课后代码（文件：RDD_data2.dta和RDD_data2_代码.do）
3 2021年《中国工业经济》《养老金对缓解农村居民医疗负担的作用——为何补贴收入的效果好于补贴医保》（文件：RDD_data3.dta和RDD_data3_代码.do）
4 张川川老师b站分享的教程（文件：RDD_data4.dta和RDD_data4_代码.do）
视频地址：RD（断点回归）估计及其在STATA中的实现_哔哩哔哩_bilibili

Original: https://blog.csdn.net/R7xiaoyou/article/details/119831208
Author: R7小優
Title: RDD断点回归-handbook

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/631290/

转载文章受原作者版权保护。转载请注明原作者出处！

人工智能

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

python从入门到精通——完整教程

文章目录一、pycharm下载安装二、python下载安装三、pycharm上配置python 四、配置镜像源让你下载嗖嗖的快 * – 4.1）pycharm内部…

人工智能 2023年5月31日
0088
Python中的切片(详细篇)学起来喔

Python中的切片知识. 在Python中，切片(slice)是对序列型对象(如list, string, tuple)的一种高级索引方法。普通索引只取出序列中一个下标对…

人工智能 2023年7月3日
0080
Opencv图像处理（全）

（一）银行卡号识别 —— sort_contours()、resize() 【信用卡检测流程详解】11、提取模板的每个数字1111、读取模板图像、转换成灰度图、转换成二值图1122…

人工智能 2023年7月20日
0054
ubuntu18.04安装显卡驱动，Anaconda，CUDA，pytorch全套流程

记录一次成功的装显卡，以为过程很复杂，其实这边封装的还挺好，正常走流程就没啥问题。我这边也是看各个步骤的博客总结，可以称之为搬运工。显卡驱动安装参考的是这篇博客：Ubuntu1…

人工智能 2023年6月25日
0053
RNN模型与NLP应用笔记(3)：Simple RNN模型详解及完整代码实现

一、写在前面终于到RNN了，这篇文章首先介绍简易RNN模型，我们会以问题导向的方式一步一步对简易RNN模型进行改进。同样本文参考了王树森教授的深度学习课程内容，感谢大佬们提供的帮…

人工智能 2023年5月27日
00103
规则引导的知识图谱联合嵌入方法

规则引导的知识图谱联合嵌入方法人工智能技术与咨询本文来自《计算机研究与发展》，作者姚思雨等摘要近年来，大量研究工作致力于知识图谱的嵌入学习，旨在将知识图谱中的实体与关系…

人工智能 2023年6月1日
0059
C++实例2–职工管理系统

职工管理系统头文件 1.1 workerManager.h 系统类 1.2 worker.h 员工基类（抽象类） 1.3 employee.h 员工类 1.4 manager.h…

人工智能 2023年6月4日
00100
【知识图谱系列】-【Neo4j】之Cypher 一

Cypher是Neo4j支持的一种图数据库查询语言，其具有极强的表达能力，能够支持图数据库数据的增删改查功能。以下将罗列常用的cypher语句。增加节点的核心为：create 1…

人工智能 2023年6月1日
0053
pytorch深度学习框架——实现病虫害图像分类

一、pytorch框架 1.1、概念 PyTorch是一个开源的Python机器学习库，基于Torch，用于自然语言处理等应用程序。2017年1月，由Facebook人工智能研究院…

人工智能 2023年7月1日
0076
用OpenCV进行相机标定(张正友标定,有代码)

目录 * – 1. 内参与畸变 – 2. 用OpenCV标定相机程序 – 3.画棋盘标定板 – 4.OpenCV拍照 1. 内参与畸…

人工智能 2023年5月26日
0075
设计模式之建造者模式

builder desigin pattern 建造者模式的概念、建造者模式的结构、建造者模式的优缺点、建造者模式的使用场景、建造者模式的实现示例、建造者模式的源码分析 1、建造者…

人工智能 2023年7月30日
0058
从整体视角了解情感分析、文本分类！

Datawhale干货作者：太子长琴，算法工程师，Datawhale成员文本分类是自然语言处理（NLP）最基础核心的任务，或者换句话说，几乎所有NLP任务都是「分类」任务，或者…

人工智能 2023年5月28日
0063
ubuntu18.04安装Tensorflow GPU版本全流程

ubuntu18.04安装Tensorflow GPU版本全流程 1安装显卡驱动 * 1.1选择正确的显卡驱动 1.2显卡驱动安装 2.安装CUDA * 2.1 CUDA的下载与安…

人工智能 2023年5月24日
0065
python——linspace函数

def linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None, axis=0): &quot…

人工智能 2023年6月16日
0075
【PyTorch深度学习项目实战100例】—— 使用PyTorch实现验证码识别 | 第4例

文章目录前言一、生成验证码图片 * 1.1 随机生成验证码文本串 1.2 保存验证码图片及其标签二、卷积模型训练 * 2.1 自定义数据集 2.2 自定义网络 2.3 自定义…

人工智能 2023年6月16日
0087
MATLAB图像处理

本次内容基于MATLAB的图像处理进行基本介绍，内容包含图像数据的读取、图像展示、裁剪、调整等变换。 1、imread()函数 ①若为灰色图像，则A为 M*N 数组，灰色图像的每个…

人工智能 2023年6月18日
0094

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31