目录
- 绪论
1.1 数据类型
1.1.1 时间序列数据
1.1.2 截面数据
1.1.3 混合数据
1.2 模型检验
1.2.1 经济意义检验
首要的检验。检验参数估计量的符号、大小以及和其他参数估计量之间的关系是否具有经济学意义。
1.2.2 统计学检验
(1) 变量的显著性检验;(2) 方程的显著性检验;(3) 拟合优度检验。
1.2.3 计量经济学检验
(1) 随机误差项的序列相关性检验;(2) 随机误差项的异方差性检验;(3) 解释变量多重共线性检验。
1.2.4 预测检验
(1) 用扩大后的样本重新估计参数,比较新参数估计和原参数估计,并检验二者之间差距的显著性;
(2) 将模型用于样本外一已知值的预测,比较预测值和实际值,并检验二者之间差距的显著性。
- 双变量线性回归模型
2.1 回归分析基本概念
2.1.1 变量间的关系及研究方法
(1) 确定性关系(函数关系)
研究确定现象中非随机变量之间的关系。比如正方形的体积公式。
(2) 统计依赖关系(相关关系)
研究非确定现象中随机变量之间的关系,主要方法是相关分析和回归分析。
在相关分析中,所有变量都被看做随机的,而回归分析对变量的处理存在不对称性,即会区分自变量及因变量,后者被看作随机的,而前者不是。
回归分析是研究一个变量关于一些变量的具体依赖关系的理论,目的是通过自变量的已知值或设定值去估计或预测因变量的(总体)均值。回归分析构成了计量经济学的方法论基础。
2.1.2 总体回归函数 PRF
(1) 函数含义
在给定解释变量Xi的条件下,被解释变量Yi的期望的轨迹称作总体回归线。对应函数称作总体回归函数(PRF):
PRF说明了被解释变量Y的平均状态(即总体条件期望)随X的变化的规律。
(2) 函数形式
线性或非线性均可。
线性的定义:a. 模型就变量而言是线性的;b. 模型就参数而言是线性的。
在回归分析中我们考虑的线性指的是b。若将被解释变量看作其解释变量的线性函数时,函数可写作:
(3) 随机扰动项
指非确定部分,表明被解释变量除了受解释变量的系统性影响外,也会受到其他因素的随机性影响。
在方程中引入随机扰动项之后,得到总体回归函数PRF的随机设定形式:
也称,总体回归模型。
2.1.3 样本回归函数 SRF
思想:用样本估计总体
(1) 样本回归函数
(2) 样本回归模型(样本回归函数的随机形式)
其中,ei称作样本残差或剩余项,可看作ui的样本估计量
2.2 模型的基本假设
2.2.1 对模型和模型的假定
(1) 重复抽样中,解释变量Xi是一组固定数值或虽然是随机数值但是与干扰项ui独立。
(2) 解释变量无测量误差。
(3) 不存在模型设定误差。
2.2.2 对随机扰动项的假定
(1) 期望为0
(2) 同方差性假定
随机扰动项的方差为常数,即
。不满足时模型会产生异方差问题。注意 和 是等价的。(3) 无自相关假定
(4) 扰动项与解释变量不相关
(5) 服从正态分布
,相当于 。实际上,OLS估计不需要这个假定,但是需要进行假设检验和预测则需要知道Yi的分布情况。
以上(1)到(4)称作经典假设,满足的该假设的模型称作线性回归模型。
2.3 模型的参数估计
2.3.1 最小二乘法 (OLS)
思路:寻找实际值与拟合值残差平方和最小的回归直线。
残差平方和:
(1) 最小二乘估计量
求极值。
(2) 最小二乘估计量的性质
线性性、无偏性、有效性也称估计量的小样本性质,具有这三个性质的称作最佳线性无偏估计量(BLUE)
高斯-马尔科夫定理:经典假设下的最小二乘估计量是最佳线性无偏估计量。
a. 线性性(是否是Yi和ui的线性函数)
经计算可以得到2个正规方程如下
,ki与mi均为常数,因此参数估计量为ui的线性函数,参数估计量具有线性性。b. 无偏性(期望值是否等于总体真实值)
使用线性性的结论可以简单证明
以及 。c. 有效性(是否在所有线性无偏估计量中具有最小方差)
(3) 最小二乘估计量的分布
根据假设(5),已知
,因此根据线性性结论可以推出参数估计量也服从正态分布:2.3.2 极大似然估计
2.4 模型的统计检验
2.4.1 拟合优度检验
思想:构造一个可以表征拟合优度的统计量,统计量是样本的函数,从检验对象中计算得到该统计量数值,并与某一标准进行比较。
(1) 总离差平方和的分解
Y的第i个观测值和样本均值的离差
可以分解成两个部分之和: 为残差,即随机偏差;为可解释偏差,即回归偏差,可以认为是由回归直线解释的部分。考虑所有样本点,则需考虑所有样本点的离差平方和,即:
,记作 TSS=ESS+RSS。
其中,TSS(Total sum of squares)指总体平方和;ESS(Explained sum of squares)指回归平方和;RSS(Residual sum of squares)指残差平方和。
显然,ESS在TSS中占比越大,说明回归参数估计值的显著性越强,拟合值与观测值拟合得越好。因此选择ESS与TSS的接近程度作为评判拟合优度的标准。
(2) 拟合优度的度量
用
表示模型拟合的程度,称拟合优度或者判定系数。在双变量回归中,
。 =0:X与Y完全不存在线性关系。(3) 样本相关系数
常把相关分析作为回归分析的补充分析办法,样本相关系数r满足:
,但仅是数值相关,概念并不相同。我们使用的统计量是判定系数
,也称可决定系数。2.4.2 方程显著性检验
思想:推断被解释变量与解释变量之间的线性关系在总体上是否显著成立。
(1) F检验
F检验的思想来源于总离差平方和的分解式,原理是方差分析,
已知
,考虑 ,若比值越大,则说明解释变量X对被解释变量Y的解释程度越高,即总体显著线性。(2) F统计量
由于数理统计结论,双变量情况中:
因此可以建立F统计量:
(3) F检验步骤
a. 提出假设
原假设
;备择假设b. 利用样本值计算统计量
c. 给定显著性水平α查F分布表。
若
,拒绝原假设,接受备择假设,模型显著;若 ,接受原假设,回归方程无显著意义。2.4.3 变量显著性检验
思想:判断X是否是Y的一个显著性的影响因素。在这里,我们主要针对变量的参数估计量是否为0来进行显著性检验。
(1) 随机误差项的方差估计
由于我们之前已经知道参数估计量的分布是
,但未知,所以需要先找到可以代替的估计量,才能通过参数估计量的分布进行假设检验。可以用残差ei的方差Var(ei)代替误差项ui的方差
。其中的v是指ei的自由度,由于残差由样本得到,而样本容量n有限,且由于残差ei存在约束条件,因此自由度v
Original: https://blog.csdn.net/Wowlittlemoon/article/details/122266348
Author: 小天使甲
Title: 计量经济学笔记
原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/630453/
转载文章受原作者版权保护。转载请注明原作者出处!