之前讲了回归分析诊断中的自相关检验,接下来针对前边的模型进行修正,stata中主要有4种方法,包括HAC稳健标准差、聚类稳健标准差、广义最小二乘法、修改模型等,这里先介绍前两种方法的基本原理与stata操作,并对结果如何进行分析与判断。
1
仍然选取美国汽油需求数据gasoline.dta作为示例,其样本有52个,数据展示如下:
这里建立如下回归模型:
用stata进行估计,代码为:
regress lgasq lincome lgasp lpnc lpuc
结果为:
2
HAC稳健标准差法全称为Heteroskedasticity and Autocorrelation Consistent Standard Error,即“OLS+异方差自相关稳健标准差”,也称为“Newey-West估计法”,因为它是由Newey-West提出的,它是通过引入自相关的参数(也称为“截断参数”),来改变标准差的估计值,从而修正值相关问题,但它不会改变OLS回归系数的估计值。
值得注意的是,在stata异方差修正里也有稳健标准差的方法,即
Heteroskedasticity Robust Standard Error方法,这个方法要与HAC稳健标准差法区分开来,因为它只能修正异方差,Newey-West估计法可以同时修正异方差与自相关。
以gasoline.dta为例,在OLS回归的基础上,《stata中的自相关检验(LM检验、Q检验、DW检验)操作及其分析》一文中已经检验出该模型存在自相关问题,这里进行修正:
首先计算截断参数,一般去p=n^(1/4)或p=0.75*n^(1/3):
di 52^0.25
2.6853496
计算结果为2.69,我们取大于它的整数为3
newey lgasq lincome lgasp lpnc lpuc,lag(3)
结果为:
通过观察newey方法和ols方法发现,估计系数没有变化,估计标准误发生了变化,t值也略有变化。
3
聚类稳健标准差法则是从聚类的角度去修正自相关的,它提出了聚类样本的概念——同一聚类样本里的观测值是相关的,不同聚类样本之间的观测值是不相关的。因此估计回归系数时,以聚类的样本作为单元进行系数标准误的计算中,以改变原有OLS估计的自相关性。它也不会改变OLS回归系数的估计值。
聚类稳健标准差法一般用于面板数据,因为它需要考虑样本的个体类别,例如不同的地区或者组别等等,也可以用于序列数据,对时间(year或者time)进行聚类,但是这种方法有待商榷,还不如直接用HAC稳健标准差法更保险。
我们以votex.dta为例,该数据来自于《高级计量经济学及Stata应用(第二版)陈强》,其数据如下:
暂不考虑其他因素,只是随机建立一个OLS与聚类稳健标准差法修正:
regress votingpop populatn black blucllr farmer
regress votingpop populatn black blucllr farmer,cluster(district)
以district(地区)为样本,得到OLS与聚类稳健标准差法结果为:
可以发现,估计系数没有变化,但是标准误与t值有了变化。
本文分享自微信公众号 - 博士的计量经济学干货(econometrics_ABC)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。
来源:oschina
链接:https://my.oschina.net/u/4606941/blog/4482205