stata中的自相关修正(HAC稳健标准差、聚类稳健标准差)操作及其分析

孤人 提交于 2020-12-12 07:33:23

之前讲了回归分析诊断中的自相关检验,接下来针对前边的模型进行修正,stata中主要有4种方法,包括HAC稳健标准差、聚类稳健标准差、广义最小二乘法、修改模型等,这里先介绍前两种方法的基本原理与stata操作并对结果如何进行分析与判断。


1



仍然选取美国汽油需求数据gasoline.dta作为示例,其样本有52个,数据展示如下:

这里建立如下回归模型:

stata进行估计,代码为:

regress lgasq lincome lgasp lpnc lpuc

结果为:




2




HAC稳健标准差法全称为Heteroskedasticity and Autocorrelation Consistent Standard Error,即“OLS+异方差自相关稳健标准差”,也称为“Newey-West估计法”,因为它是由Newey-West提出的,它是通过引入自相关的参数(也称为“截断参数”),来改变标准差的估计值,从而修正值相关问题,但它不会改变OLS回归系数的估计值。

值得注意的是,在stata异方差修正里也有稳健标准差的方法,即

Heteroskedasticity Robust  Standard Error方法,这个方法要与HAC稳健标准差法区分开来,因为它只能修正异方差,Newey-West估计法可以同时修正异方差与自相关。

gasoline.dta为例,在OLS回归的基础上,stata中的自相关检验(LM检验、Q检验、DW检验)操作及其分析》一文中已经检验出该模型存在自相关问题,这里进行修正:

首先计算截断参数,一般去p=n^(1/4)或p=0.75*n^(1/3):

di 52^0.25

2.6853496

计算结果为2.69,我们取大于它的整数为3

newey lgasq lincome lgasp lpnc lpuc,lag(3)

结果为:

通过观察newey方法和ols方法发现,估计系数没有变化,估计标准误发生了变化,t值也略有变化。


3



聚类稳健标准差法则是从聚类的角度去修正自相关的,它提出了聚类样本的概念——同一聚类样本里的观测值是相关的,不同聚类样本之间的观测值是不相关的。因此估计回归系数时,以聚类的样本作为单元进行系数标准误的计算中,以改变原有OLS估计的自相关性。它也不会改变OLS回归系数的估计值。

聚类稳健标准差法一般用于面板数据,因为它需要考虑样本的个体类别,例如不同的地区或者组别等等,也可以用于序列数据,对时间(year或者time)进行聚类,但是这种方法有待商榷,还不如直接用HAC稳健标准差法更保险。

我们以votex.dta为例,该数据来自于《高级计量经济学及Stata应用(第二版)陈强》,其数据如下:

暂不考虑其他因素,只是随机建立一个OLS与聚类稳健标准差法修正:

regress votingpop populatn black blucllr farmerregress votingpop populatn black blucllr farmer,cluster(district)

以district(地区)为样本,得到OLS与聚类稳健标准差法结果为:

可以发现,估计系数没有变化,但是标准误与t值有了变化。



本文分享自微信公众号 - 博士的计量经济学干货(econometrics_ABC)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

标签
易学教程内所有资源均来自网络或用户发布的内容,如有违反法律规定的内容欢迎反馈
该文章没有解决你所遇到的问题?点击提问,说说你的问题,让更多的人一起探讨吧!