stata中的自相关修正（HAC稳健标准差、聚类稳健标准差）操作及其分析

之前讲了回归分析诊断中的自相关检验，接下来针对前边的模型进行修正，stata中主要有4种方法，包括HAC稳健标准差、聚类稳健标准差、广义最小二乘法、修改模型等，这里先介绍前两种方法的基本原理与stata操作，并对结果如何进行分析与判断。

仍然选取美国汽油需求数据gasoline.dta作为示例，其样本有52个，数据展示如下：

这里建立如下回归模型：

用stata进行估计，代码为：

regress lgasq lincome lgasp lpnc lpuc

结果为：

HAC稳健标准差法全称为Heteroskedasticity and Autocorrelation Consistent Standard Error，即“OLS+异方差自相关稳健标准差”，也称为“Newey-West估计法”，因为它是由Newey-West提出的，它是通过引入自相关的参数（也称为“截断参数”），来改变标准差的估计值，从而修正值相关问题，但它不会改变OLS回归系数的估计值。

值得注意的是，在stata异方差修正里也有稳健标准差的方法，即

Heteroskedasticity Robust Standard Error方法，这个方法要与HAC稳健标准差法区分开来，因为它只能修正异方差，Newey-West估计法可以同时修正异方差与自相关。

以gasoline.dta为例，在OLS回归的基础上，《stata中的自相关检验（LM检验、Q检验、DW检验）操作及其分析》一文中已经检验出该模型存在自相关问题，这里进行修正：

首先计算截断参数，一般去p=n^(1/4)或p=0.75*n^(1/3)：

di 52^0.25

2.6853496

计算结果为2.69，我们取大于它的整数为3

newey lgasq lincome lgasp lpnc lpuc,lag(3)

结果为：

通过观察newey方法和ols方法发现，估计系数没有变化，估计标准误发生了变化，t值也略有变化。

聚类稳健标准差法则是从聚类的角度去修正自相关的，它提出了聚类样本的概念——同一聚类样本里的观测值是相关的，不同聚类样本之间的观测值是不相关的。因此估计回归系数时，以聚类的样本作为单元进行系数标准误的计算中，以改变原有OLS估计的自相关性。它也不会改变OLS回归系数的估计值。

聚类稳健标准差法一般用于面板数据，因为它需要考虑样本的个体类别，例如不同的地区或者组别等等，也可以用于序列数据，对时间（year或者time）进行聚类，但是这种方法有待商榷，还不如直接用HAC稳健标准差法更保险。

我们以votex.dta为例，该数据来自于《高级计量经济学及Stata应用(第二版)陈强》，其数据如下：

暂不考虑其他因素，只是随机建立一个OLS与聚类稳健标准差法修正：

regress votingpop populatn black blucllr farmerregress votingpop populatn black blucllr farmer,cluster(district)

以district（地区）为样本，得到OLS与聚类稳健标准差法结果为：

可以发现，估计系数没有变化，但是标准误与t值有了变化。

本文分享自微信公众号 - 博士的计量经济学干货（econometrics_ABC）。
如有侵权，请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”，欢迎正在阅读的你也加入，一起分享。

来源：oschina

链接：https://my.oschina.net/u/4606941/blog/4482205

标签

聚类