您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 使用GMM方法分析动态面板数据
对外经济贸易大学金融学院张海洋1GMM方法与动态面板数据——一个简介2015年8月在阅读文献中经常看到有使用GMM方法分析动态面板数据,但没有深入研究。最近开始自己用此方法时,感觉很困惑,因为使用此方法的文献中,对方法的原理大多语焉不详。对该方法的适用性,为什么用此方法,以及方法优缺点介绍聊聊几句。因此,通过读文献很难对该方法有全面的把握。由于时常有学生过来问我怎么用GMM方法处理动态面板数据,不能总是含糊地回答,同时自己也在写这方面的文章,因此找来几本参考书,搜集了大量的文献,详细阅读之后,撰写本文。文中主要内容摘要并整理自Roodman(2009),这是STATA命令xtabond2命令的作者所写的介绍性文章,应该有权威性,如果该文不准确,那么所有使用此命令做的研究将全部失效。同时参考了CameronandTrivedi(2009)和(AngristandPischke,2009)等书籍。本文仅为作者对该方法的理解,如有不妥、疑问或建议请联系:hyang_zhang@163.com。(一)为什么要用GMM方法本文所谓动态面板数据(DynamicPaneldata,DPD)分析,指的是分析中采用如下的回归方程:,,1itititiitYYXu(1)1,...,iN,1,...,tT其中,,1itY是因变量的滞后项,iu是个体i的固定效应。因变量的滞后项和固定效应同时存在,是动态面板数据分析特殊性的关键。如果固定效应不存在,那么回归方程变为:,,1ititititYYX(2)这时,用OLS或者随机效应模型回归分析即可。如果因变量的滞后项,1itY不存在,那么回归方程变为:,ititiitYXu(3)对外经济贸易大学金融学院张海洋2对于该模型,用固定效应模型分析即可。如果因变量的滞后项和固定效应都存在,那么对于(1)式这样的回归方程,如果采用差分方法去掉固定效应,会得到如下的结果,,1ititititYYX(4)其中,,,-1=-itititYYY,,-1,-1,-2=-itititYYY,,,,-1=-itititXXX,,,,-1=-ititit。如果(1)式代表了真实的变量之间关系,那么,1itY和it之间必有相关性,因为:,-1,-1,-2,2,1,1=-=(1)ititititititYYYYX,,-1,cov(,)ititY显然不会等于0,因为两者都有,1it这一项。通常所用的固定效应模型实际上就是对(1)式差分,得到类似于(4)式的差分回归方程,然后做OLS。对于现在的情况,由于,1itY和it之间的相关性,再用OLS只会得到有偏误的回归系数。所以传统的统计方法无法实现对此类方程的估计,需要用GMM方法。需要注意的是(2)的模型(包含滞后项的OLS)和(3)的模型(不包含滞后项的FE,固定效应)尽管都有偏误,但好处是一个偏大,一个偏小(具体哪个大,哪个小要看变量之间的关系),所以这两个估计系数应该界定了真实参数的范围(AngristandPischke,2009:246页;Roodman,2009)。也就是说,你最后用GMM方法估计出来的参数应该落到这个区间。(二)什么是GMM方法通常所用的OLS等方法,基本逻辑是从计量模型对数据拟合的角度分析,得出最好的估计参数。GMM方法,又称为广义矩方法(GeneralizedMomentMethod),该方法所用的思路与传统思路完全不同。任何计量模型都有一定的适用性,即数据要满足一定的要求。GMM方法的思路是,从计量模型对数据的要求出发,得出一系列矩条件,再根据这些矩条件,求解满足条件的系数。对于大多数计量模型,GMM方法和传统的方法“殊途同归”,得出的回归系数相差不会太远。1、线性回归中的GMM方法以OLS为例,对于回归方程:对外经济贸易大学金融学院张海洋3YXβε传统OLS模型中,β的估计量1OLSˆ=(')(')βXXXY。注意到,如果使用OLS模型,数据有要求,就是自变量X和误差项ε要独立,也就是说:(')0EXε这个就是所谓的“矩条件”。把εYβX带入,得到('())0EXYXβ,即:(')(')EEXYXXβ1[(')](')EEβXXXY为了得到β的估计量,可以把(')EXX和(')EXY的估计量分别带入,即1ˆ(')'ENXXXX,1ˆ(')'ENXYXY得到1GMMˆ(')'βXXXY,这是和传统的OLS一样的估计量。2、工具变量的GMM方法工具变量方法也可以用矩估计的思路实现。由于过程略复杂,此处仅给出简要步骤,详细的推导可以参考(Roodman,2009)。需要回归的方程为:YXβε其中,Z是工具变量,(|)0EεZ。()12kXx,x...x,是k个自变量向量,()12jZz,z...z是j个工具变量向量。相应的,待估计的系数β是k维向量。定义EYXβ为误差向量,对于任意估计出来的参数ˆβ,残差项为ˆˆEYXβ。根据工具变量的含义,它应该和误差项ε独立:(')0EZε,这就是我们需要的矩条件。计算的时候,理论上应该利用1ˆ(')0NENZεZ'E求解,注意到,我们有j个工具对外经济贸易大学金融学院张海洋4变量,也就是j个矩条件(j个方程)。理论上,需要根据这j个方程求解k个待估计的参数。但是不幸的是,如果工具变量的数量j小于待估计的参数数量k,方程是不可识别的——通常不可能通过2个方程解出3个未知数。如果工具变量等于待估计的参数,是恰好可识别的,但这种情况在GMM中很难碰到。最常见的是工具变量多于待估计的参数,即jk,这意味着要找k个参数,让j个方程同时等于零。这难度相当大,实际上大多数时候找不到,怎么办呢?在矩估计里面,采用的办法是,找k个参数,让1ˆ(')NENZεZ'E和零之间的距离最小。实际计算的时候,需要借助一个半正定的矩阵A,计算向量(')NEZε的模:1111ˆˆˆˆˆ(')()'()NENNNNNAAZεZ'EZ'EAZ'EE'ZAZ'E目标变成,寻找参数向量ˆ=argmin(')NEAAβZε,这就要用到一阶条件等于零:(')ˆNdEdAZε=…=2ˆ0NE'ZAZ'(-X)计算的过程利用到了连锁规则和向量求导的公式。继续推导,把ˆˆEYXβ带入,得到:ˆˆˆ0()'E'ZAZ'XYXβ'ZAZ'XY'ZAZ'Xβ'XZAZX1ˆ=(')AβXZAZXX'ZAZ'Y这就是β的GMM估计量,这个估计量是有偏的,它的期望值不等于真实的β;然而它是一致的,当样本量足够大的时候,它会接近真实的β。这个估计量和A有关,但是A只影响参数估计的有效性——不同的A对应的参数ˆAβ收敛的速度不同。这里的A其实是对不同的矩条件加以不同的权重,可以找到一个收敛最快的A,称为EGMMA,可以证明:1()EGMMVarAzε。对外经济贸易大学金融学院张海洋5对于工具变量法常用的两阶段最小二乘法(2SLS),如果假定误差项是独立同分布,那么11()=()EGMMVarAzεZ'Z,此时111ˆ=('())()GMMβXZZ'ZZXX'ZZ'ZZ'Y这实际上就是传统通过两阶段最小二乘法(2SLS)估计出来的参数,殊途同归。3、GMM方法的有效性(Hansen检验和Sargan检验)前文已经介绍,使用GMM方法的目标是选择参数,最小化1ˆ(')NENZεZ'E和零之间的距离(')NEAZε。那么问题来了,多小算小呢?会不会是最小值也显著大于零?如果这样的话,方法的适用性就成问题。也就是说,根据你估计出来的参数,算出的残差项实际上和工具变量不是独立。Hansen检验和Sargan检验的逻辑就是,以(')NEAZε最小化为目标,估计出参数,然后把参数带入,看看它是否真的等于零。如果统计上不能拒绝它等于零,则所用工具变量可靠;如果统计上拒绝它等于零,则不可靠。如果零假设成立(即0H:工具变量是联合有效的),那么1ˆ(')NENZεZ'E应随机分布于零附近,它和零的距离应服从2分布:EGMMEGMM2EGMM11ˆˆˆ(')NjkENNAAZεZ'EE'ZAZ'E这就是Hansen统计量,它服从自由度为jk的2分布,这里自由度其实就是过度识别的维度。在实际使用中,不应该显著(p值小于0.1);如果显著,则表明拒绝了零假设,工具变量不是联合有效的。然而,需要注意的是,如果使用的工具变量太多,那么Hansen统计量会非常不显著,常常等于1。这是因为,jk越大,意味着2分布显著的门槛越高(请查阅2分布的表格)。也就是说,工具变量太多,会让Hansen检验的效果变弱,这是需要注意的。通常Hansen检验的p值大于0.25就要小心了,这时需要考虑减少工具变量的数量。Sargan检验的统计量类似,只不过把Hansen统计量中的EGMMA替换成了-1(Z'Z),即对外经济贸易大学金融学院张海洋6112(')1ˆˆ(')()NjkzzSENZεE'ZZ'ZZ'E然而,该统计量有时候是不一致的,如果在命令中要求报告稳健的Sargan统计量,软件会做两阶段GMM估计(先找任意合理的H,令1=()AZ'HZ,估计出第一步参数1ˆβ;再根据1ˆβ,计算出残差项的方差-协方差矩阵1ˆˆβ,令11ˆˆ=()βAZ'Z,估计出第二部参数2ˆβ),根据第二步的参数结果,默默报告出Hansen统计量。整体上说,Hansen统计量好像更靠谱一点,所以报告的时候,更多关注Hansen统计量。(三)动态面板数据现在回到我们的动态面板数据,对数据和模型有如下假定:1)动态。模型中包含了因变量的滞后项;2)有个体的固定效应;3)可以有一些自变量是内生的;4)除了固定效应之外的误差项it可以异方差,可以序列相关;5)不同个体之间的误差项it和jt不会相关。6)可以有前定的(Predetermined)但不是完全外生的变量。7)“大N,小T”,即个体数量要足够多,但时间不用太长。如果时间足够长的话,动态面板误差不会太大,用固定效应即可。从上述要求可以看出,GMM方法特别适合宏观的面板数据分析,因为宏观变量中,很难找出绝对外生的变量,变量之间多少会互相影响。而GMM方法可以“有一些自变量是内生的”,这可能也是GMM方法在文献中这么常用的原因。此前已经说过,不能用传统的OLS方法或者固定效应模型进行动态面板数据的分析,那样会得到有偏的估计量。先要对数据进行一定的变换,然后根据不同的矩条件设定开展矩估计。其中数据变换有两种方法,矩条件的设定也有两种方法。对外经济贸易大学金融学院张海洋71、数据的变换方法:一阶差分还是垂直离差为了消除动态面板数据中的固定效应,通常用的有两种方法:一阶差分(firstdifference)和垂直离差(orthogonaldeviations)。一阶差分之前已经介绍过了,这种方法是differenceGMM中默认的方法。缺点是如果数据中有缺失值,那么最终的估计会缺失很多样本,原始数据缺一行往往会导致差分后的数据缺两行。一种替代的方案是用垂直离差(xtabond2命令中用orthogonal选项实现),每个变量减去该变量未来所有观测值的平均值,即:,1,1()itititisstitwcwwT式子中,/(1)itititcTT为调整权重变量,itT是从t期开始以后观测值的数量。对于非平衡面板,和数据有缺失的面板,这种方法避免了因缺失数据带来的样本损失,因为调整的时候只是把未来的平均值减去,样本数不会因缺失未来个别观测值而受损。然而,对于平衡面板数据,一阶差分和垂直离差估计出来的结果会完全一样。2、DifferentGMM还是SystemGMM令数据变换之后的回归方程变为,,1***ititititYYX(5)这种变换可以是一阶差分,也可以是垂直离差。DifferentGMM的
本文标题:使用GMM方法分析动态面板数据
链接地址:https://www.777doc.com/doc-1729599 .html