您好,欢迎访问三七文档
面板数据分析案例一、打开数据利用stata软件打开数据gurnfeld.dta,得到有关第一步,声明截面变量和时间变量。命令为:tssetcompanyyear或xtsetcompanyyear显示:panelvariable:company(stronglybalanced)timevariable:year,1935to1954delta:1year第二步,进行样本的描述性统计。首先我们看看样本的大体分布情况,命令为:xtdescompany:1,2,...,10n=10year:1935,1936,...,1954T=20Delta(year)=1yearSpan(year)=20periods(company*yearuniquelyidentifieseachobservation)DistributionofT_i:min5%25%50%75%95%max20202020202020Freq.PercentCum.|Pattern---------------------------+----------------------10100.00100.00|11111111111111111111---------------------------+----------------------10100.00|XXXXXXXXXXXXXXXXXXXX接下来,我们列示出样本中主要变量的基本统计量,命令为:xtsumxtsuminvestmvaluekstock我们发现统计结果是按照整体、组间和组内三个层次进行的。当然,你也可以采用sum命令来得到基本统计量,而且在写论文时,所需列示的结果并不要求像上面那么详细,此时sum命令反而更实用。第三歩,面板数据模型回归分析。我们先做固定效应模型,命令为:xtregmvalueinvestkstock,fe(软件默认为随机效应)Fixed-effects(within)regressionNumberofobs=200Groupvariable:companyNumberofgroups=10R-sq:within=0.4117Obspergroup:min=20between=0.8078avg=20.0overall=0.7388max=20F(2,188)=65.78corr(u_i,Xb)=0.6955ProbF=0.0000------------------------------------------------------------------------------mvalue|Coef.Std.Err.tP|t|[95%Conf.Interval]-------------+----------------------------------------------------------------invest|2.856166.30751479.290.0002.2495433.462789kstock|-.5078673.1403662-3.620.000-.7847625-.2309721_cons|804.980232.4317724.820.000741.0033868.9571-------------+----------------------------------------------------------------sigma_u|905.81517sigma_e|268.73329rho|.91910377(fractionofvarianceduetou_i)------------------------------------------------------------------------------Ftestthatallu_i=0:F(9,188)=113.76ProbF=0.0000结果的前两行列示了模型的类别(本例中为固定效应模型)、截面变量、以及估计中使用的样本数目和个体的数目。第3行到第5行列示了模型的拟合优度,分为组内、组间和样本总体三个层次。第6行和第7行分别列示了针对参数联合检验的F统计量和相应的P值,本例中分别为65.78和0.0000,表明参数整体上相当显著。第8-11行列示了解释变量的估计系数、标准差、t统计量和相应的P值以及95%的置信区间,这和我们在进行截面回归是得到的结果是一样的。最后四行列示了固定效应模型中个体效应和隨机干扰项的方差估计值(分别为sigma_u和sigma_e),二者之间的关系(rho)。最后一行给出了检验固定效应是否显著的F统计量和相应的P值,本例中固定效应非常显著。估计随机效应模型的命令为:xtregmvalueinvestkstock,reRandom-effectsGLSregressionNumberofobs=200Groupvariable:companyNumberofgroups=10R-sq:within=0.4115Obspergroup:min=20between=0.8043avg=20.0overall=0.7371max=20Waldchi2(2)=149.94corr(u_i,X)=0(assumed)Probchi2=0.0000------------------------------------------------------------------------------mvalue|Coef.Std.Err.zP|z|[95%Conf.Interval]-------------+----------------------------------------------------------------invest|3.113429.307613210.120.0002.5105193.71634kstock|-.578422.1424721-4.060.000-.8576622-.2991819_cons|786.9048182.17154.320.000429.85531143.954-------------+----------------------------------------------------------------sigma_u|546.52144sigma_e|268.73329rho|.80529268(fractionofvarianceduetou_i)------------------------------------------------------------------------------第四歩,模型的筛选和检验。这是模型设定过程中最为关键同时也是最难的一歩,主要涉及使用【混合效应】混合OLS模型(最小二乘估计)、固定效应模型还是随机效应模型,更进一歩还可能包括序列相关和异方差的检验等问题。在这方面功力的提髙需要大量的实践经验和对理论的深入理解。1)检验个体效应的显著性。对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上是否显著。在我们的例子中,上而的检验结果表明固定效应模型优于混合的OLS模型。下面我们说明如何检验随机效应是否显著,命令为:若模型检验下面没有F检验,就输入xttest0注明:通过豪斯曼检验,使用固定效应/随机效应BreuschandPaganLagrangianmultipliertestforrandomeffectsmvalue[company,t]=Xb+u[company]+e[company,t]Estimatedresults:|Varsd=sqrt(Var)---------+-----------------------------mvalue|17278311314.47e|72217.58268.7333u|298685.7546.5214Test:Var(u)=0chibar2(01)=772.32Probchibar2=0.0000检验得到的P值为0.0000,表明随机效应非常显著。可见,随机效应模型也优于混合OLS模型,至于固定效应模型和随机效应模型何者更佳,则要采用Hausman检验来确定。2)hausman检验。具体步骤为:step1:估计固定效应模型模型,存储估计结果;step2:估计随机效应模型,存储估计结果;step3:进行Hausman检验quixtregmvalueinvestkstock,fe/*step1*/.eststorefe.quixtregmvalueinvestkstock,re/*step2*/.eststorere.hausmanfe/*step3*/这里qui的作用在于不把估计结果输出到屏幕上,eststore的作用在十把估计结果存储到名称为fe的临时性文件中。输出结果为:----Coefficients----|(b)(B)(b-B)sqrt(diag(V_b-V_B))|fereDifferenceS.E.-------------+----------------------------------------------------------------invest|2.8561663.113429-.2572636.kstock|-.5078673-.578422.0705548.------------------------------------------------------------------------------b=consistentunderHoandHa;obtainedfromxtregB=inconsistentunderHa,efficientunderHo;obtainedfromxtregTest:Ho:differenceincoefficientsnotsystematicchi2(2)=(b-B)'[(V_b-V_B)^(-1)](b-B)=2366.62Probchi2=0.0000(V_b-V_Bisnotpositivedefinite)我们注意到输出结果的最后一行提示说固定效应模型和随机效模型的参数估计方差的差是-个非正定矩阵,因此sqrt(diag(V_b-V_B))一项全为缺失值。这是在进行Hausman检验过程中经常遇到的问题,有时我们还会得到负的chi2值。产生这些情况的原因可能有多种,但一个主要的原因是我们的模型设定有问题,导致hausman检验的基本假设得不到满足。这时,我们最好先对模型的设定进行分析,看看是否有遗漏变量的问题,或者某些变量是非平稳的等等。在确定模型的设定没有问题的情况再进行检验,如果仍然拒绝原假设或是出现上面的问题,那么我们就认为随机效应模型的基本假设(个体效应与解释变量不相关)得不到满足。此时,需要采用工具变量法或是使用固定效应模型。在本例中,如果抛开sqrt(diag(V_b-V_B))一项全为缺失值这一问题,从检验的P值为零这一结果来看,随机效应模型的假设无法满足,所以采用同定效应模型是比较合适的。对于采用stata9.0或以上版本的读者而言,使用Hausman命令中新增的sigmaless和sigmamore两个选项可以大大降低上述chi2值为负的情况出现的次数。着下面的例子:hausmanfe,sigmaless----Coefficients----|(b)(B)(b-B)sqrt(diag(V_b-V_B))|fereDifferenceS.E.-------------+----------------------------------------------------------------invest|2.8561663.113429-.2572636.0803747kstock|-.5078673-.578422.0705548.0283398-------------------------
本文标题:面板数据分析案例
链接地址:https://www.777doc.com/doc-5071795 .html