您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > STATA面板大数据模型操作命令
标准实用文案大全STATA面板数据模型估计命令一览表一、静态面板数据的STATA处理命令itxyitiit固定效应模型itxyititititit随机效应模型(一)数据处理输入数据●tssetcodeyear该命令是将数据定义为“面板”形式●xtdes该命令是了解面板数据结构●summarizesqcpiunemgse5ln各变量的描述性统计(统计分析)●genlag_y=L.y///////产生一个滞后一期的新变量标准实用文案大全genF_y=F.y///////产生一个超前项的新变量genD_y=D.y///////产生一个一阶差分的新变量genD2_y=D2.y///////产生一个二阶差分的新变量(二)模型的筛选和检验●1、检验个体效应(混合效应还是固定效应)(原假设:使用OLS混合模型)●xtregsqcpiunemgse5ln,fe对于固定效应模型而言,回归结果中最后一行汇报的F统计量便在于检验所有的个体效应整体上显著。在我们这个例子中发现F统计量的概率为0.0000,检验结果表明固定效应模型优于混合OLS模型。●2、检验时间效应(混合效应还是随机效应)(检验方法:LM统计量)(原假设:使用OLS混合模型)●quixtregsqcpiunemgse5ln,re(加上“qui”之后第一幅图将不会呈现)xttest0标准实用文案大全可以看出,LM检验得到的P值为0.0000,表明随机效应非常显著。可见,随机效应模型也优于混合OLS模型。●3、检验固定效应模型or随机效应模型(检验方法:Hausman检验)原假设:使用随机效应模型(个体效应与解释变量无关)通过上面分析,可以发现当模型加入了个体效应的时候,将显著优于截距项为常数假设条件下的混合OLS模型。但是无法明确区分FEorRE的优劣,这需要进行接下来的检验,如下:Step1:估计固定效应模型,存储估计结果Step2:估计随机效应模型,存储估计结果Step3:进行Hausman检验●quixtregsqcpiunemgse5ln,feeststorefequixtregsqcpiunemgse5ln,reeststorerehausmanfe(或者更优的是hausmanfe,sigmamore/sigmaless)可以看出,hausman检验的P值为0.0000,拒绝了原假设,认为随机效应模型的基本假设得不到满足。此时,需要采用工具变量法和是使用固定效应模型。标准实用文案大全(三)静态面板数据模型估计●1、固定效应模型估计●xtregsqcpiunemgse5ln,fe(如下图所示)其中选项fe表明我们采用的是固定效应模型,表头部分的前两行呈现了模型的估计方法、界面变量的名称(id)、以及估计中使用的样本数目和个体的数目。第3行到第5行列示了模型的拟合优度、分为组内、组间和样本总体三个层面,通常情况下,关注的是组内(within),第6行和第7行分别列示了针对模型中所有非常数变量执行联合检验得到的F统计量和相应的P值,可以看出,参数整体上相当显著。需要注意的是,表中最后一行列示了检验固定效应是否显著的F统计量和相应的P值。显然,本例中固定效应非常显著。●2、随机效应模型估计若假设本例的样本是从一个很大的母体中随机抽取的,且i与解释变量均不相关,则我们可以将i视为随机干扰项的一部分。此时,设定随机效应模型更为合适。●xtregsqcpiunemgse5ln,re(如下图所示)标准实用文案大全●3、时间固定效应(以上分析主要针对的是个体效应)如果希望进一步在上述模型中加入时间效应,可以采用时间虚拟变量来实现。首先,我们需要定义一下T-1个时间虚拟变量。●tabyear,gen(dumt)(tab命令用于列示变量year的组类别,选项gen(dumt)用于生产一个以dumt开头的年度虚拟变量)dropdumt1(作用在于去掉第一个虚拟变量以避免完全共线性)若在固定效应模型中加入时间虚拟变量,则估计模型的命令为:●xtregsqcpiunemgse5lndumt*,fe标准实用文案大全(四)异方差和自相关检验●1、异方差检验(组间异方差)本节主要针对的是固定效应模型进行处理(1)检验原假设:同方差需要检验模型中是否存在组间异方差,需要使用xttest3命令。●quixtregsqcpiunemgse5ln,fexttest3显然,原假设被拒绝。此时,需要进一步以获得参数的GLS估计量,命令为xtgls:标准实用文案大全●xtglssqcpiunemgse5ln,panels(heteroskedastic)其中,组间异方差通过panels()选项来设定。上述结果是采用两步获得,即,先采用OLS估计不考虑异方差的模型,进而利用其残差计算。。。,并最终得到FGLS估计量。●2、序列相关检验对于T较大的面板而言,i往往无法完全反映时序相关性,此时it便可能存在序列相关,在多数情况下被设定为AR(1)过程。原假设:序列不存在相关性。(1)FE模型的序列相关检验对于固定效应模型,可以采用Wooldridge检验法,命令为xtserial:●xtserialsqcpiunemgse5ln可以发现,这里的P=0.0000,我们可以在1%的显著性水平下爱拒绝不存在序列相关的原假设。考虑到样本,该检验的最后一步是用~eit对~1-tei,进行OLS回归,标准实用文案大全因此,输入以下命令得到8858.0~。检验该值是否显著异于-0.5,因为在原假设下(不相关)5.0-~,可见本例中不相等,拒绝原假设,说明存在序列相关。●matliste(b)(2)RE模型的序列相关检验对于RE模型,可以采用xttest1命令来执行检验:●quixtregsqcpiunemgse5lndumt*,rexttest1这里汇报了4个统计量,分别用于检验RE模型中随机效应(单尾和双尾)、序列相关以及二者的联合显著性,检验结果表明存在随机效应和序列相关,而且对随机效应和序列相关的联合检验也非常显著。(3)稳健型估计上述结果表明,无论是FE还是RE模型,干扰项中都存在显著的序列相关。为此,我们进一步采用xtregar命令来估计模型,首先考虑固定效应模型:标准实用文案大全●xtregarsqcpiunemgse5lndumt*,felbi●3、“异方差—序列相关”稳健型标准误虽然上述估计方法在估计方差-协方差矩阵时考虑了异方差和序列相关的影响,但都未将两者联立在一起考虑,要获得“异方差-序列相关”稳健型标准误,只需在xtreg命令中附加vce(robust)或者vce(cluster)选项即可。例如,对于FE模型,我们可以执行如下命令:●xtregsqcpiunemgse5ln,fevce(robust)与之前未经处理的估计结果相比,附加命令vce(robust)选项时的结果,虽标准实用文案大全然系数的估计值未发生变化,但此时得到的标准误明显增大了,致使得到的估计结果更加保守。对于面板数据模型而言,STATA在计算所谓的“robust”标准误时,是以个体为单位调整标准误的。因此,我们得到的“robust”标准误其实是同时调整了异方差和序列相关后的标准误。换言之,上述结果与设定vce(cluster)选项的结果完全相同。●4、截面相关检验原假设:截面之间不存在着相关性(1)FE模型检验对于FE模型,可以利用xttest2命令来检验截面相关性:●quixtregsqcpiunemgse5ln,fexttest2(该命令主要针对的是大T小N类型的面板数据,在本例中无法使用,故图标略去。)(2)RE模型检验对于RE模型,可以利用xtcsd命令来检验截面相关性:●quixtregsqcpiunemgse5ln,rextcsd,pesaran(下面命令是另一个检验指标)xtcsd,frees可以看出,两种不同的检验方法均显示面板数据存在着截面相关性。●5、“异方差—序列相关—截面相关”稳健型标准误(1)FE模型估计标准实用文案大全对于FE模型,在确认上述存在着截面相关的情况下,我们可以采用Hoechle(2007)编写的xtscc命令获取DriscollandKraay(1998)提出的“异方差—序列相关—截面相关”稳健型标准误:●xtsccsqcpiunemgse5ln,fe这里,xtscc命令会自动选择的滞后阶数为2,系数估计值和Within-R2与xtreg,fe的结果完全相同,但标准误存在着较大差异。可见,在本例中,截面相关对统计推断有较大的影响。若读者有跟高的方法来确定自相关的滞后阶数,则可以通过lag()选项设定。当然,在多数情况下,这很难做到。不过我们可以通过附加lag(0)来估计仅考虑异方差和截面相关的稳健型标准误,命令如下:●xtsccsqcpiunemgse5ln,felag(0)(2)RE模型估计(略,待补充)二、动态面板数据的STATA处理命令标准实用文案大全(一)差分GMMxtabondlnwicdlngdplanddocfirlnroadlnpopfinaxtabondlnwicdlngdplanddocfirlnroadlnpopfina,lag(2)twostep(二)系统GMMxtdpdsyslnwicdlngdplanddocfirlnroadlnpopfinaxtdpdsyslnwicdlngdplanddocfirlnroadlnpopfina,twostep(三)内生性检验●estatsargan(四)序列相关检验●estatabond三、门槛(门限回归)面板模型的STATA处理命令xtthresy,thres(q)dthres(x)bs1(30)bs2(30)bs3(20)各个门槛的置信区间图:xttr_graph第一轮搜索第一个门槛xttr_graph,m(22)第二轮搜索第二个门槛xttr_graph,m(21)第二轮搜索第一个门槛xttr_graph,m(3)呈现估计结果:localq1=e(rhat21)取出门槛值localq2=e(rhat22)gend1=(q<=’q1’)生成虚拟变量gend2=(q>’q2’)genxd1=x*d1genxd2=x*d2xtregyxxd1xd2,fe常规标准误eststorefextregyxxd1xd2,ferobust稳健型估计标准实用文案大全eststorefe_robustlocalm”fefe_robust”esttab‘m’,mtitle(‘m’)nogaps(r2r2_wNF)///star(*0.1**0.05***0.01)1.检验:是否存在门槛效应混合面板:regislfrlfr2hcopenpsratpgr,vce(clustersf)固定效应、随机效应模型xtregislfrlfr2hcopenpsratpgr,feeststorefextregislfrlfr2hcopenpsratpgr,reeststorerehausmanfe两步系统GMM模型xtdpdsysrltplf1naiefdopewig,lags(1)maxldep(2)twostep标准实用文案大全artests(2)注:rlt为被解释变量,“plf1naiefdopewig”为解释变量和控制变量;maxldep(2)表示使用被解释变量的两个滞后值为工具变量;pre()表示以某一个变量为前定解释变量;endogenous()表示以某一个变量为内生解释变量。自相关检验:estatabond萨甘检验:estatsargan差分GMM模型Xtabondrltplf1naiefdopewig,lags(1)twostepartests(2)内生:该解释变量的取值是(一定程度上)由模型决定的。内生变量将违背解释变量与误差项不相关的经典假设,因而内生性问题是计量模型的大敌,可能造成系数估计值的非一致性和偏误;外生:该解释变量的取值是(完全)由模型以外的因素决定的。外生解释变量与误差项完全无关,不论
本文标题:STATA面板大数据模型操作命令
链接地址:https://www.777doc.com/doc-5179278 .html