操作课(经典计量)

1、一、案例一（回归和基本检验）背景和数据文件背景：为了检验美国电力行业是否存在规模经济，Nerlove（1963）收集了1955年145家美国电力企业的总成本(tc)、产量(q)、工资率(pl)、燃料价格(pf)及资本租赁价格(pk)的数据。变量名前面加ln表示取自然对数以后的数值。数据文件：nerlove.dta1模型的建立（陈强P38）2、数据准备打开文件，输入数据(P32)点击DataEditor图标(或者Window-DataEditor）用EXCEL打开nerlove.xls复制文件数据，并黏贴到DataEditor中文件保存点击Save图标(File-Save），nerlove.dta文件打开点击Open图标(File-Open)数据审视与查看describe(或者d)listtcqin1/5listtcqifq=1000summarizeq(或者suq)suqifq=1000suq,detailsutabulatepl(查看累积分布）correlatetcqplpfpk生成新变量glntc=log(tc)glnq=lo。

2、g(q)glnpl=log(pl)glnpf=log(pf)glnpk=log(pk)生成虚拟变量glarge=(q=10000)真为1，假为03、线性回归1regresslntclnqlnpllnpklnpf含义就是以lntc作为因变量，以lnq、lnpl、lnpk、lnpf作为自变量建立线性回归模型。得到小样本理论下的回归结果。一些变形regresslntclnqlnpllnpklnpf,noc(不含常数项）regresslntclnqlnpllnpklnpfifq=6000(只对大企业回归）predictlntchat(预测被解释变量，并记为lntchat)predicte1,residual(预测残差，记为e1)3线性回归2采用稳健标准差估计(robust)。稳健标准差是指其标准差对于模型中可能存在的异方差或自相关问题不敏感，基于稳健标准差计算的稳健t统计量仍然渐进分布t分布。因此，在Stata中利用robust选项可以得到异方差稳健估计量。regresslntclnqlnpllnpklnpf,robust这个命令表示是以lntc作为因变量。

3、，以lnq、lnpl、lnpk、lnpf作为自变量建立线性回归模型。命令最后的robust命令代表使用大样本稳健标准差进行各种预测和检验。得到大样本理论下的回归结果。3线性回归3从这两个结果可以看到：稳健标准差与普通标准差的估计的系数相同标准差和t值存在着较大的差别很少有数据能够满足小样本理论的严格假设，所以当样本数据足够大时，我们最好采用稳健标准差进行估计和检验，这样得到的结果将会更加准确。4、检验显著性检验testlnpl检验约束条件是否满足testlnpl+lnpk+lnpf=1联合检验testlnpllnpktest(lnq=1)(lnpl+lnpk+lnpf=1)5、约束回归constraintdef1lnpl+lnpk+lnpf=1cnsreglntclnqlnpllnpklnpf,c(1)两个约束条件constraintdef1lnpl+lnpk+lnpf=1consdef2lnq=1cnsreglntclnqlnpllnpklnpf,c(1-2)二、案例二、内生性和工具变量法1、背景和数据文件背景：估计教育投资的回报率。数据。

4、来源：grilic.dta变量说明（不带80的数据为初始期，带80的变量为1980年的数据）Lw（工资对数）S（年时受教育年限）Expr（工龄）Tenure（在现单位工作年限）iq（智商）med（母亲的教育年限）kww（在“knowledgeoftheworldofwork”测试中的成绩）mrt（婚姻虚拟变量，已婚=1）age（年龄）2、数据准备工作查看统计特征设定路径，然后usegrilic.dta,clear（或者直接用菜单打开文件grilic.dta）sum考察智商与受教育年限的关系corriqs3、OLS回归，使用稳健标准差reglwsexprtenurernssmsa,r说明：感兴趣的是受教育年限s与工资的关系，exp,tenure,rns,smsa为控制变量4、内生性的处理——加入代理变量能力与受教育年龄存在相关，上述式子中由于省略了能力变量，因此可能存在内生性问题能力无法直接衡量，用智商（iq）作为代理变量reglwsiqexprtenurernssmsa,r比较结果但由于能力的测量有观测误差，仍旧存在内生性5、内生性处。

5、理——2SLS，GMM内生性处理方法中2SLS，GMM在Stata命令中格式是统一的：ivregressestimatory[varlist1](varlist2=varlist_iv)[if][in][weight][,options]ivregress表示对模型进行内生性处理语句其中estimator代指2sls或者gmm两种方法varlist1表示模型不存在内生性的解释变量varlist2=varlist_iv表示模型中存在内生性的变量和解释其的工具变量if表示回归的条件in表示回归的范围weight表示回归中加入放入权重options的内容如下表所示：（1）2SLS法语法ivregress2slsy[varlist1](varlist2=instlist)[if][in][weight][,options]具体来说最常用的两个2SLS的命令语句：ivregress2slsyx1(x2=z1z2)此命令表示2SLS法估计时使用的默认普通的标准差，且默认是结果只显示第二阶段的回归结果。ivregress2slsyx1(x2=z1z2),rfirst。

6、此命令语句中其中r表示使用稳健标准差，first表示在结果中显示第一阶段的回归。ivregress2slslwsexprtenurernssmsa(iq=medkwwmrtage),r此命令表示使用2SLS法对模型进行估计，使用med,kww,mrt,age作为iq的工具变量ivregress2slslwexprtenure(iqs=medkwwmrtage)此命令表示使用2SLS法对模型进行估计，使用med,kww,mrt,age作为iq和s的工具变量。ivregress2slslwsexprtenurernssmsa(iq=medkww),rfirst此命令表示使用2SLS法对模型进行估计，使用med,kww,作为iq的工具变量，同时显示第一阶段回归结果。（2）GMM法语法ivregressgmmy[varlist1](varlist2=instlist)[if][in][weight][,options]存在异方差，或者矩条件超过参数个数时，可以采用GMM估计ivregressgmmlwsexprtenure(iq=medkww)6、内生性的检验前面已。

7、经解读了Stata中对内生性问题的处理，有时候仅从意义上观察不能确定内生性是否存在时，可以用以下方法检验模型是否存在内生性问题。（1）豪斯曼检验语法在Stata中的命令语句为：hausmanname-consistent[name-efficient][,options]hausman语句表示豪斯曼检验其中语句中name-consistent是指一致估计量变量名name-efficient是指有效估计量变量名这两个变量的顺序是不能改变的options内容如下表所示：（2）豪斯曼检验STATA操作步骤。regyx1x2estimatesstoreols这两个命令在对模型进行回归之后，存储OLS的估计结果为估计的有效估计量。ivregress2slsyx1(x2=z1z2)estimatesstoreiv假设怀疑x2为内生解释变量，找到x2的工具变量进行2sls回归估计。此命令存储2SLS估计的的结果为估计的一致估计量。hausmanivols[,options]此命令是根据以上的存储结果进行豪斯曼检验，然后根据得到的结果图进行判断。常用检验语句是hau。

8、smanivols，constantsigmamore（3）本案例操作（P141)reglwiqsexprtenurernssmsaestimatesstoreolsquietlyivregress2slslwsexprtenurernssmsa(iq=medkww)estimatesstoreivhausmanivols,constantsigmamore豪斯曼检验的原假设是所有解释变量都是外生的，Stata检验结果显然表明模型以p=0的概率拒绝原假设，说明解释变量iq为内生解释变量。7、工具变量有效性检验（1）弱工具变量检验方法当选取的工具变量与内生解释变量的相关性较低时，使用2SLS法估计是有偏误的。这时，此工具变量就可以看作弱工具变量。方法1：ivregress2slslwsexprtenurernssmsa(iq=medkww),rfirst从第一阶段回归结果查看考察F统计量（是否大于10）方法2：利用Stata中检验弱工具变量的命令：estatfirststage或者estatfirststage,allforcenonrobust该命令将。

9、显示与“弱工具变量”有关的第一个阶段回归统计量及临界值。选择项“all”表示显示每个内生解释变量的统计量。选择项“nonrobust”表示，即使在工具变量法时使用了稳健标准差，也仍然允许计算“estatfirststage”中的统计量。判断标准第一：初步判断使用partialR-squared，所以偏R2越大越好，但至于R2多低才构成弱解释变量，至今还无定论。第二：minimumeigenvaluestatistic(最小特征统计量)，经验上此数应该大于10则拒绝“存在弱工具变量”的原假设。Stata提供了“最小特征统计量”的临界值，可以据此判断。（2）过度识别检验此检验是用来检验模型工具变量是否为外生变量。目前计量经济学仅限于在过度识别的情况下，进行过度识别检验。过度识别检验在stata中命令语句为estatoverid过度识别检验的操作1quietlyivregress2slslwsexprtenurernssmsa(iq=medkwwmrtage),restatoverid首先对模型进行2SLS法估计，并加上quietly使结果不显示在stata窗口中。输入。

10、此过度识别检验命令后可以得到过度检验结果。如果拒绝原假设，说明有些工具变量不合格（与扰动项相关，要去掉过度识别检验的操作2quietlyivregressgmmlwsexprtenurernssmsa(iq=medkww)estatoverid先进行GMM估计，并同样要求结果不在stata窗口中显示。然后检验外生性。。