您好,欢迎访问三七文档
工具变量回归经典假设所有的解释变量Xi与随机误差项彼此之间不相关。(,)0iiCovuX若解释变量Xi和ui相关,则OLS估计量是非一致的,也就是即使当样本容量很大时,OLS估计量也不会接近回归系数的真值。造成误差项与回归变量相关(内生性)的原因很多,但我们主要考虑如下几个方面:遗漏变量变量变量有测量误差双向因果关系。遗漏变量偏差可采用在多元回归中加入遗漏变量的方法加以解决,但前提是只有当你有遗漏变量数据时上述方法才可行。双向因果关系偏差是指如果有时因果关系是从X到Y又从Y到X时,此时仅用多元回归无法消除这一偏差。同样,变量有测量误差也无法用我们前面学过的方法解决。因此我们就必须寻找一种新的方法。工具变量(instrumentalvariable,IV)回归是当回归变量X与误差项u相关时获得总体回归方程未知系数一致估计量的一般方法。我们经常称其为IV估计。其基本思想是:假设方程是:我们假设ui与Xi相关,则OLS估计量一定是有偏的和非一致的。工具变量估计是利用另一个“工具”变量Z将Xi分离成与ui相关和不相关的两部分。在经济学中:(1)内生变量:由模型内的变量所决定的变量称作内生变量。(2)外生变量:由模型外的变量所决定的变量称作外生变量。重要概念:内生变量和外生变量在计量经济学中,把所有与扰动项相关的解释变量都称为“内生变量”。这与一般经济学理论中的定义有所不同。1。与误差项相关的变量称为内生变量(endogenousvariable)。2。与误差项不相关的变量称为外生变量(exogenousvariable)。我们的工作就是要寻找相应的工具变量将解释变量分解成内生变量和外生变量,然后利用两阶段最小二乘法(TSLS)进行估计。一个例子:考虑货币政策对宏观经济的影响。由于货币政策的制定者会根据宏观经济的运行情况来调整货币政策,故货币政策是个内生变量(双向因果关系)。Romer(2004)通过阅读历史文献将货币政策的变动分解为“内生”(对经济的反应)与“外生”(货币当局的自主调整)的两部分。工具变量的选取一个有效的工具变量必须满足称为工具变量相关性和工具变量外生性两个条件:即(1)工具变量相关性:工具变量与所替代的随机解释变量高度相关;(2)工具变量外生性:工具变量与随机误差项不相关;(,)0iCovZiX(,)0iiCovuZ两阶段最小二乘估计量若工具变量Z满足工具变量相关性和外生性的条件,则可用称为两阶段最小二乘(TSLS)的IV估计量估计系数ß1。两阶段最小二乘估计量分两阶段计算:第一阶段把X分解成两部分:即与回归误差项相关的一部分以及与误差项无关的一部分。第二阶段是利用与误差项无关的那部分进行估计。具体来说:第一阶段:将X分解成与X高度相关的外生变量Z以及与干扰项ui相关的部分vi。工具变量回归谁开创了工具变量回归?1928年的著作的“TheTariffonAnimalandVegetableOils”的附录B。作者是谁?PhilipWright还是他的儿子SewallWright文体计量学的分析为什么IV回归是有效的?例1:PhilipWright的问题PhilipWright关心的是那个时期的一个重要经济问题:即如何对诸如黄油,大豆油这样的动植物油和食用动物设置进口关税。在20世纪20年代,进口关税是美国主要的税收收入来源。而理解关税的经济效应的关键在于要有商品需求和供给曲线的定量估计。由前知供给弹性为价格上涨1%引起的供给量变化的百分率,而需求弹性为价格上涨1%引起的需求量的百分率变化。例如具休考虑黄油的需求弹性估计问题:根据11个均衡样本点估计的方程究竟是需求函数还是供给函数?两者都不是。由于这些点是由需求和供给两者的变化确定的,因此用OLS拟合这些点的直线既不是需求曲线也不是供给曲线的估计。利用这些样本点估计出来的OLS拟合线是需求曲线还是供给曲线,都不是!两个极端的情况如图:因此,由于这些点是由需求和供给两者的变化确定的,因此用OLS拟合这些点的直线既不是需求曲线也不是供给曲线的估计。Wright的解决办法:1。找到第三个变量,这个变量影响供给但不影响需求。这样,所有的均衡价格和均衡量对都落在这条稳定的需求曲线上,此时很容易估计出它的斜率。2。可见,这第三个变量,也就是工具变量,它与价格相关(它使供给曲线移动,于是导致价格发生变化),但与u无关(需求曲线保持不变)。3。Wright考虑了几个可能的工具变量;其中一个是天气。例如,某牧场的降雨量低于平均值会使牧草减少从而减少给定价格时黄油的产量(会使供给曲线向左移动而使均衡价格上升),因此牧场地区降雨量满足工具变量相关性的条件。但牧场地区降雨量对黄油的需求没有直接影响,因此牧场地区降雨量与ui的相关系数为零;也就是牧场地区降雨量满足工具变量外生性条件。上图表明若某个变量使供给曲线移动而使需求保待不变时会发生什么样的情况。现在所有的均衡价格和均衡量对都落在这条稳定的需求曲线例2:班级模型对测试成缓的效应估计尽管控制了学生和地区特征,但由于受诸如校外学习机会或教师质量等不可测变量的影响,第二篇中给出的班级规模对测试成绩的效应估计中仍然可能存在着遗漏变量偏差。若这些变量的数据不可得,则不能通过在多元回归中加入这些变量的方法来处理遗漏变量偏差。工具变量回归提供了解决这一问题的一种思路。考虑下面的假想例子:由于夏天发生了地震,为了进行灾后修复工作,必须关闭某些加利福尼亚州的学校。而最靠近震中的地区受到的影响最严重。于是有学校关闭的地区需要把学生“挤在一起”,因此暂时扩大了班级规模。这意味着到震中的距离与班级规模相关,故它满足工具变最相关性的条件但如果到震中的距离与其他影响学生成绩的因素无关(如学生是否还在学习英语),则由于它与误差项无关因此是外生的。于是到震中的距离这个工具变量可以用来避免遗漏变量偏差和估计班级规模对测试成绩的效应。TSLS估计量的抽样分布为了简单起见,我们仅考虑只有一个回归变量X和一个工具变量Z的情况。即,参数的TSLS估计量为Z和Y的样本协方差与Z和X的样本协方差之比。假设原方程为:即总体系数为Z和Y的总体协方差与Z和X的总体协方差之比。在香烟需求中的应用为了减少由于吸烟导致的疾病和死亡,以及这些生病的人对社会其他成员产生的成本或外部性,一种方法是对香烟征收重税从而减少吸烟同时阻止潜在的新吸烟者。但具体需要增加多大幅度的税收来削减香烟的消费呢?例如,若要使香烟消费减少20%则香烟的税后售价应该是多少?若需求弹性为-1,使价格上涨20%就能达到减少20%消费量的目标。若弹性为-0.5,则价格必须上涨40%才能使消费下降20%。同philipWright对黄油的研究一样。我们无法通过数量对数关于价格对数的OLS回归得到香烟需求弹性的一致估计。我们利用TSLS和1985-1995年美国48个大陆州的年度数据估计了香烟的需求弹性。模型假定:被解释变量:香烟消费,即为州内每人购买的香烟包数。内生解释变量:包含所有税收的每包香烟的实际平均价格。工具变量:由一般销售税征收的香烟税收。这个工具变量设定是否合理?工具变量的相关性:由于高销售税增加了总的销售价格,因此每包香烟的销售税满足工具变量相关性的条件。工具变量的外生性:若销售税是外生的,则必须与需求方程中的误差无关;即销售税必然只是通过价格间接影响香烟的需求。这看上去是合理的:主要是因为不同州选择了不同的销售额、收入、财产和其他公共财政事业的混合税收,所以不同州的一般销售税是不同的。其中关于公共财政的选择受到政治考量的驱使而不是受香烟需求有关的因素影响。结论:这种工具变量的设置方法是合理的。因此我们利用两阶段最小二乘法(TSLS):第一阶段结果:第二阶段结果:32香烟需求(续)现在,只用1995年的数据.第一阶段OLS回归:ln()cigarettesiP=4.63+.031SalesTaxi,n=48第二阶段OLS回归:ln()cigarettesiQ=9.72–1.08ln()cigarettesiP,n=48具有正确异方差稳健标准误差的两个回归结合的结果为:ln()cigarettesiQ=9.72–1.08ln()cigarettesiP,n=48(1.53)(0.32)33STATA实例:香烟需求,第一阶段工具=Z=rtaxso=一般销售税(实际$/pack)XZ.reglravgprsrtaxsoifyear==1995,r;RegressionwithrobuststandarderrorsNumberofobs=48F(1,46)=40.39ProbF=0.0000R-squared=0.4710RootMSE=.09394------------------------------------------------------------------------------|Robustlravgprs|Coef.Std.Err.tP|t|[95%Conf.Interval]-------------+----------------------------------------------------------------rtaxso|.0307289.00483546.350.000.0209956.0404621_cons|4.616546.0289177159.640.0004.5583384.674755------------------------------------------------------------------------------X-hat.predictlravphat;现在我们有了来自1st阶段的预测值34第二阶段YX-hat.reglpackpclravphatifyear==1995,r;RegressionwithrobuststandarderrorsNumberofobs=48F(1,46)=10.54ProbF=0.0022R-squared=0.1525RootMSE=.22645------------------------------------------------------------------------------|Robustlpackpc|Coef.Std.Err.tP|t|[95%Conf.Interval]-------------+----------------------------------------------------------------lravphat|-1.083586.3336949-3.250.002-1.755279-.4118932_cons|9.7198751.5971196.090.0006.50504212.93471------------------------------------------------------------------------------这些系数是TSLS估计值标准误差是错误的,因为它们忽略了第一阶段是估计的事实35结合到一个命令中YXZ.ivreglpackpc(lravgprs=rtaxso)ifyear==1995,r;IV(2SLS)regressionwithrobuststandarderrorsNumberofobs=48F(1,46)=11.54ProbF=0.0014R-squared=0.4011RootMSE=.19035------------------------------------------------------------------------------|Robustlpackpc|Coef.Std.Err.tP|t|[95%Conf.Interval]-------------+----------------------------------------------------------------lravgprs|-1.083587.31891
本文标题:工具变量回归
链接地址:https://www.777doc.com/doc-5115286 .html