您好,欢迎访问三七文档
PSM—DID及其应用1、介绍PSM-DID方法2、分析论文——西部大开发是增长驱动还是政策陷阱3、stata操作过程双重差分法•双重差分(differenceindifferences,DID)嘛,就是差分两次。•一种专门用于分析政策效果的计量方法。•将制度变迁和新政策视为一次外生于经济系统的“自然实验”的研究方法。•将两个虚拟变量及其交乘项增加进回归方程。•不是直接对比样本在政策前后的均值变化,而是使用个体数据进行回归,判断政策的影响是否具有显著的统计意义。•基本假设:随机分组、随机事件、对照组不受影响、样本同质性和实验处理的唯一性。倾向得分匹配法•倾向得分匹配法(propensityscorematching,PSM)是一种研究方法,比如需要研究某个劳动者接受某种高等教育对其收入的影响,或者研究某个企业运用了某项管理层激励措施以后对企业业绩的影响。•如果我们简单地将是否执行了某项事件作为虚拟变量,而对总体进行回归的话,参数估计就会产生偏误,因为在这样的情况下,我们只观察到了某一个对象他因为发生了某一事件后产生的表现,并且拿这种表现去和另一些没有发生这件事情的其他对象去做比较。这样的比较显然是不科学的,因为比较的基础并不同。修建铁路对沿线城市经济的影响•现在要修一条铁路,铁路是条线,所以必然会有穿过的城市和没有被穿过的城市;•如果城市i被穿过,记Di=1否则,Di=0;•现在我们比较好奇铁路修好以后,对铁路穿过的城市的经济增长有什么影响?我们该怎么做呢?•把Di=1的城市的GDP加总,减去Di=0的城市的GDP加总,然后两者一减,即E(Yi|Di=1)-E(Yi|Di=0),这样我们就算出了两类城市的GDP的平均之差。万一铁路穿过的城市在建铁路之前GDP就高呢?•把铁路穿过的城市分为两个时期,修建铁路前和修建铁路后,记为Ti=0和Ti=1,分别求出两个时期的GDP,然后两者一减,即E(Yi|Ti=1)-E(Yi|Ti=0),这样我们就算出了铁路沿线城市的GDP增长。问题是就算不修铁路,穿过的这些城市,经济该增长还是会增长的!!!修建铁路对沿线城市经济的影响•为了解决以上问题,我们需要观察到至少两期,第一期是建铁路之前,T=0;第二期是建铁路之后,T=1。•设穿过Di=1,否则Di=0。•两次差分,(1)先求出在修建铁路前后每一个城市的GDP增长率,•(2)求处理效应:10iiiYYY1211(1)(0)iiiiYYDYDNN修建铁路对城市经济的促进作用修建铁路对沿线城市经济的影响•可以换一个写法•T=1,建铁路之后•T=0,建铁路之前•Treated代表在某一期,某一类城市是不是建了铁路。第零期肯定没有建铁路,第一期只有Di=1的城市建了铁路。基本模型为:•对时间差分:•再次差分:•所以实际做的时候,可以直接跑这个式子的回归,得到的交乘项的系数就是所要估计的处理效应。01234()itiiititYββDβTβDTβXε23iiitYββDε3itYβε修建铁路对沿线城市经济的影响用一个图表示这里DID最关键的假设是trend,也就是两个组别在不处理的情况下,y的趋势是一样的。一个学生读研对自己工资水平的影响•如果拿小明来说,小明读了研究生和小明没有读研究生,他的收入会差多少?可是小明已经读了研究生,我怎么才能估计出他要是不读研究生,他的收入会是多少呢?•于是,我们引入“倾向得分匹配”这样一种研究方法。这种方法能让我们从一大堆没有读研究生的人群中(总体样本的一个子集),对每个人读研究生的概率进行估计,然后选出和小明具有非常相似的去读研究生的概率,可是没有去读的同学小刚——作为小明的对照,然后再来看他们的区别。当样本中的每个研究生“小明”(赵小明、司马小明、石小明…)都找到了匹配的非研究生“小刚”(李小刚、王小刚…),我们便能对这两组样本进行比较研究了。一个学生读研对自己工资水平的影响•第一步,我们要对总体样本执行probit或者logit回归,然后估计出每一个观测对象读研究生的概率是多少。以probit检验为例,在stata中,执行以下命令:•probit[dependentvar][independentvar]•其中,[dependentvar]是一个0或1的二进制变量,1代表该对象读了研究生,否则是0。•对每一个观测值,我们根据估计出来的probit模型,算出他读研究生的概率是多少。Stata中,执行如下命令:•predictpscore,p•其中,pscore是定义的记录每个观测对象概率的变量名称。一个学生读研对自己工资水平的影响•使用psmatch2命令,让Stata帮你对于每个读了研究生的观测对象,找出一个与之具有最接近的概率值的,可是没有读研究生的观测对象:•psmatch2[dependentvar],pscore(pscore)noreplacement•其中,(pscore)是在第二步中生成的那个记录对象概率的变量,noreplacement是一个选项,使得任何读了研究生的观察对象的对照对象都具有唯一性,只能1对1匹配。•Stata会在你的数据中自动添加几个变量,其中_id是自动生成的每一个观测对象唯一的ID;_treated表示某个对象是否读了研究生,如果读了,_n表示的是他被匹配到的对照对象的_id;_pdif表示一组匹配了的观察对象他们概率值的差。参考文献:PropensityscorematchingHelpforpsmatch2西部大开发:增长驱动还是政策陷阱•论文内容1、问题提出2、政策效果理论分析3、模型和估计方法4、数据、变量与描述性统计5、评价结果与稳健性检验6、结论问题提出•(1)虽然西部地区经济社会发展有所好转,但东西部地区经济差距持续扩大。•(2)已有文献关于西部大开发对地区经济增长的作用效果存在争议。•(3)已有研究通过直接对比西部大开发前后的地区经济绩效来做出判断。•(4)客观地评价西部大开发战略的实施效果,不仅对于西部大开发战略本身的实施和完善具有重要意义,而且能够形成对于其他区域发展战略政策效果的理论分析•西部大开发,既带来了增长驱动效应,又带来了政策陷阱效应。增长驱动效应•西部地区经济增长率和实际人均GDP增长率自2000年开始逐渐赶上并超过东部地区,地区TFP增长率也明显高于东中部地区。•但不能就此认为西部大开发取得了显著绩效。(1)基数小,增长快(一张白纸可以画出更美丽的画卷)(2)税收优惠政策对西部地区的增长具有促进作用,效果将越来越微弱;(3)西部地区与发达地区之间的区域差距仍在继续扩大。政策陷阱效应•优惠政策构成了西部地区经济增长的驱动力,但其增长对能源、资源开发的依赖度很高;由于体制弊端和配套政策缺失,会造成地方政府的短视行为,容易忽视人才和技术要素,弱化社会制度和软环境构建。•挤出制度变革、科技创新和人力资本投入等长期经济增长驱动因素,对西部地区长期经济增长产生不利影响,最终使得西部大开发的政策优惠演变为政策陷阱。模型和估计方法•政策评价,所用模型PSM-DID方法•四川、重庆、云南、贵州、西藏、陕西、甘肃、宁夏、青海、新疆、内蒙古、广西12个省份为实验组,其余为对照组。•进一步将1994-2012年中国283个地级市划分为4组子样本,即西部大开发之前的处理组、西部大开发之后的处理组、西部大开发之前的控制组和西部大开发之后的控制组。•du=1代表西部地区的地级市,du=0代表其他地区的地级市,dt=0代表西部大开发之前的年份,dt=1代表西部大开发之后的年份。•下标i和t分别代表第i个地级市和第t年,Z代表一系列控制变量,e为随机扰动项,被解释变量Y度量经济增长,具体指标包括人均实际GDP和实际GDP的对数值。模型和估计方法•运用Logit回归估计倾向得分;•计算西部大开发每个地级市的结果变量在政策前后的变化,对于西部大开发的每个地级市i,计算与其匹配的全部非西部大开发地级市在大开发前后的变化;•将西部大开发地级市在大开发前后的变化减去匹配后非西部大开发地级市的变化,得到大开发政策的平均处理效应(ATT),可以有效度量西部大开发对西部省份地级市的实际影响。数据、变量与描述性统计数据来源:《中国城市统计年鉴》、《各省年鉴》被解释变量控制变量数据、变量与描述性统计评价结果与稳健性检验•作为中国改革开放以来最大的区域经济发展战略,西部大开发提供了一个准自然实验,运用DID方法来评估西部大开发对西部地区经济增长的净效应。评价结果与稳健性检验•考虑到西部大开发对西部地区经济增长的推动作用可能随着时间推移逐渐显现,对西部大开发政策是否存在动态效应进评价结果与稳健性检验•为了克服西部地区与其他地区经济增长的变动趋势存在的系统性差异,降低DID估计的偏误,采用PSM-DID方法进行稳健性检验。•运用PSM-DID方法时,通过westdevelop对控制变量进行Logit回归,获得倾向得分•Westdevelop是被解释变量,FDI、FAR、saw和edu是解释变量。•运用核匹配(KernelMatching)进行估计,对西部大开发推动地区经济增长的作用进行稳健性检验。评价结果与稳健性检验•西部大开发并未推动西部地区快速增长。•是什么因素导致了西部大开发的政策效应没有得到应有发挥?•分别以FDI、FAR等六个控制变量为被解释变量,以西部大开发为解释变量,进行回归。•除了能够扩大地区固定资产投资水平以外,西部大开发对于其他各类经济增长驱动要素的作用要么不明显,要么产生了挤出效应。
本文标题:PSM-DID分析
链接地址:https://www.777doc.com/doc-1537874 .html