您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > RD方法(regression-discontinuity-design)
RD方法(regressiondiscontinuitydesign)什么是regressiondiscontinuitydesign?下面将用一篇文章来介绍:如何理解「由于使用燃煤取暖,中国5亿北方居民预期寿命将缩短5.5年」?7月8日发表在《美国国家科学院院刊》(PNAS)的一篇论文,向已经逐渐意识到空气污染危害的中国民众再次展现了残酷的现实:以淮河为界,烧煤供暖的中国北方地区空气污染水平高于中国南方,北方5亿居民因严重的空气污染,平均每人失去5年寿命。这篇文章由清华大学的李宏彬、北京大学的陈玉宇和另外两位作者共同完成。前两位完成了这篇论文的主要部分。这个回答首先介绍他们的研究方法,再谈一谈研究者和媒体对这篇文章的引申。科学家如何得出「使用燃煤取暖中国5亿北方居民预期寿命将缩短5.5年」这个结论的?首先要说的是这篇文章使用的RD方法(regressiondiscontinuitydesign),即断点回归方法。断点回归方法是最近的政策评估中非常重要的一个方法,他可以在没有随机性的情况下识别出政策的效果。在早期的研究中,要识别一个处理(Treatment)的效果,我们必须拥有随机性,比如两组随机分开的小白鼠,一组加上某种处理,一组没有处理,最后观察两者的区别。为什么我们那么需要随机性呢?因为研究的基础需要几组十分类似的群体,他们的任何特征都服从一个相同的分布,无论是性别、年龄、教育、健康程度……这样,我们才能确定几组对象之间出现的差别是来自于实验处理的差异,而非某些个人特征。从一个大样本中严格随机抽取的样本,正好满足这样的同分布假设。但对于政策研究来说,我们不可能找到这样随机分开的两组人,而且也无法用实验的方法来获得结果——你能将随机分开的100人放在干净空气中,将另外100人放在肮脏空气中并观察一段时间吗?一些研究者面对这种缺乏随机性的情况,采用了增加控制变量的方式。比如,把性别年龄教育健康程度全部放进回归式中,然后声称,两组人之间由于性别年龄教育健康的不同而造成的差别都已经去掉了,剩下的就是这个政策的效果了。可是,这很容易遭到批评,而且是没完没了的批评。为什么不控制工资高低?婚姻状况?从事行业?只要没有随机分开,任何特征变量的差异造成的结果,都可能混淆在政策结果中,你不控制这个变量,政策的效果就仍然没有识别干净。遭到批评的研究者只能继续加变量,没完没了的加变量。更关键的是,前面说的还是可以量化的东西,努力程度?性格特征?甚至,智商?这些不可观测的变量可能影响更大。举一个例子,科学家想知道上了“一本”大学对学生未来的工资有什么影响。上了一本和没上一本的大学生,显然不是随机分开的两个群体。当然也没法用控制变量的方法来消除“一本”之外的影响,因为肯定有一些不可观测的变量是你控制不了的。控制变量法至此完败。但科学家并没有束手无策,他们找到了RD方法。所谓RD方法,就是观察那些在一本线上下2分的学生,看“上一本”和“没上一本”的学生的未来工资差异。这个想法的天才之处在于,高考的上下5分,实在是一件随机性非常大的事情。让这批学生重新考一次,不少学生的情况可能就要逆转。对于这5分区间内的学生来说,一条一本线,就像一个天然的分割线,将两组人随机分开了。退一步说,即使我们将高考视为一项没有随机性的考试,RD方法还有另外一个假设——连续性假设。那些刚好上了一本的学生,比起差几分没上一本的学生,可能要聪明一点;也可能家庭环境好一点,请了好一点的家庭教师;也可能更努力一些,多做了几道习题。但注意,如果我们将智商、努力程度、家庭环境等等变量都视为连续的变量,那么上了一本的学生,比起没上一本的,也只是多了那么“一点点”。于是,我们可以开始观察这批学生的工资了。RD方法的所有目光,都聚焦在了那个“间断点”上。首先看一本线下1分的学生,和线下2分的学生,线上2分的学生和线上1分的学生,是否有工资差别?直观上想,可能没有,可能前者比后者高10块,这说明在没有其他显著差别时,各种连续变量产出的工资,也应该是一个连续变量。但我们再看线上0分的学生,和线下1分的学生时,显著的工资差异出现了,乖乖,差1000块。线上0分的学生,和线下1分的学生,各种特征都应该是差不多的,即便有差别,在连续性假设下也应该是很小很小的差别,那么产生这样显著的工资差异,只能由前者上了一本,而后者没上一本来解释了,因为这是两者间唯一的区别。于是,科学家们说,“上一本”这个事情,可以增加大学生大约1000元工资。我们回到这篇论文上,作者正是观察到了这样一条天然的分割线:淮河以北地区,政府提供了暖气,用烧煤的方式进行,而淮河以南则没有。那么,淮河两岸十分接近的两个地区,理论上来说也应该服从这样的“连续性”假设,也就是各种变量都差不多,唯一的区别就是有没有烧煤。于是作者发现,由于烧煤,淮河以北的空气总悬浮物比淮河以南多了而空气污染造成的结果,淮河两岸的人均寿命差异则是惊人的5年。同时,不考虑空气污染,用其他变量预测出来的人均寿命则几乎没有差别。这说明了连续性假设是成立的,淮河两岸的两个十分接近的地区几乎拥有相同的特征。作者还发现,淮河以北的超额死亡率,正是由和空气污染相关的心肺疾病相关,并进而与空气总悬浮物相关,而与谋杀、自杀等因素无关。至此,作者终于给出结论:烧煤将使空气总悬浮物大幅度上升,并使中国北方地区的居民人均寿命降低5年。RegressionDiscontinuityDesign的局限性「由于使用燃煤取暖,中国5亿北方居民预期寿命将缩短5.5年」这个结论有什么问题?如果看完上面那段,你感到心服口服,感叹科学家真聪明,RD方法真奇妙,进而相信了这个结论,那……你可能不是从事学术工作的。这项研究主要存在以下三个问题。第一个问题:连续性假设是否对所有变量都成立?淮河分界线两边的城市,真的在所有变量上都是连续的吗?作者在Figure4中控制了许多变量,并验证他们都是连续的,但那些没有控制的变量呢?我们可能可以说说高考差5分的学生没有什么显著差别,但一条河流两旁的城市,我们就很难说他没有显著差别。由于河流两侧的流速不同,地势不同,我们常常能发现一条河两侧的气候特征相差较大,甚至作物种植不同,这些都会导致死亡率的差异,也有可能造成空气总悬浮物的不同,而且他们都没有被控制在作者的图中。也就是说,淮河这个间断点,在识别烧煤取暖对空气污染以及死亡率的作用上,还不够干净。第二个问题:无法消除的自选择性还是从“一本和工资”的故事开始讲。科学家们虽然能研究一本线上的学生和线下1分学生的工资差异,可却忘记了一个问题:可能有好些刚好越过一本线的学生,并不是因为他考上了一本,而是他老爹有一些手腕,买通了官员,将他儿子的分数改了。而且,又不好太张扬,于是,就改一个躺在一本线上的分数。所以,他们的工资差异,还有一部分来自那些躺在一本线上学生的“有手腕的老爹”。对于这一项研究来说,所谓的自选择,就是迁移。一些在淮河以北的居民可能发现,淮河以北空气太差,他还是搬到淮河以南吧。而另一些淮河以南的居民感到没有暖气太冷,于是他选择搬到淮河以北。于是,搬到淮河以南的人,更注重自身健康;搬到淮河以北的人,由于体弱而怕冷。如此,两岸居民的分布就出现了差异,其寿命差异,有一部分就来自这些不可观测的自选择效应。第三个问题:小范围的有效性回到上一本和工资的那个例子上。“科学家们说,“上一本”这个事情,可以增加大学生大约1000元工资。”这句话,就有问题。你最多只能说:一本线上2分的学生,能因为上一本这个事情,增加约1000元的工资。举一个极端的例子,一个因为家庭情况不允许复读,而且本来可以超过一本线100多分,甚至可以上清华北大的学生,却因为试卷丢失而少了一门成绩,从而没上成一本。对他来说,“上一本”这个事情,可能就不止1000元工资的差异了。这个例子的意思是,RD方法得出的结论,仅仅在他所研究的那个小范围内有效。超出这个范围太多,就没有那么有效了。同样的,我们可以说“淮河以北,且紧邻淮河的地区,因为烧煤取暖导致的空气总悬浮物增加,损失了5.5年的寿命”。但将结论推到北方所有地区,就有问题。比如,也许从淮河向北,人们拥有一个随纬度升高而逐渐上升的“空气总悬浮物耐受能力”,但科学家却无法观察到这点,“5.5年寿命差异”的外推便失效了。鉴于以上三个缺点,烧煤取暖到5.5年寿命差异这个逻辑链条,我们都不能够完全相信。更别说将这个寿命差异推广到整个北方地区了。当然,我们也不能矫枉过正,全盘否定这项研究的意义。这一项研究的重要意义在于:1,消除了无休止的口水仗,识别了空气污染和健康之间的因果关系。要知道在使用RD方法之前,“空气污染有害论”者还在不停地增加控制变量,“空气污染无害论”者还在argue不可观测的健康特征呢。2,虽然有上述提到的几个问题,但他们的数据选取让我相信这几个问题都不是特别严重,我们大致可以下定论,淮河以北十分接近的几个城市,由空气污染所导致的寿命减少大致是5年左右。这是一个十分醒目的结果,会引起一批人的重视。3,上一点私货。鉴于两位主要作者都是经济学家,这个研究,是经济学帝国主义的又一次扩张。以后,在这样的自然科学刊物上,来自经济学家的贡献可能会越来越多。因为经济学最关注的就是因果识别,经济学的好些识别方法,早就溢出到了社会科学的其他领域,也正在逐渐蔓延到一些和政策相关的自然科学领域。前阵子的人类学家大战经济学家事件也只是经济学帝国主义的一个缩影,作为经济学研究人员,我感到十分高兴。在因果关系分析的实证方法中,最优的选择应当为随机实验,但是随机实验的时间成本和经济成本都比较高,而在随机实验不可得的情况下,需要考虑使用其它方法。断点回归(RegressionDiscontinuity):是仅次于随机实验的,能够有效利用现实约束条件分析变量之间因果关系的实证方法。在使用断点回归的情况下,存在一个变量,如果该变量大于一个临界值时,个体接受处置,而在该变量小于临界值时,个体不接受处置。一般而言,个体在接受处置的情况下,无法观测到其没有接受处置的情况,而在断点回归中,小于临界值的个体可以作为一个很好的可控组(ControlGroup)来反映个体没有接受处置时的情况,尤其是在变量连续的情况下,临界值附近样本的差别可以很好的反映处置和经济变量之间的因果联系。断点回归可以分为两类,第一类,临界值是确定的(Sharp),即在临界值一侧的所有的观测点都接受了处置,反之,在临界值另一侧的所有观测点都没有接受处置。此时,接受处置的概率从临界值一侧的0跳转到另一侧的1;第二类,临界点是模糊的(Fussy),即在临界值附近,接受处置的概率是单调变化的。Hahnetal.(2001)在一定的假设下,证明了无论是哪一类型的断点回归,都可以利用临界值附近样本的系统性变化来研究处置和其它经济变量之间的因果关系。
本文标题:RD方法(regression-discontinuity-design)
链接地址:https://www.777doc.com/doc-6770031 .html