您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 中国1985至2001年的收入分配
中国1985至2001年的收入分配XimingWuandJeffreyM.Perloff*译者个人信息:工商管理学院,产业经济学,马志雄摘要:我们通过利用公开可得的区间汇总统计数据,采用一种新方法来估计中国的收入分配。我们检验了从1985年到2001年农村、城市和全部的收入分配。我们直接显示了分配如何改变,同时检验不平衡的趋势。通过使用总体非平衡的跨期分解方法,我们认为农村和城市部门不平衡性的增加,以及不断拉大的城乡收入差距是过去二十年总体不平衡的重要原因。尽管如此,城乡差距在近年来愈演愈烈。我们同时显示,城市消费的不平衡性也应重视。一、前言根据分组的汇总性统计数据,并采用新方法估算收入分配,我们展示由于城乡地区增长不平衡以及日益扩大的城乡收入差距,中国从1985年到2001年收入不平衡性持续上升。我们发现中国快速的经济增长—自从20世纪80年代开始5倍的经济增长和4倍的人均收入增长—格外的偏好城市地区和富裕地区。我们同样显示,农村和城市收入分配沿着不同的路径演化,而这种差别显著影响不平衡性的总体水平。虽然一些文章已经指出在过去二十年中国收入不平衡性快速扩大,但由于缺乏持续可靠的跨期收入分配数据,它们都没有精确指出这种不平衡性有多大。中国政府只提供随机几个年份的基尼系数,采用不明确的数据来源、收入定义和方法,因此它的不平衡性计算不能随时间直接比较(Bramall,2001)。而且基尼系数只是反映了潜在收入分配的某些方面,大量的信息被丢弃。因为具有同样基尼系数值的两条洛伦兹曲线可能具有不同的形状,所以对比基尼系数(或其它汇总统计)的福利影响可能是模糊的。因此,我们不仅仅对整个收入分配进行可靠估算,而且报告了几个汇总统计指标。这篇文章有4个贡献。首先,当只能获得区间的而非整个分配过程的汇总统计数据,我们使用Wu和Perloff的新方法(即将出版)估算弹性收入分配函数。基于中国年度的全国住户调查,采用收入汇总统计数据,我们估算农村、城市以及全国范围1985-2001年每年的*2004年3月12日收稿,2005年2月10日同意发表。作者分别为TexasA&M大学,以及加州大学伯克利分校。感谢PeterLanjouw,ShaohuaChen和JamesGalbraith特别有益的评论,以及感谢国家统计局城市社会经济调查司住户调查主任YoujuanWang,为我们解释了中国城市调查的许多特点。XimingWu还要感谢加拿大社会科学和人类研究委员会的资金支持。收入分配。基于这些估算的收入分配数据,应用单一相容的数据来源、方法和定义集,我们最先提供了中国跨期可比较的收入不平衡性序列。其次,我们展示了农村、城市以及全国收入分配如何在不同时期的演化,而非仅仅展示一个任意选取的汇总统计如何变化,比如基尼系数。我们展示了农村和城市的收入分配沿着不同的路径演化。我们采用两条分配曲线交叠的简单新方法,交叠部分都属于两个密度函数的区域。第三,我们分解了中国城乡部门总体的不平衡性,探究随着时间收入增长、城乡收入差距和城市化的分配效应。我们说明在农村和城市内部不断增加的不平衡性、不断扩大的城乡收入差距以及城乡人口流动是总体不平衡性的原因。我们说明,不断拉大的城乡收入差距扮演着重要角色。在我们的样本期,城市化对城乡内部不平衡和城乡部门之间不平衡影响显著,但是这些影响是相互抵消的。第四,我们检验了城市地区消费的不平衡性。消费不平衡性是经济福利的一个可选指标。我们发现消费的不平衡性在中国同样急剧上升。第二部分讨论中国总体不平衡性增加的可能原因。第三部分描述可获得的数据。第四部分使用分组数据,介绍估算最大熵密度的方法。第五部分估算中国1985-2001年的收入分配和不平衡性。第六部分介绍总体不平衡性与城乡不平衡性的关系。第七部分介绍城市地区消费不平衡性测量。最后一部分总结研究、得出结论。二、不平衡性增长的原因已有文献(Khan&Riskin,1998;Gustafsson&Li,2001;Yang,1999;Li,2000;Meng,2003)认为收入不平衡在中国最近年份显著增加。KhanandRiskin(1998)和Li(2000)同样提供证据说明中国城乡收入存在差异和不同增长率。我们将提供证据说明中国整体不平衡的扩大是由于内部不平衡的加大,农村部门和城市部门内部的不平衡,以及这两者之间的不平衡,这些不平衡是由城乡部门之间平均收入水平差异引起的。库兹涅茨曲线假设和结构理论对比了将来不平衡的影响,而我们的解释是这两种流行解释的一般化。Kuznets(1953)强调了不同时期城乡之间不平衡在解释总体不平衡性演变的问题。他假设如果城乡之间不平衡大于每个部门内部不平衡性,那么最初总体不平衡将随着人们从低收入(农村)部门移向高收入(城市)部门加大。接着,当大部分人口稳定于高收入的城市部门,不平衡性将下降。这种在不平衡与收入水平之间转化的倒U型关系被称为库兹涅茨曲线。如果这种假设是正确的,发展中国家在城市化进程中不平衡性增加可能是一个过程,同时不平衡性将在城市化进程结束时减少。Chang(2002)认为“……这个问题的治疗方法是在短期内加速城市化进程,在长期内促进城市部门增长。但是,这种政策在短期内可能会进一步扩大可计算的收入差距。”尽管如此,中国城市部门不可能够吸收大量剩余的农村劳动力[根据Chang(2002)达1.5亿],所以中国可能将在一个长期内维持收入不平衡。基于同样前提的相似解释,认为城乡收入差距是总体不平衡性增加的动力,但由于长期人口结构和制度结构导致科兹涅茨所描述的调整不会在中国发生。根据这种解释,中国人口分属于农村和城市两个独立的经济体。某种程度上,来自农村地区的迁徙者可能在城市里找到工作,但中国严格的户籍制度常常阻止他们获得城市居民地位(同时获得城市居民所享有的社会福利、津贴和较高工资)。比如Yang(1999)利用1986年、1992年和1994年静态的内外部分析,认为城乡收入差异是引起中国总体不平衡增加的主要原因1。他认为城市偏向的政策和制度是长期城乡分割和近年来不平衡拉大的原因。如果迁徙障碍不变,不平衡性在未来不可能减少。这两个假设都强调了城乡差距是不断拉大的总体不平衡性的首要原因。这个因素当然部分解释了不断增加的不平衡性,但总体情况远为复杂。我们将展示证据说明,过去20年城乡之间和内部的不平衡性实际上增加了总体不平衡性。而且我们认为如果把城市化考虑进来,城乡之间和内部的不平衡性同等重要的影响了总体不平衡性(对比静态分析的传统结论,它认为城乡之间不平衡性是主要原因的)。三、数据我们依靠大量具有代表性的中国住户调查样本。中国国家统计局(NSB-正式为SSB)(实际应为NBS—译者注)每年在农村和城市地区开展大规模住户调查,该调查覆盖了30个省份,包括30000-40000个城市家庭和60000-70000个农村家庭。国家统计局采用分为两层的样本框,选取具有代表性的人口随机样本。每个家庭样本连续三年参与调查,记录收入和支出的记录。由于我们不能获取国家统计局所有地区和所有年份每个样本调查数据,我们只能采取公开可获得的汇总统计来估算农村和城市的收入分配。不幸的是,国家统计局并没有提供整个样本的汇总统计,而只是提供了各种收入区间。这种城市和农村地区的区间汇总统计公布于《中国统计年鉴》(以下简称年鉴)。年鉴将家庭收入定义为年度家庭人均可支配收入。我们1因为Yang的分析局限在两个省份和一个短期,他的结果与我们的结果不能直接比较。的样本覆盖1985-2001年,这个时期的年鉴提供了一致数据。年鉴有区别的汇总农村和城市地区收入分配。农村收入分配被划分为固定几个区间,收入区间上下限及其家庭分配都是明确的,它是总体分配的平均收入。年鉴1985-1994年间报告12个收入区间,而1996年是11个,1995年、1997-2001年是20个。而对城市地区来说,年鉴只报告了第0-5,第5-10,第10-20,第20-40,第40-60,第60-80,第80-90和第90-100等收入分配百分位点的条件均值,但没有收入区间的上下限。我们利用公开可获得的分组数据估算潜在的收入分配,并根据估算的收入分配进行不平衡推测。农村和城市收入都根据年鉴的相关消费价格指数(CPI)消除通货膨胀影响。四、分组数据的最大熵密度估算很多先前研究(比如Gastwirth&Glauberman,1976;Kakwani&Podder,1976;Chen,Ravallion,&Datt,1991)采用了分组数据估算不平衡性和贫困。这些文章集中估算洛伦兹曲线和相关的不平衡指数。相比之下,我们采用由Wu和Perloff(即将发表)发展了的传统最大熵密度方法,通过分组数据估算一般收入密度函数。在此情况下我们推测洛伦兹曲线和各种福利指数,并能够检验整个收入分配及其随时间变化的形状。最大熵密度(Jaynes,1957)原理是根据部分信息给概率分布赋值的一般方法。这种方法表述为,人们应该选择与给定约束一致的概率分布,并最大化Shannon的熵。传统上这种最大熵密度来自最大化的Shannon信息熵。整个分布范围服从于已知的K矩条件我们能够利用拉格拉日方法解决最优化问题,从而得出唯一的总体最大熵值(Zellner&Highfield,1988;Wu,2003)。这种方法的形式是这里λi是第i个力矩约束的拉格朗日乘数。这种最大化熵的方法等价于似然方程被定义为一致有效指数分布的最大似然法。从Golan,Judge和Miller(1996)的文章可明白这两种方法是对偶的。所有有名的分布都能描述为服从于简单矩约束的最大熵密度,我们下面将统称为特征矩。这些特征距足以统计指数化家庭,而整个分布可以汇总为特征距。当只公布分组汇总统计,我们可以通过联合分组信息作为部分距估算最大熵密度。假设一个确定的分布,我们只知道分组的M个区间汇总统计,并知道区间范围[l0,l1,…lM]和每个区间的J条件距其中vm,1是第m个区间的比重,并且1vM1mm,1。定义分布p(x)的第m个区间的第j个部分距为假如潜在的密度函数为,我们利用部分距条件2计算p(x)。将p(x)代进部分距条件,我们获得一个M×J方程组,每个方程构成矩阵matrix(1)的一个条目,我们能够通过迭代更新解决拉格朗日乘数问题其中。J矩阵(M×J)与M子矩阵G(m)(J×J)2一般的说,p(x)的方程形式未知,Wu和Perloff(即将出版)采用自助的KullbackLeibler信息标准讨论如何选取模型。一致被置于另一个的顶部。如下当区间范围不知道,估计过程就越复杂,因为我们不知道条件均值该在哪个范围被估计。比如,在年鉴里由于城市地区不同于农村地区,它只包含每个收入区间的比重和条件均值。距约束的形式就为这里区间范围lm()就是未知密度函数的方程p(x)。关于这个方法的更多细节可见Wu和Perloff(即将发表)的文章,在该文中我们采用quasi-Newton的方法结合密度函数,展示怎样去估算范围的区域。新方法使我们能够估算整个分布,然后计算任何感兴趣的分布特征。这种方法还有两个优点,首先它允许估计分组区间范围未知的分布,其次传统方法只考虑每个区间的人口比重和条件均值,相反,新方法能够容易的结合其它信息形式,比如每个区间基尼系数的变化。所以,尽管最大化熵的方法为信息缺乏而设计,但它能够适应各种形式的信息输入。因为我们不能得到与报告有关的中国分组信息的个别数据,不能够利用中国数据直接检验所提出新方法的效果。但是我们使用2000年美国人口调查(CPS)原始收入数据,证明所提出新方法的效果,这个补充可看附录以及Wu和Perloff(2003)的文章。使用模型选择描述的连续更新方法,根据自助的Kullback-Leible信息,我们发现具体形式p(x)=提供最好的总体适应。这种方法对美国的数据产生极好效果:这种适应实际上与能够获得整个样本的距条件十分接近。比如,给定8个区间但没有区间范围的人口比重和均值,估算分布得出0.413的基尼系数,而基于全部数据的基尼系数为0.
本文标题:中国1985至2001年的收入分配
链接地址:https://www.777doc.com/doc-1173161 .html