您好,欢迎访问三七文档
面板数据模型卢二坡2008.12.11第一节面板数据模型简介一、数据的类型Cross-sectional:observationsonanumberofagents/firmsinmomentintimeTimeseries:observationstakenatintervalsovertimePooledcross-section:randomlyselectedobservationstakenineachtimeperiodPaneldata:Observationsonsamecross-sectionofindividualsovertime例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。1.对于面板数据,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balancedpaneldata)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalancedpaneldata)。2.面板数据集一般更倾向于横截面分析,它们的横截面宽,而调查时期通常很短,不同调查单位之间的异质性(heterogenity)是分析的主要部分,通常也是核心关注点。ThePaneldatastructurenamecodeyeargdpsavpopAlbaniaALB19906.7517934320.97839931.6AlbaniaALB1991-11.4142038-13.0284996-0.2AlbaniaALB1992-27.5896031-75.4131012-1.6AlbaniaALB1993-5.69153612-33.6716003-1.4AlbaniaALB199411.1974627-9.882630350.2AlbaniaALB19959.1941036-3.947999951.2AlbaniaALB19967.55757392-11.81181.3AlbaniaALB19977.73893405-9.259129521.2AlbaniaALB1998-8.06352119-6.695859911.1AlbaniaALB1999-1.669100051.1AlgeriaDZA19902.2957591527.46669962.5AlgeriaDZA1991-3.7208467536.65620042.4AlgeriaDZA1992-3.5541433632.37559892.4AlgeriaDZA1993-0.7938422127.83849912.3AlgeriaDZA1994-4.3572313627.03599932.2AlgeriaDZA1995-3.3100752128.43339922.2AlgeriaDZA19961.5904086131.42300032.2AlgeriaDZA19971.5892154932.19850162.2AlgeriaDZA1998-1.0342944127.06690032.1AlgeriaDZA19991.4485795431.69120032.1Firstcross-sectionalunitTimedimensionmissingGeneralnotationYNTXN3TNYNtXNt…NY31XN11NYi3Xi3T…Yi2Xi2……Yi1Xi11…Y1TX1TT1Y1tX1t…1Y11X1111Variable2YitVariable1XitTime/wavetUnitnumberiNunitsintotalTwavesintotal对PanelData的分析是当前计量经济学文献中最有活力和创造性的主题之一。使用面板数据模型有着很多优点:(1)控制个体效应面板数据分析可以控制不可观测的地区特定效应和(或)时间特定效应,而普通的截面分析则不能,因而会得到有偏的结果;(2)减少多重共线性PanelData能够提供更多信息、更多变化性、更少共线性、更多自由度和更高效率。反观时间序列经常受多重共线性的困扰。并且当解释变量较多时,截面分析也会面临样本观测值太少以及严重的多重共线性问题;(3)PanelData能更好地识别和度量纯时间序列和纯横截面数据所不能发现的影响因素,并能在一定程度上减少遗漏重要解释变量偏差。。如使用企业数据研究规模效应和技术变迁。再如:使用面板数模据模型研究区域经济增长收敛(4)相对于纯横截面和纯时间序列数据而言,PanelData能够构造和检验更复杂的行为模型。如变系数模型,参见论文《短期波动对长期增长的效应》。二、面板数据模型特点:面板数据模型的局限性:(1)模型设定错误与数据收集不慎引起较大偏差。面板数据模型由两维的数据构成,如果模型设定或数据收集不正确,将造成较大偏差,使估计结果与实际相差甚远。(2)研究截面或平行数据时,由于样本非随机性造成观测值的偏差,从而导致模型选择上的偏差。例如:研究不同人的收入(y)随时间推移与教育程度(X)的关系,如果实际研过程中使用了L线下面的样本,就会造成由于利用了非随机样本而导致估计的偏移。yx实际线估计线L图1第二节一般面板数据模型介绍面板数据模型分析的基本框架是如下形式的回归模型:为异质性或个体效应,其中zi包含一个常数项和一系列个体或组别变量,比如可观测的各族、性别、居住地等,或者无法观测的家庭特征、个人在技能或偏好上的异性等,所有这些变量都不随时间而变化。如果所有个体的zi都可以观测到,那么整个模型可被视为一个普通线性模型,并且最小二乘法来拟合。面板模型可以考虑的各种情形有:1.混合回归(pooledregression):如果zi只包含了一个常数项,则普通最小二乘法为共同的截距项α和斜率β提供了一致而又有效的估计值。2.固定效应(fixedeffects):如果zi无法观测,但与xit相关,则作为遗漏变量的结果之一,β的最小二乘估计有偏且不一致。固定效应方法令,这个固定效应方法把视为回归模型中每组各自不同的常数项:注:这里使用“固定”一词,指的是这一项不随时间而变化,并不是说它是非随机的。3.随机效应(randomeffects):如果可以假定不可观测的个体异质性与所含变量无关,则模型可以表示为:这个模型可以最小二乘法一致(但非有效)估计一个线性回归模型,其干扰是一个混合干扰。这个随机效应方法规定是一个类似于的组别随机干扰,只不过对每一组,只取一个值,而且每期都不变的进入回归。随机效应模型与固定效应模型的关键区别是:观测不到的个体效应是否包含与模型回归元有关的因素,而不是这些效应是否随机。4.随机参数模型(randomparameters):随机效应模型可被视为一个包含随机常数项的回时模型。若有足够多丰富的数据集,可以把这种思想推广到其他系也随不同个体而随机变化的模型中去,推广后的模型为:其中:是使不同个体的参数有所不同的随机向量。第三节固定效应模型估计方法组内组内组组组内组内组组第四节随机效应模型及其估计方法注:随机效应模型或者写为:干扰项组内组内组组内组第四节模型的设定检验1.PooledOLSvs.Randomeffects2.PooledOlsvs.FixedEffects(F检验,见前)3.Hausman检验(RandomvsFixedeffectsmodel)第五节面板数据模型的stata实现例:我国29个地区1991~2003年居民消费(cs)和城镇人均可支配收入(yd)数据。年份:year(1991-2003)Identity:idStata8.0面板数据模型估计命令(helpxt.)Stata8.2命令:Xtreg…….,fe固定效应模型组内估计Xtreg…….,be固定效应模型组间估计Xtreg…….,re随机效应模型GLS估计Xtreg…….,mle随机效应模型极大似然估计Xi:xtreg….i.year,fe双向固定效应模型Xi:reg….i.id固定效应模型LSDV估计示例:tssetidyear;/*pooledolsvsrandomeffects*/;regcsyd;xtregcsyd,re;xttest0;/*BPtest*/;/*randomvsfixed*/;xtregcsyd,fe;xtregcsyd,re;xthausman;/*拒绝随机效应,应该采用固定效应*/;第六节动态面板数据模型Stata命令:Xtabond(自带)Xtabond2(需要从网络上下载)
本文标题:面板数据模型
链接地址:https://www.777doc.com/doc-3309302 .html