您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 面板数据模型与应用 张晓彤
1面板数据模型与应用张晓峒中国数量经济学会常务理事,学术委员会委员南开大学数量经济学专业博士生导师xttfyt@public.tpt.tj.cn,nkeviews@yahoo.com.cn最近新书:1.BadiH.Baltagi,EconometricAnalysisofPanelData,JohnWiley&Sons,2005.2.JeffreyM.Wooldridge,EconometricAnalysisofCrossSectionandPanelData,3.ChengHsiao,AnalysisofPanelData,CambridgeUniversityPress,2003.4.ManuelArellano,PanelDataEconometrics(AdvancedTextsinEconometrics),2003.5.EdwardW.Frees,LongitudinalandPanelData:AnalysisandApplicationsintheSocialSciences,2004.6.谢识予朱宏鑫编著,高级计量经济学,2005-57.童光荣,计量经济学,武汉大学出版社2006-3学术会议:1.13thInternationalConferenceonPanelData,FacultyofEconomics,&RobinsonCollege,UniversityofCambridge,Cambridge,UK,7-9July20061.面板数据定义paneldata的中译:面板数据、桌面数据、平行数据、纵列数据、时间序列截面数据、混合数据(pooldata)、固定调查对象数据。面板数据定义(1)面板数据定义为相同截面上的个体在不同时点的重复观测数据。(2)称为纵向变量序列(个体)的多次测量。2面板数据从横截面(crosssection)看,是由若干个体(entity,unit,individual)在某一时点构成的截面观测值,从纵剖面(longitudinalsection)看每个个体都是一个时间序列。图1N=7,T=50的面板数据示意图面板数据用双下标变量表示。例如yit,i=1,2,…,N;t=1,2,…,Ti对应面板数据中不同个体。N表示面板数据中含有N个个体。t对应面板数据中不同时点。T表示时间序列的最大长度。若固定t不变,yi.,(i=1,2,…,N)是横截面上的N个随机变量;若固定i不变,y.t,(t=1,2,…,T)是纵剖面上的一个时间序列(个体)。这里所讨论的面板数据主要指时期短而截面上包括的个体多的面板数据。3案例1(file:panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据见file:panel02。数据是7年的,每一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。人均消费和收入的面板数据从纵剖面观察分别见图2和图3。从横截面观察分别见图4和图5。横截面数据散点图的表现与观测值顺序有关。图4和图5中人均消费和收入观测值顺序是按地区名的汉语拼音字母顺序排序的。20004000600080001000012000140001996199719981999200020012002CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ20004000600080001000012000140001996199719981999200020012002IPAHIPBJIPFJIPHBIPHLJIPJLIPJSIPJXIPLNIPNMGIPSDIPSHIPSXIPTJIPZJ图215个省级地区的人均消费序列(纵剖面)图315个省级地区的人均收入序列(file:5panel02)20004000600080001000012000140002468101214CP1996CP1997CP1998CP1999CP2000CP2001CP200220004000600080001000012000140002468101214IP1996IP1997IP1998IP1999IP2000IP2001IP2002图47个时点人均消费横截面数据(含15个地区)图57个时点人均收入横截面数据(含15个地区)(每条连线数据表示同一年度15个地区的消费值)(每条连线数据表示同一年度15个地区的收入值)4用CP表示消费,IP表示收入。AH,BJ,FJ,HB,HLJ,JL,JS,JX,LN,NMG,SD,SH,SX,TJ,ZJ分别表示安徽省、北京市、福建省、河北省、黑龙江省、吉林省、江苏省、江西省、辽宁省、内蒙古自治区、山东省、上海市、山西省、天津市、浙江省。2000300040005000600070008000900010000110000400080001200016000IP(1996-2002)CPAHCPBJCPFJCPHBCPHLJCPJLCPJSCPJXCPLNCPNMGCPSDCPSHCPSXCPTJCPZJ图6人均消费对收入的面板数据散点图(15个时间序列叠加)200040006000800010000120002000400060008000100001200014000IP(1996-2002)CP1996CP1997CP1998CP1999CP2000CP2001CP2002图7人均消费对收入的面板数据散点图(7个截面叠加)图8北京和内蒙古1996-2002年消费对收入散点图图91996和2002年15个地区的消费对收入散点图52.面板数据模型分类用面板数据建立的模型通常有3种,即混合回归模型、固定效应回归模型和随机效应回归模型。2.1混合回归模型(Pooledmodel)。如果一个面板数据模型定义为,yit=+Xit'+it,i=1,2,…,N;t=1,2,…,T(1)其中yit为被回归变量(标量),表示截距项,Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,it为误差项(标量)。则称此模型为混合回归模型。混合回归模型的特点是无论对任何个体和截面,回归系数和都相同。如果模型是正确设定的,解释变量与误差项不相关,即Cov(Xit,it)=0。那么无论是N,还是T,模型参数的混合最小二乘估计量(PooledOLS)都是一致估计量。2.2固定效应回归模型(fixedeffectsregressionmodel)。固定效应模型分为3种类型,即个体固定效应回归模型、时点固定效应回归模型和个体时点双固定效应回归模型。下面分别介绍。2.2.1个体固定效应回归模型(entityfixedeffectsregressionmodel)如果一个面板数据模型定义为,yit=i+Xit'+it,i=1,2,…,N;t=1,2,…,T(3)其中i是随机变量,表示对于i个个体有i个不同的截距项,且其变化与Xit有关系;yit为被回归变量(标量),it为误差项(标量),Xit为k1阶回归变量列向量(包括k个回归量),为k1阶回归系数列向量,对于不同个体回归系数相同,则称此模型为个体固定效应回归模型。6i作为随机变量描述不同个体建立的模型间的差异。因为i是不可观测的,且与可观测的解释变量Xit的变化相联系,所以称(3)式为个体固定效应回归模型。个体固定效应回归模型也可以表示为yit=1+2D2+…+NDN+Xit'+it,t=1,2,…,T(4)其中Di=其他,,个个体如果属于第,...,,,021Nii,设定个体固定效应回归模型的原因如下。假定有面板数据模型yit=0+1xit+2zi+it,i=1,2,…,N;t=1,2,…,T(5)其中0为常数,不随时间、截面变化;zi表示随个体变化,但不随时间变化的难以观测的变量。上述模型可以被解释为含有N个截距,即每个个体都对应一个不同截距的模型。令i=0+2zi,于是(5)式变为yit=i+1xit+it,i=1,2,…,N;t=1,2,…,T(6)这正是个体固定效应回归模型形式。对于每个个体回归函数的斜率相同(都是1),截距i却因个体不同而变化。可见个体固定效应回归模型中的截距项i中包括了那些随个体变化,但不随时间变化的难以观测的变量的影响。i是一个随机变量。以案例1为例,省家庭平均人口数就是这样的一个变量。对于短期面板来说,这是一个基本不随时间变化的量,但是对于不同的省份,这个变量的值是不同的。以案例1为例(file:panel02)得到的个体固定效应模型估计结果如下:7注意:个体固定效应模型的EViwes输出结果中没有公共截距项。图10个体固定效应回归模型的估计结果2.2.2时点固定效应回归模型(timefixedeffectsregressionmodel)如果一个面板数据模型定义为,yit=t+Xit'+it,i=1,2,…,N(7)其中t是模型截距项,随机变量,表示对于T个截面有T个不同的截距项,且其变化与Xit有关系;yit为被回归变量(标量),it为误差项(标量),满足通常假定条件。Xit为k1阶回归变量列向量(包括k个回归变量),为k1阶回归系数列向量,则称此模型为时点固定效应回归模型。时点固定效应回归模型也可以加入虚拟变量表示为yit=1+2W2+…+TWT+Xit'+it,i=1,2,…,N;t=1,2,…,T(8)其中8Wt=。,个截面其他个截面)(,;,...,,ttTt不属于第如果属于第021设定时点固定效应回归模型的原因。假定有面板数据模型yit=0+1xit+2zt+it,i=1,2,…,N;t=1,2,…,T(9)其中0为常数,不随时间、截面变化;zt表示随不同截面(时点)变化,但不随个体变化的难以观测的变量。上述模型可以被解释为含有T个截距,即每个截面都对应一个不同截距的模型。令t=0+2zt,于是(9)式变为yit=t+1xit+it,i=1,2,…,N;t=1,2,…,T(10)这正是时点固定效应回归模型形式。对于每个截面,回归函数的斜率相同(都是1),t却因截面(时点)不同而异。可见时点固定效应回归模型中的截距项t包括了那些随不同截面(时点)变化,但不随个体变化的难以观测的变量的影响。t是一个随机变量。以案例1为例,“全国零售物价指数”就是这样的一个变量。对于不同时点,这是一个变化的量,但是对于不同省份(个体),这是一个不变化的量。9图112.2.3个体时点双固定效应回归模型(timeandentityfixedeffectsregressionmodel)如果一个面板数据模型定义为,yit=i+t+Xit'+it,i=1,2,…,N;t=1,2,…,T(11)其中yit为被回归变量(标量);i是随机变量,表示对于N个个体有N个不同的截距项,且其变化与Xit有关系;t是随机变量,表示对于T个截面(时点)有T个不同的截距项,且其变化与Xit有关系;Xit为k1阶回归变量列向量(包括k个回归量);为k1阶回归系数列向量;it为误差项(标量)满足通常假定(itXit,i,t)=0;则称此模型为个体时点固定效应回归模型。个体时点固定效应回归模型还可以表示为,yit=1+2D2+…+NDN+2W2+…+TWT+Xit'+it,t=1,2,…,(12)其中Di=其他,,个个体如果属于第,...,,,021Nii,(13)10Wt=。,个截面其他个截面)(,;,...,,ttTt不属于第如果属于第021(14)如果模型形式是正确设定的,并且满足模型通常的假定条件,对模型(12)进行混合OLS估计,全部参数估计量都是不一致的。正如个体固定效应回归模型可以得到一致的、甚至有效的估计量一样,一些计算方法
本文标题:面板数据模型与应用 张晓彤
链接地址:https://www.777doc.com/doc-5232535 .html