您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 面板数据回归(Panel Data)
面板数据分析(PanelDataAnalysis)2013年商学院暑期微观计量培训陈华帅2013年7月9日下午变量遗漏问题•被解释变量:y•解释变量:x•不可观察的效果:c•我们感兴趣的是:E(y∣x,c),不是E(y∣x)•假设:E(y∣x,c)=β₀+xβ+c–x与c无关,仍然可以得到β的无偏估计量–x与c相关,无法得到β的一致估计量解决办法•寻找c的代理变量p–p直接影响因变量y–当给定p时,c对y没有影响–p与随机扰动项无关•寻找一个IV–Z与c相关,但与随机扰动项无关•PanelData的方法–当遗漏变量不随时间而变化,如国家的初始技术效率,城市的历史,或个人的一些特征等–问题的解决得益于对同一个个体的重复观测一个简单的例子•yt,xt,t=1,2•c不随时间而改变,但是随个体变化而改变•考虑教育回报问题:yt=β0+βxt+c+ut•外生性假设:E(ut|xt,c)=0⇒E(xt’ut)=0•讨论:–如果E(xt’c)=0,则可以进行PooledOLS估计–如果:E(xt’c)≠0,则PooledOLS不一致•解决办法:一阶差分(时间上相减)△y=β△x+△u△c=0不见了•考察古典假设:–要求E(△x’△u)=0,即△x与△u不相关E(△x’△u)=E[(x2-x1)'(u2-u1)]=E(x2’u2)-E(x1’u2)-E(x2’u1)+E(x1’u1)=0-E(x1’u2)-E(x2’u1)则E(x1’u2)+E(x2’u1)=0–要求△x’△x满列秩,则没有一个△x=0,即每个x在t=1,2中随时间有变化什么是PanelData•定义–对固定单位、个人、企业、家庭或其他经济体重复观测所形成的数据–典型的Panel在时间上进行重复观察•跟踪同样的个体(如个人、家庭、企业、城市、国家等)而得到的跨时间数据•例–单位:i={1,2,⋯,N}–观察时点:t={1,2,⋯,Ti}•一般而言,N≫Ti是PanelData,Ti≫N是多元时间序列数据•如果Ti对于每个单位都相同,叫平衡面板(BalancedPanel)•如果Ti对于每个单位不都相同,叫不平衡面板(UnbalancedPanel)–对于非平衡面板数据,我们关心非平衡是否是内生的•比如,yit是收入,随着时间流逝富人更容易退出样本,因为他们的时间成本比较高,此时数据的非平衡就是内生引起的•此时,即使最初的模型是线性模型,yit的条件期望是xit的线性函数,我们需要非线性的样本选择方法更多例子•双胞胎数据yij–老大、老二:i={1,2}–不同的家庭:j={1,2,⋯,J}•教师的教学评估成绩yijt–不同的教师:i={1,2,⋯,N}–所授的课程:j={1,2,⋯,Ji}–不同学年:t={1,2,⋯,Ti}•都是对固定单位进行重复观察面板数据的优势•面板数据模型提供了更多的数据信息,增加了自由度,并减少了解释变量的共线性,从而得到更为有效的估计量•面板数据模型可以分析单纯截面数据和时间序列数据无法分析的重要经济问题•当遗漏变量是不随时间而变化的表示个体异质性的一些变量时,面板数据可以用来处理某些遗漏变量问题面板数据模型•广义的面板数据模型:随机参数模型–参数太多,不可估计–需要对αit,βt,uit进行更多的假设限定•静态面板数据模型vs.动态面板数据模型–如果xit不包含滞后因变量,上述模型为静态线性面板数据模型,否则就是动态线性面板数据模型=αit+xit'βt+uit,i=1,2,...,n,t=1,...,Tiyit•双向效应模型:引入个人和时间dummy•个人效应模型•固定效应与随机效应模型:ci是否和xit相关–固定效应:E(ci|xit)≠0–随机效应:E(ci|xit)=0•混合模型(总体均值模型)=αi+δt+xit'β+uityit=ci+xit'β+uityit=αi+xit'β+uityit=α+xit'β+uityit面板数据模型的假设•以未观测效应模型为例–ci+uit称为合成误差(compositeerror)–ci称为个体效应(individualeffect)、个体异质性(individualheterogeneity),或不可观测的异质性–uit是随时间和个体变化的特异性误差(idiosyncraticerror)=xit'β+ci+uityit•假设特异性误差uit和解释变量xit是不相关的–如果个体异质性ci和解释变量xit也不相关,则可以用混合最小二乘(pooledOLS,POLS)来得到一致估计–所谓的POLS方法,是指对所有跨i和t的观测值进行OLS回归,对模型进行POLS回归–但是个体异质性往往和解释变量相关,此时用POLS估计得到的估计量是有偏且不一致的,此偏差称为异质性偏差(heterogeneitybias),这是遗漏(不随时间变化的)变量引起的偏差严格外生性假设•假设–E(u∣x,ci)=0–即E(uit∣xi1,xi2,…,xis,…,xiT,ci)=0–等价于E(yit∣xi1,xi2,…,xis,…,xiT,ci)=xitβ+ci–可以得到E(xituis)=0•解释–当ci和xit被控制,对任意的s≠t,xis对yit没有偏效应(patialeffect),即解释变量给定条件ci下是严格外生的•严格外生性假设是一个比较强烈的假设•在严格外生性假设下,滞后因变量不能出现在解释变量中•严格外生性假设也禁止了t期随机扰动项uit对t+1期解释变量xit+1的影响•如果解释变量中包含有政策变量,而政策变量经常会对前期的冲击进行调整,即为冲击的反馈效应(feedbackeffect),此时uit和xit+1相关,严格外生性假设被违反面板数据模型的估计量•PooledOLS估计量:–前面介绍过–如果解释变量xit与ci和uit都不相关,POLS一致–但是方差的估计结果有问题•总的随机扰动项存在序列相关•Cov(ci+uit,ci+uit+1)≠0,且很高–如果固定效应面板模型是正确的话,POLS不一致•Cov(xit,ci)≠0=>Cov(xit,ci+uit+1)≠0•组间(between)估计量:–POLS运用时间和截面上的变化估计β–组间估计量运用不同个人间的变化估计β––如果与、ci不相关,则对上式的POLS估计一致–不是最有效的'iiiiycxuixiu•组内(within)估计量:–也称为固定效应(FE)估计量–POLS运用时间和截面上的变化估计β–组间估计量运用不同个人间的变化估计β–组内估计量运用同一个个人的变化估计β––无法识别时间固定的解释变量的影响()'()itiitiitiyyxxuu•一阶差分(FD)估计量:–面板数据模型滞后一期并相减得到:Δyit=Δxit'β+Δuit–对上式进行POLS估计–满足严格外生性假设时,FD估计量一致E(Δuit|Δxi2,Δxi3,...,ΔxiT)=0–当uit服从随机游走时(randomwalk),FD估计量最有效E(ΔuiΔui’|xi,αi)=σu2IT−1–在T=2而且平衡面板的条件下,FD估计量和FE估计量是一样的随机效应面板模型Random-EffectPanelModel•如果总体很大,抽取的样本单位具有较大的随机性,那么与个体有关的效应将被视为具有随机分布的性质idyearyx1x2x3x41001120002540024007.7810012240026300054008.5910013027000.0010021038000.0010022200039400060008.7010023360040036008.19100317001807006.5510032100019010006.911003302030303.43基本假设•假设RE.1•(a)严格外生性E(uit|xi,ci)=0,xi=xi1,xi2,⋯,xiTt=1,2,⋯,T•(b)ci独立于xit,即E[ci|xi]=E[ci]=0itiititycxu•RE.3假设(a)同方差假设:E(uu'|x)=σ2I(b)E(c2|x)=σ2iiiuTiic•假设RE.2•具体表述:•这种结构表明误差项是同方差且存在序列相关的TcTuucccuccccucJI2222222222222..............Ω•在RE.1-RE.3成立时,如果我们用PooledOLS来估计模型,估计量是一致的•但是POLS估计量忽略了随机误差项的结构信息,所以不是有效的•而且其方差-协方差矩阵不会等于σ2(X'X)−1•因此可以考虑GLS的方法•RE.1和RE.2假设保证后面的GLS估计结果是一致的,RE.3保证v具有同方差结构,从而假设保证FGLS估计结果是最有效的v•RE估计:GLS)Ωˆ()Ωˆ)((ˆ1-111-1^11^1iniiiniiREyXXXyXXX)(•在RE.1-RE.3成立时,如果我们用PooledOLS来估计模型,估计量是一致的•但是POLS估计量忽略了随机误差项的结构信息,所以不是有效的•而且其方差-协方差矩阵不会等于σ2(X'X)−1•因此可以考虑GLS的方法•RE.1和RE.2假设保证后面的GLS估计结果是一致的,RE.3保证v具有同方差结构,从而假设保证FGLS估计结果是最有效的v•随机效应估计量实际上是通过准去除时间均值(quasitimedemeaning)而得到的•随机效应并不是在每个时间t去掉因变量和自变量的时间均值,而是在每个时间t去掉时间均值的一部分•对Q个多重假设H0:Rβ=r进行假设检验•在RE.3成立时,可用F检验•不论RE.3是否成立,都可以用Wald检验:•RE.3成立与否,决定对Σ的估计方法随机效应模型的参数检验对UnobservedEffect存在性的检验•如果不存在UnobservedEffect,直接用PooledOLS估计就可以了•对UnobservedEffect存在性的检验也可以看成是模型设定检验–在PooledModel和REModel之间进行选择•检验假设:H0:σ2c=0,即vit不存在序列相关•BreuschandPagan(1980)检验–拉格朗日乘数检验(LM)–依赖于对uit的正态假设•具体检验统计量为•原假设成立下,LM统计量卡方分布,自由度为12211211ˆˆˆˆˆ12(1)ˆˆnTitiiuuuPOLSnTitiivnTLMvyxTv•Wooldridge(2002)检验统计量BPW•在原假设成立下,vit序列不相关,BPW的渐进分布是标准正态分布•该统计量能够探察vit中的许多种序列相关•但是拒绝原假设并不意味着RE的误差结构就是正确的–如果xit中没有包括滞后的被解释变量,vit即使满足RandomEffect的误差结构,原假设仍然会被拒绝11111/221111ˆˆˆˆˆˆˆˆnTTitisiistnTTitisiistvvBPWvv固定效应模型Fixed-EffectPanelModel固定效应模型的基本假设•与RE模型最大的不同在于,FE模型假设ci可以与uit相关,即对ci⊥uit是否成立不做假定。由于少了RE中的独立性假定,FE比RE的结果更加稳健。•X中不能包含不随时间改变的变量–解释变量如果包含不随时间变化的变量,我们无法识别这些变量对的影响–不随时间变化的变量指的是对所有的样本单位都不随时间而变化。如果该变量对部分样本单位随时间变化,就可以包含进来。itiititycxu固定效应转换估计•固定效应模型的估计策略是转换方程消去不可观测的效应ci•我们可以采用一阶差分的方法,也可以采用固定效应转换(fixedeffectstransformation)•固定效应转换也叫做组内转换(w
本文标题:面板数据回归(Panel Data)
链接地址:https://www.777doc.com/doc-3530990 .html