您好,欢迎访问三七文档
1第十三章面板数据的处理一、面板数据的定义、意义和种类面板数据是调查经历一段时间的同样的横截面数据,具有空间和时间的两种特性。它还有其他一些名称,诸如混合数据,纵列数据,平行数据等,这些名字都包含了横截面单元在一段时期的活动。面板数据的优点在于:1.提供了更有价值的数据,变量之间增加了多变性和减少了共线性,并且提高了自由度和有效性。2.能够更好地检测和度量单纯使用横截面数据或时间序列数据无法观测到的影响。3.能够对更复杂的行为模型进行研究。形如01122ititititYXXu其中,i表示第i个横截面单元,t表示第t年。一般,我们用i来表示横截面标识符,用t表示时间标识符。假设N个横截面单元的观测次数相同,我们称之为平衡面板,反之,称为非平衡面板。一般假设X是非随机的,误差项遵从经典假设。二、面板数据回归模型的类型与估计方法(一)面板数据回归模型的类型对于面板数据模型itiitiitYXu,可能的情形主要有如下几种。1.所有系数都不随时间和个体而变化在横截面上无个体影响、无结构变化,即ij,ij。则普通最小二乘估计给出了和的一致有效估计。相当于将多个时期的截面数据放在一起作为样本数据。itititYXu。2.变截距模型在横截面上个体影响不同,个体影响表现为在模型中被忽略的反映个体差异的影响,又分为固定效应和随机效应两种。itiititYXu3.变系数模型除了存在个体影响之外,在横截面上还存在变化的经济结构,因而结构参数在不同横截面单位是不同的。ij,ij。itiitiitYXu。看到面板数据之后,如何确定属于哪一种类型呢?用F检验假设1:斜率在不同的横截面样本点上和时间上都相同,但截距不相同,即情形2。假设2:截距和斜率在不同的横截面样本点和时间上都相同,即情形1。2如果接收了假设2,则没有必要进行进一步的检验。如果拒绝了假设2,就应该检验假设1,判断是否斜率都相等。如果假设1被拒绝,就应该采用情形3的模型。采用OLS分别估计变系数模型、变截距模型和经典模型,得到残差平方和分别为S1、S2、S3。检验假设2的F统计量从直观上看,如S3-S1很小,F2则很小,低于临界值,接受H2。S3为截距、系数都不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。检验假设1的F统计量从直观上看,如S2-S1很小,F1则很小,低于临界值,接受H1。S2为截距变化、系数不变的模型的残差平方和,S1为截距、系数都变化的模型的残差平方和。(二)面板数据的估计方法仅以变截距模型为例,itiititYXu。1.固定效应方法在变截距模型中,i代表了截面单元的个体特性,反映了模型中被遗漏的体现个体差异变量的影响。而itu代表了模型中被遗漏了的体现随截面与时序同时变化的因素的影响。当然,更一般的情况,模型中还应包括时期个体恒量t。所谓固定效应方法就是把时期特征t当作未知的确定常数。2.随机效应方法在变截距模型中,i代表了截面单元的个体特性,反映了模型中被遗漏的体现个体差异变量的影响。而itu代表了模型中被遗漏了的体现随截面与时序同时变化的因素的由此可以得到下列结论:1))]1([~/221KTnSu;2)在2H下,)]1([~/223KnTSu和)]1)(1[(~/)(2213KnSSu;3)213/)(uSS与21/uS独立。3121()/[(1)(1)]~[(1)(1),(1)]/[(1)]SSnKFFnKnTKSnTnK2111()/[(1)]~[(1),(1)]/[(1)]SSnKFFnKnTKSnTnK3影响。当然,更一般的情况,模型中还应包括时期个体恒量t。所谓随机效应方法是指把时期特征t视为同itu一样的随机变量。3.两种方法的比较在时间序列T长度很小而截面单元个数N较大时,两种估计方法差别较大。如果春研究者仅以样本自身效应为条件进行推论,宜使用固定效应模型;如果以样本对总体效应进行推论,则采用随机效应模型。这个原则对于变系数模型也是适用的。从理论上来说,若假定itu与X不相关,则用ECM可能合适一些,如果相关,用FEM可能更合适一些。贾奇对此作了一个小结。他认为:(1)若T较大而N较小,则ECM和FEM相差不多。(2)当N较大而T较小时,两种方法的估计值会有显著的差异。如果我们确信我们样本中个体或横截面单元不是从一个较大的样本中随机取出的,那么FEM是合适的。但如果样本中的横截面单元被看作是随机抽取的,则ECM是合适的。HAUSMAN于1978年提出了一个检验。它的原假设是FEM和ECM估计量是没有实质上的差异。统计量是一个渐近的卡方分布。若原假设被拒绝了,结论就是ECM不合适。
本文标题:面板数据的处理
链接地址:https://www.777doc.com/doc-1981151 .html