您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 第十六章-面板数据模型一
第16章静态面板数据模型时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(paneldata)也称时间序列截面数据(timeseriesandcrosssectiondata)或混合数据(pooldata)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据从横截面(crosssection)上看,是由若干个体(entity,unit,individual)在某一时刻构成的截面观测值,从纵剖面(longitudinalsection)上看是一个时间序列。对于面板数据yit(i=1,2,…,N,t=1,2,…,T)来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balancedpaneldata)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalancedpaneldata)。本章主要讨论静态面板数据模型的相关理论及软件操作,首先从模型的检验开始到介绍变截距模型中的固定影响变截距模型和随机影响变截距模型,然后到变系数模型。本章的流程图如下:静态面板数据模型面板数据模型建模的基本原理固定效应变截距模型平衡数据建模原理固定效应模型分类固定效应模型软件估计非平衡数据建模原理固定效应模型另外两种估计方法广义最小二乘法估计二阶段最小二乘法估计随机效应变截距模型随机效应模型原理模型软件估计Hausman检验变系数模型变系数模型原理模型分类及软件操作似不相关回归模型Swamy模型16.1面板数据模型建模的基本原理在应用多元回归分析建立的计量经济模型时,如果所建的模型中缺失了某些不可观测的重要解释变量,使得回归模型随机误差项常常存在自相关。于是回归参数的最小二乘法OLS估计量不再是无偏估计或有效估计。但是,运用面板数据建立的计量经济模型时,对于一些忽略的解释变量可以不需要其实际观察值,而通过控制该变量对被解释变量的影响的方法获得模型参数的无偏估计。由此可见,面板数据不仅可以同时利用截面数据和时间序列数据建立计量经济模型,而且能更好地识别和度量单纯的时间序列模型和单纯截面数据模型所不能发现的影响因素,它能够构造和检验更复杂的行为模型。例如:在宏观领域,它被广泛用于劳动经济学、国际金融、经济增长、产业结构、技术创新、税收政策等领域。16.1.1面板数据模型基本框架面板数据能更好地识别和度量时间序列或截面数据不可发觉的效应,有助于建立和检验更复杂的行为模型,其基本模型是如下形式的一般回归模型:1,2,,,1,2,,ititititityxiNtT(16.1.1)其中:ity是个体i在时间t时期的观测值,表示模型的常数项,i代表固定或者随机的截面效应,t代表固定或者随机的时期效应,itx表示k阶解释变量观测值向量。表示解释变量的系数向量,并且在根据其条件的限制分为三种值,一是对所有截面和时期都是相同的常数,二是在不同的截面是不同的系数,三是在不同的时期是不同的。it是独立同分布的误差项,即()0itE。在公式(16.1.1)中,如果考虑k个解释变量,自由度NT远小于参数个数,对于截面成员方程,待估计参数的个数为((1))NTkN,对于时间截面方程,待估计参数的个数为((1))NTkT,这使得该模型无法估计。为了对模型进行估计,则可以建立以下的两类模型:从个体成员角度考虑,建立含有N个个体成员方程的面板数据模型;在时间点上截面,建立含有T个时间点截面方程的面板数据模型。1)含有N个个体成员方程的面板数据模型模型形式如下:iTiitiTTiylxlI(16.1.2)其中:iy是个体i的观观测值的时间序列。系数向量取值受不同个体的影响,ix表示个体i解释变量观测值时间序列。Tl是T阶的单位行向量,TI是T阶的单位列向量。'12()T,,,,包括所有的时点效应。该式含有N个截面方程。2)含有T个时间截面方程的面板数据。其形式如下:tNtitNtNtylxIl(16.1.3)其中:ty是某一时间点的各个个体成员的因变量观测值序列。系数向量取值受不同时期的影响,tx表示某一时间点的各个个体成员的解释变量观测值序列。NI是N阶行向量,Nl是N阶列向量。12()N’,,,,包括所有的截面效应。该式含有T个时间截面方程。(1)为了更好讨论,将这些方程堆积在一起。首先,按照面板数据的截面方程堆积起来的,表示如下:()()NTNTNTylxIllI(16.1.4)在截面单位和时期的数据和参数满足经典假设的前提下建立的矩阵和tx矩阵,其无约束的协方差矩阵如下:'''11211'''2122''1()NNNNEE(16.1.5)(2)将这些方程看出是一系列的时点方程,通过时点堆积起来的方程组如下:()()NTNTNTylxlIIl(16.1.6)其协方差矩阵如下:'''11211'''2122''1()TTTTEE(16.1.7)为了得到模型(16.1.1)的参数的无偏有效估计量,假设模型满足下列条件:①误差项均值为0,并且同方差。②误差项不存在截面相关。③解释变量与误差项相互独立。④解释变量之间线性无关。⑤解释变量是非随机的。如果模型满足上面的假设,可以用最小二乘法估计模型的参数。16.1.2面板数据分类在模型(16.1.1)式子中,将i和t归入截距里,常用的有如下的三种情形:情形1:,ijij(16.1.8)情形2:,ijij(16.1.9)情形3:,ijij(16.1.10)1)对于情形1,假设在横截面既无个体的影响,也没有结构的变化。即对于每个个体成员方程,截距项和系数向量均相同。对于该模型,将各个个体的时间序列数据堆积在一起来作为样本数据,这种模型称为混合回归模型(PooledRegressionModel)。那么可以直接利用普通最小二乘法(OLS)估计参数,则该模型为:,1,2,,iiiyxuiN(16.1.11)实际上,混合回归模型假设了解释变量对被解释变量的影响与个体无关。这种假设被广泛的应用,但是在很多实际问题的研究中,该模型不是很适用。因此,本书不详细讨论这种模型。2)对于情形2,假设在个体成员上存在个体影响而无结构变化,并且个体影响可以截距项的差别来说明,而系数向量相同,称该模型为变截距模型。从估计方法角度,有书也称之为个体均值修正回归模型(individual-meancorrectedregressionmodel)。即模型形式如下:,1,2,,iiiiyxuiN(16.1.12)3)对于情形3,假设在个体成员上既存在个体影响,又存在结构变化,即用变化的截距项来说明的同时,用系数向量依个体成员的不同而变化,来说明个体成员之间的结构变化。这样的模型我们称为变系数模型或无约束模型(unrestrictedmodel)。,1,2,,iiiiiyxuiN(16.1.13)16.1.3模型检验原理在对面板数据进行估计时,使用的样本包含了个体、指标、时间3个方向上的信息。如果模型设定不正确,估计结果将与所要模拟的经济现实偏离很远。因此,建立面板数据模型之前要检验被解释变量的参数是否在所有横截面样本点和时间上都是常数,即检验所研究的问题属于上述3种情况的哪一种,以确定模型的形式。常用的检验是协变分析检验或协方差分析检验(analysisofcovariance)。主要检验如下的两个假设:NH211:(16.1.14)NNH21212:(16.1.15)如果接受了假设2,可以认为样本数据符合模型(16.1.11),不需要进行进一步的检验了。如果拒绝了假设2,还要进行检验假设1。如果接受假设1,则认为样本数据符合模型(16.1.12)。如果假设1也被拒绝了,才应采用模型(16.1.13)。下面是进行假设检验F统计量的计算方法。记11TitityyT,11TiittxxT(16.1.16)模型(11.8)的参数最小二乘法估计后,得到:',1()()Tiixxiitittwxxxx,,1()()Tixyiitititwxxyy,2,1()Tyyiititwyy(16.1.17)模型(16.1.13)的残差平方和为:'11,,,,1()NyyixyixxixyiiS(16.1.18)计算模型(16.1.12)的残差平方和,如果记为:,1Nyyyyiiww,,1Nxyxyiiww,,1Nxxxxiiww模型(16.1.12)残差平方和为:'12yyxyxxxyS(16.1.19)计算模型(16.1.11)的残差平方和,如果记'11()()NTxxitititTxxxx,11()()NTxyitititTxxyy(16.1.20)211()NTyyititTyy(16.1.21)其中:111NTititxxNT,111NTitityyNT,则模型(16.1.11)残差平方和记为'13yyxyxxxySTTTT(16.1.22)在假设H2下检验统计量F2服从相应自由度下的F分布,即)]1(),1)(1[(~)]1(/[)]1)(1/[()(1132kNNTkNFkNNTSkNSSF(16.1.23)若计算所得到的统计量F2的值不小于给定置信度下的相应临界值,则拒绝假设H2,继续检验假设H1,检验统计量F1服从相应自由度的F分布,)]1(,)1[(~)]1(/[])1/[()(1121kNNTkNFkNNTSkNSSF(16.1.24)若计算所得的统计量F1的值不小于给定置信度下的相应临界值,则拒绝假设H1,用模型(16.1.13)拟合样本,反之,则用模型(16.1.12)。在实际经济问题的分析中,变截距模型和变系数模型比较常见,因此本章主要介绍这两类模型的相关理论与软件操作。16.1.4模型检验软件操作例如,我们使用Grunfeld(1958)的公司水平的平衡面板数据(后来被Baltagi2001年扩展)。该面板数据是对美国10个大型制造业企业的年投资(I)、公司价值(F)和公司资本(K)观测20年数据(1935-1954)1。在后面的面板数据模型中以及下章都将采用本例数据进行示范操作。第一步,假定截距和系数都随截面变化,即为模型(16.1.13),先对模型进行最小二乘估计得到残差平方和为:图16.1.1其结果为:图16.1.2得到S1=324728.6。第二步,截距随截面变化,系数在每个截面都相同,模型估计设置如下:图16.1.3得到的残差平方和S2=523478.1。第三步,进行混合模型估计,截距和系数对每个截面都是相同的,模型设定如下:1EVviews6.0ExampleFiles,QuantitativeMicroSoftware。图16.1.4然后从估计结果中得到S3=1935595。为了确定面板数据分析模型,首先利用F检验进行模型设定检验。N=10,T=20,k=2(解释变量个数),则有F2=[(1935595-324728.6)/(9*3)]/[324728.6/(200-10*3)]=31.2337507,临界值F0.95(27,170)值在1.55左右,拒绝假设H2,则继续检验H1;F1=[(523478.1-324728.6)/18]/[324728.6/170]=5.78045362,F0.95(18,170)介于1.66和1.67之间,F1也大于临界值,拒绝H1,选用模型(16.1.13)拟合
本文标题:第十六章-面板数据模型一
链接地址:https://www.777doc.com/doc-4574156 .html