您好,欢迎访问三七文档
面板数据分析方法BaltagiBaltagi著白仲林主译第一节面板数据的基本问题第二节面板数据的模型形式第三节面板数据模型的估计方法第一节面板数据的基本问题一、面板数据的定义二、面板数据的分类三、面板数据的特点一、面板数据的定义面板数据(paneldata)是指由变量y关于N个不同对象的T个观测期所得到的二维结构数据,记为yit,其中,i表示N个不同对象(如国家、地区、行业、企业或消费者等,一般称之为第i个个体),t表示T个观测期。面板数据是二维结构数据时间序列数据或截面数据都是一维数据。时间序列数据是变量按时间得到的数据;截面数据是变量在固定时点的一组数据。面板数据是同时在时间和截面上取得的二维数据。所以,面板数据(paneldata)也称作时间序列与截面混合数据(pooledtimeseriesandcrosssectiondata)。面板数据是截面上个体在不同时点的重复观测数据。面板数据是二维结构数据Panel原指对一组固定调查对象的多次观测,近年来paneldata已经成为专业术语。面板数据从横截面看(crosssection),是由若干个体(entity,unit,individual)在某一时点构成的截面观测值,从纵剖面(longitudinalsection)看每个个体都是一个时间序列。数据结构的二维性NTTTNNXXXTXXXXXXNit2122212121112121\时间序列数据横截面数据变量X的面板数据结构面板数据是二维结构数据第一节面板数据的基本问题一、面板数据的定义二、面板数据的分类三、面板数据的特点二、面板数据的分类1.短面板与长面板短面板(shortpanel):时间T较小,而个体数N较大。长面板(longpanel):时间T较大,而个体数N较小。二、面板数据的分类2.微观面板数据与宏观面板数据微观面板数据一般指一段时期内不同个体或者家庭的调查数据,其数据中往往个体单位较多,即N较大(通常均为几百或上千)而时期数T较短(最短为两个时期,最长一般不超过20个时期)。二、面板数据的分类2.微观面板数据与宏观面板数据宏观面板数据通常为一段时间内不同国家或地区的数据集合,其个体单位数量N不大(一般为7-200)而时期数T较长(一般为20-60年)。二、面板数据的分类3.动态面板与静态面板在面板模型中,如果解释变量包含被解释变量的滞后值,则称为“动态面板”(dynamicpanel);反之,则称为“静态面板”(staticpanel)。二、面板数据的分类4.平衡面板数据与非平衡面板数据如果在面板数据中,每个时期在样本中的个体完全一样,则称为“平衡面板数据”(balancedpanel);然而,有时某些个体的数据可能缺失,或者新的个体后来才加入到调查中来,在这种情况下,每个时期观测到的个体不完全相同,则称为“非平衡面板数据”(unbalancedpanel)。第一节面板数据的基本问题一、面板数据的定义二、面板数据的分类三、面板数据的特点三、面板数据的特点1.由于观测值的增多,可以增加估计量的抽样精度。由于同时有截面维度与时间维度,通常面板数据的样本容量更大,从而可以提高估计的精确度。面板数据提供“更加有信息价值的数据,变量增加变异性,变量之间的共线性削弱了,并且提高了自由度和有效性。三、面板数据的特点2.提供更多个体动态行为的信息。由于面板数据同时有横截面与时间两个维度,有时可以解决单独的截面数据或时间序列数据所不能解决的问题,对面板数据进行回归既可以像回归分析截面数据一样捕获个体间的差异变化,又可以研究个体随时间的变化情况。三、面板数据的特点2.提供更多个体动态行为的信息。案例:考虑如何区分规模效应与技术进步对企业生产效率的影响。对于截面数据来说,由于没有时间维度,故无法观测到技术进步。然而,对于单个企业的时间序列数据来说,我们无法区分其生产效率的提高究竟有多少是由于规模扩大,有多少是由于技术进步。三、面板数据的特点3.可以解决遗漏变量问题。遗漏变量偏差是一个普遍存在的问题。虽然可以用工具变量法解决,但有效的工具变量常常很难找。遗漏变量常常是由于不可观测的个体差异或“异质性”造成的,如果这种个体差异“不随时间而改变”,则面板数据提供了解决遗漏变量问题的又一利器。三、面板数据的特点4.带来一些问题。(1)由于综合了两种数据类型,面板数据分析方法相对更加复杂。(2)由于同一个体不同时期的数据一般存在自相关,样本数据通常不满足独立同分布的假定。(3)面板数据的收集成本通常较高,不易获得。安徽河北江苏内蒙古山西1996199920020200040006000800010000120001400019961997199819992000200120021996199820002002安徽福建黑龙江江苏辽宁山东山西浙江02000400060008000100001200014000安徽北京福建河北黑龙江吉林江苏江西辽宁内蒙古山东上海山西天津浙江安徽河北江苏内蒙古山西19961998200020020200040006000800010000120001996199719981999200020012002199619992002安徽河北江苏内蒙古山西020004000600080001000012000安徽北京福建河北黑龙江吉林江苏江西辽宁内蒙古山东上海山西天津浙江案例1(file:5panel02):1996-2002年中国东北、华北、华东15个省级地区的居民家庭固定价格的人均消费(CP)和人均收入(IP)数据。数据是7年的,每一年都有15个数据,共105组观测值。人均消费和收入两个面板数据都是平衡面板数据,各有15个个体。面板数据散点图15个地区7年人均消费对收入的面板数据散点图见图6和图7。图6中每一种符号代表一个年度的截面散点图(共7个截面)。相当于观察7个截面散点图的叠加。图7中每一种符号代表一个省级地区的7个观测点组成的时间序列。相当于观察15个时间序列。图6图72,0003,0004,0005,0006,0007,0008,0009,00010,00011,0003,0005,0007,0009,00011,00013,000CP_1996CP_1997CP_1998CP_1999CP_2000CP_2001CP_2002IP2,0003,0004,0005,0006,0007,0008,0009,00010,00011,0003,0005,0007,0009,00011,00013,000CP_IAHCP_IBJCP_IFJCP_IHBCP_IHLJCP_IJLCP_IJSCP_IJXCP_ILNCP_INMGCP_ISDCP_ISHCP_ISXCP_ITJCP_IZJIPFile:5panel02a2000300040005000600070008000900010000110002000400060008000100001200014000IPCROSSCP1996CP1997CP1998CP1999CP2000CP2001CP2002IP用原变量建模还是用对数变量建模?7.88.08.28.48.68.89.09.29.48.08.28.48.68.89.09.29.49.6LOG(IPCROSS)LOG(CP1996)LOG(CP1997)LOG(CP1998)LOG(CP1999)LOG(CP2000)LOG(CP2001)LOG(CP2002)人均消费对收入的面板数据散点图对数的人均消费对收入的面板数据散点图本例用对数数据研究更合理为了观察得更清楚,图8给出北京和内蒙古1996-2002年消费对收入散点图。从图中可以看出,无论是从收入还是从消费看内蒙古的水平都低于北京市。内蒙古2002年的收入与消费规模还不如北京市1996年的大。图9给出该15个省级地区1996和2002年的消费对收入散点图。6年之后15个地区的消费和收入都有了相应的提高。2000300040005000600070008000900010000110002000400060008000100001200014000cp_bjcp_nmgIP_I2000300040005000600070008000900010000110002000400060008000100001200014000CP_1996CP_2002IP_T图8图9尽管两个地区的水平值差异很大,但消费结构并没有太大的变化。第一节面板数据的基本问题第二节面板数据的模型形式第三节面板数据模型的估计方法其中:和分别表示居民的消费与收入。反映不随时间变化的个体上的差异性(个体效应)反映不随个体变化的时间上的差异性(时间效应)例1:居民消费行为与收入的关系itititYC10ittiituitCitY(1,2,;1,2,)iNtTLLit例2.农村居民收入分析itititititRCIRLTCSCPIC3210)(ln)ln+((14.1.3)ittiituNi,2,1Tt,2,1it面板数据:多个观测对象的时间序列数据所组成的样本数据。反映不随个体变化的时间上的差异性,被称为时间效应。反映不随时间变化的个体上的差异性,被称为个体效应第二节面板数据的模型形式一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型其中:为的矩阵,为k个解释变量的第i个个体在第t时期的观测值,为的矩阵。zi为不随时间而变的个体特征,即。扰动项由两部分构成,被称为“复合扰动项”。个体效应模型(individual-specificeffectsmodel)假定样本中每个个体的回归方程斜率相同,但截距项不同。''ititiiityxzu1k一、个体效应模型,itizzt()iitu(1,2,;1,2,)iNtTLL'itx1k复合扰动项:不可观测的随机变量是代表个体异质性的截距项。为随个体与时间而变的扰动项。假定为独立同分布的,且与不相关。''ititiiityxzuiu个体效应模型()iitu(1,2,;1,2,)iNtTLLititiu1.它表示不可观测的个体特殊效应、潜在变量、不可观测的异质性等。考虑到个人或者任一家庭、企业都具有很难被调查者观察到的独有的特征,这种特殊效应在整个时间范围内是保持不变的。2.某些场合下将其视为常数,但这也是随机变量的特例,即退化的随机变量。''ititiiityxzuiu对于个体效应:Tt,2,1取对数后,模型变为:在这里,代表着企业不随时间变化并且不可观测到的特殊效应,它表示一个企业的管理才能、员工素质等。例:一个企业的柯布-道格拉斯生产函数iitititFLAKY21iitititFLKAYlnlnlnlnln21iFln1.如果与所有解释变量均不相关,则进一步称之为“随机效应模型”(RandomEffectsModel,RE)。2.如果与某个解释变量相关,则进一步称之为“固定效应模型(FixedEffectsModel,FE)。''ititiiityxzuiu个体效应与解释变量的相关性:itxiu),(iitzxiu第二节面板数据的模型形式一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型固定效应模型形式同样与个体效应模型相同,但是在固定效应模型中假定为需要估计的固定参数,它可以与解释变量之间存在相关性。固定效应模型意味着存在内生解释变量。在随时间变化的情况下,固定效应模型所得到的第j个解释变量的边际效应估计量同样是一致的。然而,同随机效应模型相比,固定效应模型中存在参数过多和自由度损失过多等问题。二、固定效应模型iuitjx,第二节面板数据的模型形式一、个体效应模型二、固定效应模型三、随机效应模型四、双向效应模型对于随机效应模型,一般采用可行的广义最小二乘法(FGLS)对其进行估计,由于被假定为随机的
本文标题:面板数据分析方法
链接地址:https://www.777doc.com/doc-1960839 .html