您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 第三章--线性回归模型的扩展计量经济学(陶长琪)
第三章线性回归模型的扩展第一节多重共线性第二节异方差第三节自相关一、多重共线性的基本知识(一)多重共线性的涵义在多元线性回归模型经典假设中,其重要假定之一是回归模型的解释变量之间不存在线性关系,也就是说,解释变量中的任何一个都不能是其他解释变量的线性组合。第一节多重共线性如果违背这一假定,即线性回归模型中某一个解释变量与其他解释变量间存在线性关系,就称线性回归模型中存在多重共线性。多重共线性违背了解释变量间不相关的经典假设,将给普通最小二乘法带来一些后果。(二)多重共线性的类型指线性回归模型中至少有一个解释变量可以被其他解释变量线性表示,存在严格的线性关系。存在不全为零的数,使得下式成立:则可以说解释变量之间存在完全的线性相关关系,即存在完全多重共线性。(4-54)ikikiiiuXXXY22110k,,2102211kikiiXXXkXXX,,211.完全多重共线性从矩阵形式来看,就是,即观测值矩阵是降秩的,表明在矩阵X中至少有一个列向量可以由其他列向量线性表示。1)(kXrank0XX2.不完全多重共线性指线性回归模型中解释变量间存在不严格的线性关系,即近似线性关系。如对于模型(3.1.1)存在不全为零的数,使得下式成立:其中为随机干扰项,则可以说解释变量之间存在不完全多重共线性。随机干扰项表明上述线性关系是一种近似的关系式。iuk,,2102211ikikiiuXXXkXXX,,21完全多重共线性与完全非线性都是极端情况,一般说来,统计数据中多个解释变量之间多少都存在一定程度的相关性,对多重共线性程度强弱的判断和解决方法是本章讨论的重点。二、多重共线性产生的原因与后果1.经济变量之间的内在联系如工业生产函数中资本投入量与劳动投入量、需求函数中商品自身价格与其替代品价格、消费函数中收入与财产、农业生产函数中耕地面积与施肥量等,都存在一定的相互关系。(一)多重共线性产生的原因有些经济变量并没有明显的内在联系,但由于在样本期内,其变化的方向是一致的,这就使得样本数据高度相关。2.经济变量在时间上有共同变化的趋势例如在经济上升时期,收入、消费、投资、价格、就业率等都趋向于增长;而当经济收缩期,又几乎一致地下降。即使是在同期无多重共线性,异期也会存在多重共线性。在计量经济学模型中,往往需要引入滞后解释变量来反映真是的经济关系。例如,消费=(当前收入,前期收入),显然,两期收入存在较强的线性关系。f3.解释变量与其滞后变量同作解释变量时也会导致多重共线性问题由于完全符合理论模型所需要的数据较难收集,特定样本可能导致多重共线性。例如由于数据的缺失需要进行数据补充的,采用数据生成器生成的数据可能导致多重共线性的存在。4.样本资料的限制1.完全共线性下参数估计量不存在且解释变量的单独影响难以区分(二)多重共线性产生的后果多元线性回归模型的普通最小二乘参数估计量为如果出现完全共线性,则不存在,无法得到参数的估计量。uXYYXXX1ˆ)(1)(XX对二元线性回归模型则该二元线性回归模型退化为一元线性回归模型这时,只能确定综合参数的估计值01122YXXu0121()YXu21XX如12X1和X2前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响,所以各自的参数已经失去了应有的经济含义,甚至参数的符号也发生了改变。经验告诉我们,在多元线性回归模型的估计中,如果出现参数估计量的经济意义明显不合理的情况,应该首先怀疑是否存在多重共线性。2.近似共线性下普通最小二乘法参数估计量的方差变大在近似共线性下,虽然可以得到普通最小二乘参数估计量,但是由参数估计量方差的表达式:可见,由于此时,引起主对角线元素较大,使得参数估计量的方差增大,从而不能对总体参数做出准确推断。12)()ˆ(ovXXC0XX1)(XX存在多重共线性时,参数估计值的方差与标准差会变大,从而容易使通过样本计算的t统计量的值小于t临界值,误导作出参数为零的推断,这可能将重要的解释变量排除在模型之外。3.t检验的可靠性会下降当多元线性回归模型存在着多重共线性时,样本数据即使有微小的变化,也可能导致系数估计值发生明显的变化。4.回归模型缺乏稳定性三、多重共线性的检验(一)观察回归估计式法1.拟合优度比较高,而t统计量的值却普遍较低2R这是多重共线性的“经典”特征。如果回归估计式的拟合优度的值很大(一般来说在0.8以上),然而回归估计式中的全部或部分参数值估计值的t检验通不过,那么解释变量间有可能存在较严重的多重共线性。2R如果从经济理论或常识来看某个解释变量对被解释变量有重要影响,但是从线性回归模型的拟合结果来看,该解释变量的参数估计值经检验不显著,那么可能是解释变量间存在多重共线性所导致的。2.理论性强,检验值弱在多元线性回归模型中新引入一个变量后,发现模型中原有参数估计值的方差明显增大,则说明新加进来的解释变量与模型中的原解释变量可能存在多重共线性。3.新引入解释变量后,方差增大(二)拟合优度检验2jR对多元线性回归模型中各个解释变量相互建立回归方程,分别求出各回归方程的拟合优度,如果其中最大的一个接近1,Fi显著大于临界值,该变量可以被其他变量线性解释,则其所对应的解释变量与其余解释变量间存在多重共线性。...分别求出上述各个方程的拟合优度,如果其中最大的一个接近于1,则它所对应的解释变量与其余解释变量间存在多重共线性。,21R,22R2kR2iRiX如设某多元线性回归模型中原有k个解释变量将每个解释变量对其他解释变量进行回归,得到k个回归方程:kXXX,,21),,(k321XXXfX),,(k312XXXfX),,(-1k21XXXfXk(三)相关系数矩阵法考察模型其解释变量之间的相关系数矩阵为因为,所以上面相关阵为对称阵,,只需考察主对角线元素上方(或下方)某个元素绝对值是否很大(一般在0.8以上),就可以判断两个解释变量间是否存在多重共线性。jiijrr1jjrikikiiuXXY11011121221112212222111211kkkkkkkkkkrrrrrrrrrrrrrrrR四、多重共线性的修正(一)增大样本容量除完全多重共线性的情况外,样本容量越大,解释变量观测值之间的相关性越弱。(二)先验信息法先验信息法是指根据经济理论或者其他已有研究成果事前确定回归模型参数间的某种关系,将这种约束条件与样本信息综合考虑,进行最小二乘估计。运用参数间的先验信息可以消除多重共线性。如对C-D生产函数进行回归估计由先验信息可知劳动投入量L与资金投入量K之间通常是高度相关的,如果按照经济理论“生产规模报酬不变”的假定,则1ueKALY其中Y、L、K分别表示产出、劳动力和资本。则uuueLKALeKALeKALY)(1ueLKALY)(此时上式为一元线性回归模型,不存在多重共线性问题。两边取对数KLAKYlnlnln(三)改变变量的定义形式(1)用相对数变量替代绝对数变量如设需求函数为其中Y、X、P、P1分别代表需求量、收入、商品价格与替代商品价格,由于商品价格与替代商品价格往往是同方向变动,该需求函数模型可能存在多重共线性。uPPXY13210考虑用两种商品价格之比作解释变量,代替原模型中商品价格与替代商品价格两个解释变量,则模型为如下形式:原模型中两种商品价格变量之间的多重共线性得以避免。uppXY)(1210(2)删去模型中次要的或可替代的解释变量如果回归模型解释变量间存在较严重的多重共线性,根据经济理论、实践经验、相关系数检验、统计分析等方法鉴别变量是否重要及是否可替代,删去那些对被解释变量影响不大,或认为不重要的变量,则可减轻多重共线性。(3)差分法模型中解释变量X1t与X2t间存在多重共线性,X1t与X2t都是时间序列资料,对于t-1期令一阶差分为如设原回归模型为ttttuXXY2211011,221,1101ttttuXXY11,2221,1111)(ttttttttuuXXXXYY()11,2221,1111ttttttttttttuuuXXXXXXYYY可以得到一阶差分模型:值得注意的是,差分变换法也有一定负面作用。由于,,而与,等必然相关,因此差分变换法在减少多重共线性的同时,却带来了随机干扰项序列相关问题。tu1tu2tuttttuXXY22111tttuuu21-1-tttuuu(四)逐步回归法逐步回归法是指利用被解释变量Y对每一个解释变量Xi作一个回归方程,构造统计量,进行统计检验,并根据相应的经济理论进行解释,从中选取最优的回归方程;然后逐步引入其他的解释变量,再做相应的回归方程,扩大模型的规模,同时对所有解释变量的回归系数进行检验。多重共线性对回归参数估计量的影响并非总是导致它的符号与经济理论不同,多重共线性对假设检验的影响并非总是使得t检验本应显著而降低到不显著。因此,除非所面对的多重共线性极其严重,否则,通常的补救方法是无为而治,即不对多重共线性进行任何补救。具体而言,对于一个估计的多元线性回归模型,如果假设检验的结论是正确或者与经济理论一致,其估计结果与经济学的理论或者预期吻合,或者估计结果已经揭示了经济现实的特征、体现出明显的现实意义。对于这种估计的模型中所隐含的多重共线性,不予检验,也不予补救,这就是无为而治——什么也不做的内涵。例3-1(一)异方差的概念如果出现一、异方差的基本知识设线性回归模型为同方差假设为:第二节异方差ikikiiiuXXXY22110221),,,(akiiiiXXXurVni,,2,1221),,,(aikiiiiXXXurVni,,2,1即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性。)(2iiXf(二)异方差的几种常见类型如图3.2.1所示异方差一般可归结为三种类型:(1)单调递增型:随X的增大而增大(2)单调递减型:随X的增大而减小(3)复杂型:与X的变化呈复杂形式)(2iiXf2i2i2i异方差时:图3.2.1常见的异方差类型示意图非纯异方差假设略去了前期消费Yi-1,如果被略去的解释变量Yi-1与Xi呈同方向变化的趋势,这就使得Y的观察值Yi与回归值的离差ei随着Xi增大(减小)而增大(减小),从而ui不是同方差。二、异方差的原因与后果异方差产生的原因主要有:1.由于略去了某些解释变量设消费模型:(一)异方差产生的原因01iiiYXuiYˆ由于测量误差在时间范围内逐渐累积,所以误差量也趋于增加,这时ui的方差随着X值的递增而递增。另外,由于抽样技术和其他各种数据收集技术方法的改进,测量误差可能减少,这时,ui的方差随着时间而变化。因此,在时间序列数据中,常常由于测量误差的影响,使得ui项不是同方差。2.由于测量误差引起在截面数据中,常常涉及一定时点上的总体单位,如个别消费者、家庭、企业家等,这些单位各有不同的规模和水平,因而包括在ui项中的误差量也不相同,也会产生异方差。3.由于截面数据中各总体单位数值的不同而引起经验表明,采用横截面样本数据建模,由于在不同的样本点上解释变量之外的其他影响因素的差异较大,因而往往存在异方差性。计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,参数估计量的部分优良性将受到影响。1.回归系数的OLS估计量不再具有最小方差性OLS估计量仍然具有无偏性,但不具有有效性因为在有效性证明中利用了而且,在大样本情况下,尽管参数估计量具有一致
本文标题:第三章--线性回归模型的扩展计量经济学(陶长琪)
链接地址:https://www.777doc.com/doc-8134908 .html