您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 8、计量经济学【多重共线性】
计量经济学——单方程计量经济学模型理论与方法第四章经典单方程计量经济学模型:放宽基本假定的模型第一节异方差性第二节序列相关性第三节多重共线性第三节多重共线性一、多重共线性及其产生的原因二、多重共线性的影响三、多重共线性的检验四、多重共线性的解决方法五、案例分析已学知识回顾:经典线性回归模型的基本假定1、解释变量是确定性变量并且相互独立。2、零均值同方差假定。即在给定的条件下,随机误差项的数学期望(均值)为零。随机误差项的方差与t无关,为一个常数。3、无自相关假定。不同的随机误差项和相互独立。4、解释变量与随机误差项不相关假定。5、正态性假定。假定随机误差项服从均值为0,方差为的正态分布。tXtt2tstXtt2一、多重共线性及其产生的原因(一)多重共线性(Multicollinearity)的定义从数学意义上去解释变量之间存在共线性,就是对于变量,如果存在不全为零的常数,使得下式成立:则称变量之间存在完全共线性。在计量经济学中,一个具有两个以上解释变量的线性回归模型里,如果解释变量之间存在式(4.3.1)那样的关系,则称这些解释变量之间存在完全的多重共线性。12,,,kXXX12,,,k1122,,,,,,,,,,,,,,0,(4.3.1,),,,,kkXXX12,,,kXXX一、多重共线性及其产生的原因(二)多重共线性产生的原因1、经济变量的内在联系,这是产生多重共线性的根本原因。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业二者都小。2、经济变量变化趋势的共同性。时间序列样本:经济繁荣时期,各基本经济变量(如收入、消费、投资、价格等)都趋于增长;衰退时期,又同时趋于下降。(二)多重共线性产生的原因3、在模型中引入滞后变量也容易产生多重共线性。在经济计量模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)。显然,两期收入间有较强的线性相关性。注:由于完全符合理论模型所要求的样本数据较难收集,在现有数据条件下,特定样本可能存在某种程度的多重共线性。一般经验:时间序列数据样本,简单线性模型,往往存在多重共线性;截面数据样本,问题不那么严重,但多重共线性仍然是存在的。二、多重共线性造成的影响(一)增大最小二乘估计量的方差由于,所以参数估计量仍然可以算出,并且仍然满足线性性、无偏性和最小方差性。但是由于,引起主对角线元素较大,从而的方差-协方差矩阵:中的对角线元素的数值将很大,即各共线变量的参数的OLS估计量的方差很大,即参数估计值的精度很低。可以证明,参数估计量的方差为:0XX1ˆ()XXXYˆ0XX1()XXˆ21ˆ()()CovXXˆi222,,,1ˆ()(4.3.2)(,,,,,,,,,)1,,,,,,,,iitiiVarXXR其中:表示第i个解释变量对模型中其他解释变量作辅助回归模型时的决定系数。当只有两个解释变量时,则就是变量的相关系数的平方,即。式(4.3.2)中第二项因子称为方差膨胀因子(VarianceInflationFactor),记成;则有:222,,1ˆ,,()(4.,,,,,,,,,,,,,,3.2)()1,iitiiVarXXR2iR1211(,,,,)iiikXfXXXXX12XX、2iR12XX、2221212==RRr21(1)iRiVIF2,,,,,,,,,,,,,,,,,,,,,,,,,1,(4.3.3)1,iiVIFR22,,,ˆ,,,,,,,,,,,,,()(4.3,,,.4)()iiitiVarVIFXX当与模型中其他解释变量存在严重多重共线性时,即,,越接近于1,共线性程度越强,从而参数OLS估计量的方差会成倍增大。如果,则,此时不存在多重共线性,从而参数OLS估计量的方差也就不会增大了。(二)难以区分每个解释变量的单独影响如果模型中两个解释变量具有线性相关性,例如:,即一个变量可以由另一个变量表示,这时模型中和前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。iX21iRiVIF2iR20iR1iVIF21XX1X2X12,二、多重共线性造成的影响(三)检验的可靠性降低在多元线性回归模型中,参数显著性检验的t统计量为:由于的方差增大,其标准差亦随之增大,这意味着t统计量值偏小,这样容易剔除掉不该剔除的解释变量,使统计检验的结果失去可靠性。由于中的主对角线元素的数值很大(即很大),从而的置信区间很大,使区间估计用于判断参数估计值的可靠性失去意义。变大的方差容易使预测的“区间”变大,从而降低预测精度,使预测失去意义。ˆ~(1)ˆ()iittnkSˆi21ˆ()()CovXXˆ()iS(四)完全共线性下参数估计量不存在多元线性回归模型:的普通最小二乘估计量为:如果解释变量之间存在完全多重共线性,由于矩阵的系数行列式,逆矩阵不存在,无法得到参数估计式。例如,对于二元线性回归模型:如果两个解释变量完全相关,如,该二元线性回归模型退化为一元线性回归模型这时,只能确定综合参数的估计值,却无法确定各自的估计值。YX1ˆ()XXXYX0XX1()XXˆ01122YXX21XX0121()YX1212,二、多重共线性造成的影响注意:除非是完全共线性,多重共线性并不意味着任何基本假设的违背;因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。三、多重共线性的检验(一)相关系数检验法(Klein判别法)Eviews软件中可以直接计算(解释)变量之间的相关系数矩阵:[命令方式]COR解释变量名[菜单方式]将所有解释变量设置成一个数组,并在数组窗口中点击View/Correlations。(二)辅助回归模型检验解释变量之间存在多重共线性可以看做是一个解释变量对其余解释变量的近似线性组合。可以将每个解释变量对其余解释变量进行回归,得到k个回归方程:iXjX分别求出其拟合优度及统计量如果其中最大的一个接近1,显著地大于临界值,则与其余存在多重共线性。(三)方差膨胀因子检验对于多元线性回归模型,参数估计值的方差可以表示成:123213121(,,,)(,,,)(4.3.5)(,,,)kkkkXfXXXXfXXXXfXXX22212kRRR、、、12kFFF、、、2iRiFiXjXˆi222221ˆ()()1()iiitiiitiVarVIFXXRXX其中:为方差膨胀因子,表示第i个解释变量与模型中其他解释变量辅助回归模型的决定系数。度量了与其余解释变量的线性相关程度,越接近于1,就越大,说明与其余解释变量之间多重共线性越强,反之越弱。一般地,当或时(此时),认为模型存在较严重的多重共线性。2,,,,,,,,,,,,,,,,,,,,,,,1(4.3.6)(1,),,,iiVIFR2iR2iRiX2iRiVIFiX5iVIF10iVIF22,0.80.9iiRR或,三、多重共线性的检验(四)特征值检验考察解释变量的样本数据矩阵:当模型存在完全多重共线性时,,;而当模型存在严重多重共线性时,,根据矩阵代数知识,若为矩阵的个特征值,则有:这表明特征值中至少有一个近似地等于0,因此可利用的特征值来检验模型的多重共线性。112111222212(1)111kknnknnkXXXXXXXXXX()1rankXk0XX0XX121,,,kXX1k121,,,,,,,,,,,,,,,,,0(4.3.,7,,),,kXX(1,2,,,1)iikXX(四)特征值检验利用特征值还可以构造两个用于检验多重共线性的指标:条件数(或病态数)CN(ConditionNumber)和条件指数(或病态指数)CI(ConditionIndex)。其指标定义为:这两个指标都反映了特征值的离散程度,数值越大,表明多重共线性越严重。一般的经验法则是:即认为存在多重共线性,大于30认为存在严重的多重共线性。CN最大特征值最小特征值,,,,,,,,,,,,,,,,,,,,,,,,,,,,(4.3.,8)CICN10CI四、多重共线性的解决方法(一)保留重要的解释变量,去掉次要的或可替代的解释变量(二)间接剔除重要的解释变量1、利用先验信息改变参数的约束形式根据经济理论或其他信息,找出参数间的某种关系,并将这种关系作为约束条件与样本信息结合起来,进行有约束的最小二乘估计。例如,著名的Cobb-Douglas生产函数中:劳动投入量与资金投入量之间通常是高度相关的,如果已知附加信息:(即规模报酬不变),则有,或者:,YALKLK11()KYALKALKALL()YKALL记,则C-D生产函数可以表示成:两边取对数变为:,此时二元模型转化成一元模型,当然不存在多重共线性的问题,可以利用OLS法估计进而得到。2、变换模型的形式对原设定的模型进行适当的变换,也可以消除或削弱原模型中解释变量之间的相关关系。具体有三种变换方式,一是变换模型的函数形式;二是变换模型的变量形式;三是改变变量的统计指标。,,YKykLLyAklnylnAlnk,,Aˆˆ1例:根据下表建立我国进口需求与GNP(作为收入的一个测度)和消费价格指数之间的关系模型。根据前页表中的数据,回归结果如下所示:22ˆ3146.9230.05294634.19776(2.062)(0.867)(1.9,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,84)0.970,,,,,,,,440.9650650.806121180.5594,IMGNPCPItRRDWF回归结果表明,在5%显著性水平下,收入(GNP)和价格(CPI)的系数各自均不是统计显著的。模型通过F检验。我们可以断定上述方程存在严重的多重共线性。为解决这个问题,我们可以用实际进口额(IM/CPI)对实际收入(GNP/CPI)进行回归,得到如下结果:回归结果:这表明,实际进口额与实际收入显著正相关。这样,通过将名义变量转换为实际变量,显然削弱了原模型中的多重共线性。3、综合使用时序数据与截面数据在模型的参数估计中,如果模型利用的是时间序列数据,这时模型又存在多重共线性,可以考虑用时间序列数据与截面数据相结合的办法来修正多重共线性对模型的影响。22ˆ5.146270.19709(1.715)(10.245,,,)0.,,,,,8974,,,,,,,,,,,,,,,,,,,,0.888,,,,,90.7594104.98,6,,8IMCPIGNPCPItRRDWF四、多重共线性的解决方法(三)逐步回归法(Frisch综合分析法)从所有解释变量中间先选择影响最为显著的变量建立模型,然后再将模型之外的变量逐个引入模型;每引入一个变量,就对模型中的所有变量进行一次显著性检验,并从中剔除不显著的变量;逐步引入——剔除——引入,直到模型之外所有变量均不显著时为止。这种消除多重共线性的方法称为逐步回归法,也称Frisch综合分析法。具体步骤为:(1)利用相关系数从所有解释变量中选取与被解释变量相关性最强的变量建立一元回归模型。(2)在一元回归模型中分别引入第二个变量,共建立个二元回归模型(设共有k个解释变量),从这些模型中再选取一个较优的模型。选择时要求模型中每个解释变量影响显著,参数符号正确,值有所提高。(3)在选取的二元回归模型中以同样方式引入第三个变量;如此
本文标题:8、计量经济学【多重共线性】
链接地址:https://www.777doc.com/doc-4057274 .html