您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第五章-计量经济学检验
第五章计量经济学检验——违背基本假设的情况一方面,建立一个计量经济学模型要经过四重检验,其中经济意义检验、统计检验、预测检验已讲,这一章主要讲计量经济学检验的范畴。另一方面,前面讨论了最小二乘估计的优良性质,但都是基于经典假设。如果这些假设不满足,会出现什么问题呢?这一章对其进行分析。本章内容多重共线性(Multicollinearity)异方差性(Heteroscedasticity)自相关(Autocorrelation)多重共线性的概念多重共线性的后果多重共线性的检验克服多重共线性的方法第一节多重共线性(Multi-Collinearity)一、多重共线性的概念1、多重共线性对于模型Yi=0+1X1i+2X2i++kXki+ii=1,2,…,n其基本假设之一是解释变量是互相独立的。如果某两个或多个解释变量之间出现了相关性,则称为多重共线性。如果存在c1X1i+c2X2i+…+ckXki=0i=1,2,…,n其中:ci不全为0,即某一个解释变量可以用其它解释变量的线性组合表示,则称为解释变量间存在完全共线性。如果存在c1X1i+c2X2i+…+ckXki+vi=0i=1,2,…,n其中ci不全为0,vi为随机误差项,则称为一般共线性(近似共线性)或交互相关(intercorrelated)。在矩阵表示的线性回归模型Y=XB+N中,完全共线性指:秩(X)k+1,即矩阵knnnkkXXXXXXXXXX212221212111111中,至少有一列向量可由其他列向量(不包括第一列)线性表出。例:有人在建立某地区粮食产量回归模型时,以粮食产量为因变量y,以化肥用量为x1,水浇地面积为x2,农业投入资金为x3等作为自变量。从表面上看到x1,x2,x3都是影响粮食产量的重要因素,可是建立的回归方程效果很差,原因何在呢?注意:完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。2、实际经济问题中的多重共线性现象经济变量的共同变化趋势时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。滞后变量的引入在计量经济模型中,往往需要引入滞后经济变量来反映真实的经济关系。例如,消费=f(当期收入,前期收入)显然,两期收入间有较强的线性相关性。一般经验对于采用时间序列数据作样本、以简单线性形式建立的计量经济学模型,往往存在多重共线性。以截面数据作样本时,问题不那么严重,但多重共线性仍然是存在的。二、多重共线性的后果1、完全共线性下参数估计量不存在多元线性模型YX的普通最小二乘参数估计量为:()XXXY1(2.6.4)如果存在完全共线性,则(X’X)-1不存在,无法得到参数的估计量。例如:对一个离差形式的二元回归模型2211xxy如果两个解释变量完全相关,如12xx,则有221212212121221221211iiiiiiiiiiixxxxxxxxxxxXX1121iiiiiiyxyxyxYX该回归模型的正规方程为YXBX)Xˆ(或iiiiiyxxxx1212211ˆˆiiiiiyxxxx2222121ˆˆ解该线性方程组得:00ˆ2122121212121211221221212222111iiiiiiiiiiiiiiiiiiiiiiixxxxxyxxyxxxxxxxxyxxxyx1ˆ为不定式;同理,2ˆ也为不定式,其值无法确定。2、近似共线性下普通最小二乘法参数估计量非有效在一般共线性(或称近似共线性)下,虽然可以得到OLS法参数估计量,但是由参数估计量方差的表达式为12)()ˆ(XXCov由于此时|X’X|0,从而使参数估计值的方差增大,OLS参数估计量非有效。例如,如果一个模型中仅仅包含两个解释变量和一个常数,则对其中任何一个斜率系数,可以得到:kknikikkSrxxrb)1()()1(]Var[2122122122,2,1k如果这两个解释变量是完全相关的,则上述方差具有无限大。确切相关的情形是完全违反了模型的假设,这不是数据的问题。若模型中存在k个解释变量:为了方便,定义数据矩阵X包含常数和)1(K个利用与均值偏离度量的解释变量。假设kx表示第k个变量,)(kX表示剩余的包括常数项的变量,则逆矩阵1)(XX中的第k个对角元是:111()()()()()11()()()()2.()[()]()11(1)kkkkkkkkkkkkkkkkkkkkkkkkxxRSxMxxxxXXXXxXXXXxxxx这里2.kR是kx基于其它解释变量进行回归的决定系数2R。在多元线性回归模型中,第k个系数最小二乘估计的方差是2乘以这个比值。因此,当kx与其它解释变量之间的相关性越强(即2.kR越大),则该系数估计的方差就越大。从而bk的方差为:nikikkkxxRb122.2)()1(]Var[该公式表明:(1)在其他情况相同时,kx与其它解释变量之间的相关性越强(即2.kR越大),则由于多重共线性,该系数估计的方差就越大。(2)在其他情况相同时,kx自身的变差越大,则该系数估计的方差就越小。(3)在其他情况相同时,线性模型的整体拟合效果越好(体现在2上),则该系数估计的方差就越小。一种最普遍的情形是,解释变量之间是高度相关,而不是确切相关的。在这种情形下,回归模型仍然保持那些常见的性质,但是出现了一些潜在的统计问题:1.数据扰动存在巨大影响。2.虽然模型的整体效果比较好(2R较大),但参数b不显著。3.导致参数估计“变性”(符号不合理)。4.解释变量前的参数并不反映各自与被解释变量之间的结构关系,而是反映它们对被解释变量的共同影响。三、多重共线性的检验由于实际样本数据永远不会是正交的,则多重共线性总是在一定程度上存在的。但是,什么时候多重共线性成为严重的问题呢?也就是受到变量之间交互关系影响促使估计量方差扩散到什么程度时,才能够引起我们的关注呢?检验多重共线性的方法主要有:经验判断法、相关系数判断法、条件数判断法、方差膨胀因子判断法、逐步回归判断法等。1.经验判别法(最常用的方法)在OLS法下,模型的R2与F值较大,但各参数估计值的t检验值较小,说明各解释变量对Y的联合线性作用显著,但各解释变量间存在共线性而使得它们对Y的独立作用不能分辨,故t检验不显著。此方法简便易行,因而是实践中最常用的方法,缺点是无法确诊。2.使用相关矩阵检验统计软件一般提供各解释变量两两之间的相关系数矩阵,如发现某些相关系数高(绝对值高于0.8),则表明多重共线性存在。但即使解释变量两两之间的相关系数都低,也不能排除存在多重共线性的可能性。此方法更多被用于只存在两个解释变量的情况。3.VIF检验VIF是方差膨胀因子的英文(VarianceInflationFactors)缩写,这是一种比较正规的检验方法。该方法通过检查指定的解释变量能够被回归方程中其它全部解释变量所解释的程度来检测多重共线性。方程中每个解释变量有一个VIF值,高VIF值表明多重共线性增大了系数估计值的方差,从而产生一个减小了的t值。其中,方差膨胀因子定义为:VIF检验的具体步骤如下:2.11VIFkR设原方程为:Y=0+1X1+2X2+…+kXk+u我们需要计算K个不同的VIF,每个Xi一个。为指定Xi计算VIF涉及以下三步:(1)Xi对原方程中其它全部解释变量进行OLS回归,例如,若i=1,则回归下面的方程:X1=1+2X2+3X3+…+kXk+v(2)计算的方差膨胀因子(VIF):其中Ri2是第一步辅助回归的决定系数。)1(1)ˆ(2iiRVIF(3)分析多重共线性的程度VIF越高,多重共线性的影响越严重。由于没有VIF临界值表,我们只能使用经验法则:有人建议用VIF10作为存在严重多重共线性的标准,特别在解释变量多的情形应当如此。4.逐步回归法以Y为被解释变量,逐个引入解释变量,构成回归模型,进行模型估计。根据拟合优度的变化决定新引入的变量是否可以用其它变量的线性组合代替,而不作为独立的解释变量。如果拟合优度变化显著,则说明新引入的变量是一个独立解释变量;如果拟合优度变化很不显著,则说明新引入的变量不是一个独立解释变量,它可以用其它变量的线性组合代替,也就是说它与其它变量之间存在共线性关系。四、克服多重共线性的方法1、第一类方法:排除引起共线性的变量找出引起多重共线性的解释变量,将它排除出去,是最为有效的克服多重共线性问题的方法。注意:剩余解释变量参数的经济含义和数值都发生了变化。2、第二类方法:差分法对于以时间序列数据为样本、以直接线性关系为模型关系形式的计量经济学模型,将原模型变换为差分模型Yi=1X1i+2X2i++kXki+i可以有效地消除存在于原模型中的多重共线性。一般讲,增量之间的线性关系远比总量之间的线性关系弱得多。例如:在中国消费模型中的2个变量:收入(Y:GDP)与消费C的总量与增量数据YC(-1)C(-1)/Y△Y△C(-1)△C(-1)/△Y1981490129760.60721982548933090.60285883330.56631983607636380.59965873290.56051984716440210.561310883830.35201985879246940.533916286730.413419861013357730.5697144110790.748819871178465420.555216517690.465819881470474510.506729209090.311319891646693600.5684176219091.083199018320105560.5762185411960.6451199121280113620.533929608060.2723199225864131460.5083458417840.3892199334501159520.4624863728060.3249199447111201820.42841261042300.3354199559405272160.45811229470340.5721199668498345290.5041909373130.8042进一步分析:Y与C(-1)之间的判定系数为0.9845,△Y与△C(-1)之间的判定系数为0.7456。一般认为:两个变量之间的判定系数大于0.8时,二者之间存在线性关系。所以,原模型经检验地被认为具有多重共线性,而差分模型则可认为不具有多重共线性。3、第三类方法:减小参数估计量的方差多重共线性的主要后果是参数估计量具有较大的方差,所以采取适当方法减小参数估计量的方差,虽然没有消除模型中的多重共线性,但确能消除多重共线性造成的后果。例如:增加样本容量,可使参数估计量的方差减小。再如:对系数施加约束。前面已讲过,约束性条件虽然通常使得残差平方和增加,但可以使得参数的方差减少。如在Cobb—Douglas生产函数中加进规模效益不变的约束,可缓和资本和劳动的高度相关而引起的多重共线性问题的影响。•再如:岭回归法(RidgeRegression)70年代发展的岭回归法,以引入偏误为代价减小参数估计量的方差,受到人们的重视。具体方法是:引入矩阵对角矩阵,使参数估计量为yXXXb1k]I[rr这里r是大于零的常数。从而]I[krXX是非奇异矩
本文标题:第五章-计量经济学检验
链接地址:https://www.777doc.com/doc-7280754 .html