您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 【西南财大课件计量经济学】JLJJ四章
12重点与难点:多重共线性的概念及经济意义;不同程度多重共线性的后果;多重共线性的诊断思路,与异方差性、自相关性的区别;多重共线性的补救措施(思路、做法),与异方差性、自相关性的区别。教学要求(目的):本章讨论违背古典假定(多重共线性)时,线性回归模型的建立。通过本章的学习要求:掌握多重共线性的概念;模型中出现多重共线性的不良后果;掌握诊断多重共线性的若干方法;掌握修正多重共线性的若干方法;根据本章知识,能够独立解决模型中的多重共线性问题。3回顾6项基本假定:(1)解释变量间不相关(无多重共线性)(2)E(ui)=0(随机项均值为零)(3)Var(ui)=(同方差)(4)Cov(ui,uj)=0(随机项无自相关)(5)Cov(X,ui)=0(随机项与解释变量X不相关)(6)随机扰动服从正态分布24问题的提出:•在前述基本假定下,OLS估计具有BLUE的优良性。•然而实际问题中,这些基本假定往往不能满足,使OLS方法失效,不再具有BLUE特性。•估计参数时,必须检验基本假定是否满足,并针对基本假定不满足的情况,采取相应的补救措施或者新的方法。•对基本假定是否满足的检验称为计量经济学检验。5不满足基本假定的情形(1)1、通常不会发生随机扰动项均值不等于0的情形。若发生也不会影响解释变量的系数,只会影响截距项。2、随机扰动项正态性假设一般能够成立,就算不成立,在大样本下也会近似成立。(所以不讨论以上假定是否违背的问题)6不满足基本假定的情形(2)4、随机扰动项相关=序列自相关——时间序列数据经常出现序列相关性。则称模型存在多重共线如果这一假定不满足,存在。)(即无关的的各列向量之间是线性矩阵的基本假定是中,对在多元线性回归模型-1''XX0,|XX|),()(:X:nkkXrXXY3、解释变量之间相关=多重共线5、随机扰动项方差不等于常数=异方差——截面数据时,经常出现异方差7第五节解决多重共线性实例第一节什么是多重共线性第二节多重共线性产生的后果第三节多重共线性的检验第四节多重共线性的补救措施主要内容8先从两个实例谈起例1:某地区为研究不同家庭的消费Y与收入X2的关系,在此基础上,还引进了消费者家庭财富状况X3作为第二个解释变量。模型为:9531.02RSE=(6.7525)(0.8229)(0.0807)t=(3.6690)(1.1442)(-0.5261)F=92.4020例2:某国家分折汽车保养费用支出Y(元)与汽车的行程数X2(公里)以及汽车拥有的时间X3(周)的关系。建立如下模型:946.02RSE=(121.50)(28.79)(21.41)t=(0.06)(0.958)(-7.06)320424.09415.07747.24ˆXXY325.1516158.2729.7ˆXXY第一节什么是多重共线性注:例2中X3的t值大,但X3的系数符号与经济意义不符号。原因?注:例1中X2、X3的t值小。且X3的系数符号与经济意义不符号。原因?9式中:是不全为0的常数,则称解释变量之间存在完全多重共线性。ikikiiiuXXXY33221uTNSC332103322kkXXXk、、、32一、多重共线性的定义(表现为两种情形)(一)完全的多重共线性线性回归模型中的若干解释变量或全部解释变量的样本观测值之间具有某种严格的线性关系。即对于一般线性回归模型各解释变量的样本观测值之间存在一个或多个如下的关系式例如,设有回归模型uTNSC4321其中:C为居民个人消费;S为个人工资收入;N为非劳动收入;T为总收入因为NST所以解释变量之间存在完全共线性。101032232322rXXXXXXkkk之间的相关系数,,与即:)上式为,如设线性组合,即线性函数成其它解释变量的精确以写某个(或某些)解释可完全多重共线性意味着完全代替。的作用可由对。关系数为的相与的常数),这时是不为(例如23232310:XYXXXXX11),表出以由其余的列向量线性可中,至少有一个列向量(或:向量矩阵异的,其逆矩阵不存在是奇),矩阵,(即于不再是列满秩的,秩小阵的系数矩共线性,正规方程组中线性变量之间存在完全注:0)(XXXXXkXRankkX性)。估计量所具有的统计特(但这些解不具有解。。正规方程有无穷多个将不能唯一解出)(故由正规方程组:OLSYXXXXXYXˆˆˆ112称解释变量之间存在着近似(不完全)多重共线性。03322uXXXkk(二)近似(不完全)多重共线性(实际中多为此情况)若解释变量之间满足近似线性关系:例如,用时间序列数据建立回归模型时,由于许多经济变量都有随时间的推移而同方向变动的特征,往往使得解释变量之间也具有很高的线性相关性;例如,影响家庭消费支出的家庭收入和家庭财富两个变量之间就存在明显的高度相关关系(但不是完全线性相关关系);例如,影响企业产出的劳动投入和资本投入二者之间也往往具有相当高的相关关系,但也不是完全线性相关关系.。的相关系数近似等于与这时重共线性,的常数)存在不完全多是不为(例如,102323XXuXX13相当差)。(但该估计量的准确性的最小二乘估计量。)的逆存在。即可求阵(非奇异,矩又列满秩了,矩阵阵正规方程组中的系数矩性,变量之间存在近似共线若线性回归模型的解释注:XXXXX注意:解释变量之间无多重共线性,是指解释变量之间不存在线性相关性,但并不排除解释变量之间存在非线性关系。对角线元素较大),(-1''XX0|XX|14二、产生多重共线性的背景1、趋同性:经济变量在时间上常存在共同的变化趋势(时间序列数据)例如,宏观经济处于上升阶段时,国内生产总值增长,净出口也增长;例如,经济的增长带动了收入的增长,随之使商品销售额有所增长,相应地市场利率,零售物价指数,储蓄额等变量也会发生变化。如将这些变量作为解释变量引入模型,它们之间极有可能存在很强的相关性2、经济变量之间本身具有内在联系(截面数据建模)例,利用截面数据来研究企业生产函数时,从投入的要素看,资本投入、劳动力投入等,都与企业的生产规模密切相关(较大的企业,资本投入和劳动力投入都会较多,反之较少。因此,资本投入与劳动力投入之间几乎是高度线性相关的,它们之间往往存在严重的多重共线性。153、模型中大量地采用滞后变量也易产生多重共线性(同一变量的逐次值在经济性质上无区别,一般都存在相互关系)例如,在研究消费函数Y的时候,如果记可支配收入为X,若在模型中引入本期可支配收入,还考虑了以往各期的可支配收入,那么同一变量的前后期之值极有可能是高度线性相关的,故可能产生多重共线性。4、建模时由于认识的局限性,也易产生多重共线性1)数据资料的来源(如数据来源于年鉴,数据并非研究总体的全部)2)变量的选择不当例如,在分析建立某省粮食产量Y线性回归模型时,考虑引入解释变量:化肥X2、灌溉面积X3、农业生产资金投入X4(在X2、X3和X4之间存在很强的相关性,由于化肥使用量和灌溉面积(兴修水利的结果)都受农业资金投入的影响)。(思考:是否可以去掉农业生产资金投入变量X4?)例如,做电力消费Y对收入X2、住房面积X3的回归时(高收入的家庭一般都比低收入家庭有较大的住房面积这样一种有形的约束);有的学者认为多重共线是一个数据、样本的问题。161、参数估计值的不确定性uxxy3322uXXY33221uxxy3322第二节多重共线性产生的后果一、完全多重共线性产生的后果例:二元线性回归模型:模型的离差形式为:用普通最小二乘法,得参数估计量的正规方程为:yxxxxyxxx32333222233222ˆˆˆˆ估计量分别为:的和解方程,可得OLS321723223223232322)())(())(())((ˆxxxxxxyxxyx23223223222233)())(())(())((ˆxxxxxxyxxyx)(00)(00(不定式)分子、分母均为的、,则例如设:关如两个解释变量完全相0ˆˆ3223xx的数值。、则无法确定32ˆˆ量的作用)分辨各解释变量对因变的估计值(即不能独立、),而无法得到(的估计值表明只能给出综合参数)(可写为:,实际上,在这种情形下323222323322ˆˆˆuxuxyuxxy182、参数估计值的方差无限大的方差为:和由第三章得32ˆˆjjjcVar2)ˆ()列的元素。)行(的()为(不含截距项,列的元素;行的)为(,含截距项所不同)随方程是否含截距项有中(注:11)ˆ(1112jjXXcjjXXcjjccVarjjjjjjjjj1922323223232232211xxxxxxxxxxXX)()因为(23xx如:设)()()()()(的方差等于:22322223222322322232232232223221222211ˆˆrxxxxxxxxxxxxxXXVar222222222222220)()()()ˆ(xxxxxxVaruxxy3322在完全多重共线性条件下:20232232222233)()ˆ(ˆxxxxxVar的方差为:同理:易得)1(223232x)ˆ(3Var且:21小结:完全多重共线性产生的后果1、参数估计值的不确定性的唯一解。、无法得到)(合的唯一解:只能得到系数的线性组)(如设32322323322ˆˆˆˆˆ23uxyuxxyxx)ˆ(jVar2、参数估计值的方差(标准差)无限大?ˆˆ:22232332223作用对因变量来解释能否用系数)(如问题设yxuxyuxxyxx22(二)不完全多重共线性产生的后果1、可以估计参数,但参数估计不稳定946.006.7958.006.041.2179.2850.1215.1516158.2729.7ˆ232RtseXXY)()()()()()(例:某国家分折汽车保养费用支出(元)与汽车的行程数(公里)以及汽车拥有的时间(周)的关系。建立如下模型:;汽车每周的行程公里数—其中:2X拥有汽车的时间—3X尽管X3的t值较显著,但它的系数符号与经济意义不一致。计算出X2与X3的相关系数为0.9960,表明汽车的行程数与拥有汽车的时间呈高度的线性相关。意义相违背的情况)。难以置信或符号与经济(甚至出现回归系数值化敏感变化大,参数估计值变),(量除一个不显著的解释变删本容量稍有增、减样本数据稍有变化或样程求解参数估计值,但可由正规方非奇异,,件下在不完全多重共线性条1)(,0||XXXXXX23的常数)是不为(线性,有关系之间存在不完全多重共与假定02323uxxxxyxyxxxxxxxxxxx322232322323223221)()不相关(与);()(为随机项,且其中:00022iiiiuxuxuuEu222222222222222222222222223223223322232)(ˆxuuyxuyxxuxxxuyyxuxyxxxxxyxxxyxxii)()())(()(注:YXXX')'(1321ˆˆˆˆ242、估计量的方差增大23223222322)()ˆ(xxxxxVar)1(223
本文标题:【西南财大课件计量经济学】JLJJ四章
链接地址:https://www.777doc.com/doc-1129858 .html