您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 计量经济学课件:第三章-多元线性回归模型
1第三章多元线性回归模型第一节多元线性回归模型及基本假定问题:只有一个解释变量的线性回归模型能否满足分析经济问题的需要?简单线性回归模型的主要缺陷是:把被解释变量Y看成是解释变量X的函数是前提是,在其它条件不变的情况下,并且,所有其它影响Y的因素都应与X不相关,但这在实际情况中很难满足。怎样在一元线性回归的基础上引入多元变量的回归?看教科书第72—73页关于汽车销售量的影响因素的讨论。一、多元线性回归模型的意义1、建立多元线性回归模型的意义,即一元线性回归模型的缺陷,多个主要影响因素的缺失对模型的不利影响。在一元线性回归模型中,如果总体回归函数的设定是正确的,那么,根据样本数据得到的样本回归模型就应该有较好的拟合效果,这时,可决系数就应该较大。相反,如果在模型设定时忽略了影响被解释变量的某些重要因素,拟合效果可能就会较差,此时可决系数会偏低,并且由于忽略了一些重要变量而对误差项的影响会加大,这时误差项会表现出一些违背假定的情况。2、从一个解释变量到多个解释变量的演变。一个生产函数的例子,一个商品需求函数的例子,(教材第74页)。二、多元线性回归模型及其矩阵表示1、一般线性回归模型的数学表达式。设12233iiikkiiYXXXui=1,2,3,…,n2在模型表达式里,1仍是截距项,它反映的是当所有解释变量取值为零时,被解释变量Y的取值;j(j=2,3,…,k)为斜率系数,它的经济含义:在其它变量不变的情况下,第j个解释变量每变动一个单位,Y平均增加(或减少)j个单位,这就是所谓的运用边际分析法对多元变量意义下回归参数的解释。因此,称j为偏回归系数,它反映了第j个解释变量对Y的边际影响程度。4、2、总体回归函数,即12233(|)iiikkiEYXXXX3、样本回归函数,即12233ˆˆˆˆˆiikkiYXXX4、将n个样本观测值代入上述表达式,可得到从形式上看,像似方程组的形式。并在此基础上,转化成矩阵表达的形式,即12233231122133111212223322212233122331,2,,ˆˆˆˆˆˆˆiiikkiiiiikikkkknnnkknniiikkiiiiiiiYXXXuYXXXinYXXXuYXXXuYXXXuYXXXYYeYYe样本观测数据:,,1112131122222322323112132223223111ˆˆˆˆˆ1ˆ11ˆkknnnnknknnnYXXXYXXXYXXXYXBUYXBeYYYYeYXXXXYXXYuuu又1112223ˆˆˆˆkknknkXeXeeXe3三、模型的基本假定在一元线性回归模型的基础上,可将在第二章中提出的基本假定平行地推到多元回归模型中去,但对多个解释变量之间还需做出新的假定。下面给出多元线性回归模型的基本假定(用矩阵表示)。1、零均值假定。2、同方差和无自相关假定。3、随机扰动项与解释变量不相关假定。),,2,1;0)E((0)E,,E(),,,E(E(U)),,,(U'1'21'21niuuuuuuuuuinnn221112122'212112212211212212()();1,2,,(,)()0;;,1,2,,()()()iiijijnnnnnnnnVaruEuinCovuuEuuijijnuuuuuuuuuuuuEUUEuuuEuuuuuuEuEuuEuuEuuEu2222221200()00I()()00nnnnEuuEuuEuuEu'11ov(,)(())(())(())()()()()0;1,2,,()00.()0;1,2,,iiiiiiiiiikiikiiiCXuEXEXuEuEXEXuEXuEXEuEXuinEXUuEuXuXEuEXuXEuEuin即44、无多重共线性假定。解释变量之间要求无多重共线性的意义。即对于解释变量iX之间,如果不存在不全为零的数23,,k,使得22330kkXXX成立。。5、正态性假定。iu独立同分布,且iu~N(0,σ2)第二节多元线性回归模型的估计一、参数的最小二乘估计1、构造残差平方和。设,,(1,2,3,,;1,2,3,,)jiiXYjkin为一组样本观测值,按残差的定义,有12222ˆˆˆˆˆ(),1,2,,iiiiiikkieYYYXXXin进一步得到残差平方和2212222ˆˆˆˆ()iiiikkiQeYXXX2、最小二乘准则。求kˆ,,ˆ,ˆ21,使得函数Q有最小值。按照极值原理,求上述函数关于参数的偏导数,得kjeQjij,,2,1,0ˆ)(ˆ2这样得如下正规方程组存在。即所以,行列式也应是满秩的:关系。此时矩阵之间不存在线性相关不为零,表明解释变量阶子行列式至少有如果该假定成立,-1''''X)X(,0XXX)rank(XXXX)X(kkkrank51222212222212222ˆˆˆˆ()0ˆˆˆˆ()0ˆˆˆˆ()0iiikkiiiikkiiiiikkikiYXXXYXXXXYXXXX注意方括号里的表示,即2000iiiikieeXeX用矩阵表示为'0Xe由回归模型的样本估计形式eBXYˆ对上式两端同时乘以'X,得'''ˆXYXXBXe因为'0Xe,所以得到如下表示BXXYXˆ``根据无多重共线性假定,这时有1)`(XX存在,从而解出Bˆ,得YXXXB`)`(ˆ1即参数估计的矩阵表达式。Bˆ中各分量就是参数的估计值,即'12ˆˆˆˆkB。这样,我们便得到样本回归模型12222ˆˆˆˆˆkkYXXX3、偏回归系数。对模型12222ˆˆˆˆˆkkYXXX中的参数估计值的解释。①jˆ(j=2,3,…,k)表明的是jX(j=2,3,…,k)对ˆY的边际6影响。②多元线性回归模型的标准化形式。由于出现在模型中各个变量的单位不尽一致,这时会对变量的边际解释带来干扰,因此,需要对变量进行标准化处理。对变量进行标准化变换可得到模型的标准化形式,用标准化形式能够真实地反映每一个解释变量对应变量的直接(边际)影响。标准化变换过程如下例如,基于下表的数据,用EViews软件计算得线性回归模型如下,其中Y表示家庭书刊消费水平,X表示家庭收入,T表示户主受教育年限。YXT4501027.28507.71045.29613.91225.812563.41312.29501.51316.47781.51442.415541.816419611.11768.8101222.11981.218793.21998.614660.8219610792.72105.412580.82147.48612.7215410890.82231.41411212611.8181094.23143.41612533624.6201223323,1,2,,iiikikiiiiikYXXXuYXXXin设变量得取值为:,,,***********2233,1,2.,1,2;2,3.,1,2.1,2,,jiijijiijyxiiiuiiikkiiYYXXyinxinjkssuuuinsyxxxuin令72ˆ50.01640.086552.3703(1.0112)(2.9442)(10.0670)0.9512146.2974..2.6057YXTRFDW下表为各变量描述统计的一些数字特征:YXTMean755.12221942.93312.16667Median637.35001989.90011.00000Maximum1253.0003624.60020.00000Minimum450.00001027.2007.000000Std.Dev.258.7206698.83253.944467Skewness0.7842660.7683740.552971Kurtosis2.2617013.2098922.075582Jarque-Bera2.2540341.8042381.558242Probability0.3239980.4057090.458809Observations181818下表为变量经过标准化后的回归估计结果:DependentVariable:YYMethod:LeastSquaresDate:10/21/01Time:20:38Sample:118Includedobservations:18VariableCoefficientStd.Errort-StatisticProb.XX0.2335110.0793122.9441860.0101TT0.7984400.07931210.067020.0000R-squared0.951235Meandependentvar8.59E-08DependentVariable:YMethod:LeastSquaresSample:118Includedobservations:18VariableCoefficientStd.Errort-StatisticProb.C-50.0163849.46026-1.0112440.3279X0.0864500.0293632.9441860.0101T52.370315.20216710.067020.0000R-squared0.951235Meandependentvar755.1222AdjustedR-squared0.944732S.D.dependentvar258.7206S.E.ofregression60.82273Akaikeinfocriterion11.20482Sumsquaredresid55491.07Schwarzcriterion11.35321Loglikelihood-97.84334F-statistic146.2974Durbin-Watsonstat2.605783Prob(F-statistic)0.0000008AdjustedR-squared0.944732S.D.dependentvar1.000000S.E.ofregression0.235090Akaikeinfocriterion0.093319Sumsquaredresid0.829012Schwarzcriterion0.241714Loglikelihood2.160133F-statistic146.2974Durbin-Watsonstat2.605783Prob(F-statistic)0.000000***ˆ0.23350.7984YXT可以看出,户主受教育时间的长短对家庭书刊消费水平的直接(边际)影响最大,其次才是家庭的收入,这一实证结论与现实情况一致。例如,分析房屋售价(PRICE)与住房面积(SQFT)、卧房间数(BEDRMS)、洗澡间数(BATHS)之间得关系。数据由下表给出
本文标题:计量经济学课件:第三章-多元线性回归模型
链接地址:https://www.777doc.com/doc-1199958 .html