您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > 第四章多元线性回归模型.
计量经济学Econometrics第四章多元线性回归模型2内容:●为什么要用多元模型●多元回归的最小二乘估计●最小二乘估计量的性质●统计检验与置信区间●预测第一节为何要用多元模型考虑下面的例子:某人试图解释一个人的工资水平的决定,为此,他找到的解释变量为受教育水平,于是他构造了如下的计量模型:wagei=α+βedui+μi(1)wagei—第i个人的工资水平;edui—第i个人的受教育水平;μi—随机扰动项。分析除教育水平外,我们很容易想到影响人们工资水平的还有工作经历。而工作经历则与受教育水平又相关。压力仅是砖头1的吗?砖头1砖头2如果为了测定砖头1对桌面的压力,应如何做呢?解决办法只要在模型(1)中加入新的变量即可,即模型变成如下形式:wagei=α+β1edui+β2experi+εi(2)experi—第i个人的工作经历。模型(2)把exper从误差项中取出,并明确地放到方程里。此时,β1就度量在exper不变的情况下,教育程度对工资的单纯影响。而模型(1)就必须假定工资经历与受教育程度无关,这个假定很牵强。应用多元线性回归模型的几个原因:第一,即使我们所关注的仅是一个解释变量X1对被解释变量Y的影响,但如果还存在其它解释变量X2、X3…等也对Y有影响,且同时与X1相关,那么此时就应将X2、X3…等一并引入模型,即建立如下新模型:Yi=α+β1X1i+β2X2i+β3X3i+…+μi(3)第二,提高预测准确度。如果我们要试图解释被解释变量Y的波动,显然,引入更多的解释变量可以使解释更准确,即预测Y更准确。第三,提高假设检验中所用“仪器”的准确度。比如,有时一个因素虽然与已有的解释变量无关,但你不将其“揪出来”放到模型中去,而将它看作随机扰动项的一部分,它就可能造成扰动项的异方差、自相关等问题。一个思考问题在cons=α+β1inc+β2inc2+μ中,边际消费倾向是多少?多元回归模型的构成12011220112201(|,,)kkkkkkEYXXXXXXYXXXYX或等价的,其中,称为被解释变量;称为解释变量;仍为随机干扰项;是截距项;,叫斜率参数或(偏)回归系数。习惯上:把常数项看成为一虚变量的系数,该虚变量的样本观测值始终取1。这样:模型中解释变量的数目为(k+1)多元回归模型的数据结构1011122111201122222201122........................kkkknnnkknnYXXXYXXXYXXX1121101121222221121(1)1(1)1...1........................1...kknnknnknnknkXXXYYXXXYXXX 1n矩阵表示121...nnYYYY112111222212(11...1...............1...kknnknnkXXXXXXXXXX) 01(1)1...kk121...nnUYXU回归模型的矩阵形式:是未知的待估参数。1(1)(1)11nnkknYXU则有多元模型的拟合如果拟合的结果记为因此,多元回归使我们能在非实验环境中进行自然科学家在受控实验中所能做的事情:保持其他因素不变。011221122211iˆˆˆˆˆ...,ˆˆˆˆ...,X,...,ˆˆ,kkkkkYXXXYXXXXYXceterisparibus因此,固定意味着即每个回归系数都具有()的解释,或称为(partialef比较fe静态偏效应ct)。样本回归模型01122ˆˆˆˆ......,1,2iiikkiiYXXXein样本回归函数的随机形式01122ˆˆˆˆˆ......iiikkiYXXX样本回归函数的确定形式iˆˆYejjiY为偏回归系数的估计量。为的条件均值的估计量,也是样本拟合值。为残差。1011122111201122222201122ˆˆˆˆ......ˆˆˆˆ............ˆˆˆˆ......kkkknnnkknnYXXXeYXXXeYXXXe121...nnYYYY112111222212(1)1...1...............1...kknnknnkXXXXXXXXXX 01(1)1ˆˆ.ˆ..ˆkk121...nneeeeˆˆˆYXeYX则,第二节多元回归的最小二乘估计一、多元线性回归的基本假设假设2:随机误差项具有零均值、同方差及无序列相关性假设1:解释变量是非随机的或固定的,{Y1,Y2……Yn}为SRS,总体模型是线性的:0)(iE22)()(iiEVar0)(),(jijiECovnjiji,,2,1,01122......kkYXXX假设3:解释变量与随机干扰项不相关Cov(,)01,2,=1,2njiiXjki其中;,假设4:解释变量之间不存在严格的线性相关性,即完全共线性(perfectcollinearity)假设5:随机干扰项服从正态分布2(0,)iN假设2—5可以用矩阵符号表示:假设2,假设3,E(X’U)=0,即11()()0()iiiiiikiikiiEXXEEXXE221122210()()0nnnnCovUEUUEI11()()0()nnEEUEE假设5,向量U服从多维正态分布,即在采用OLS进行参数估计时,不需要正态性假设。在利用参数估计量进行统计推断时,需要假设随机项的概率分布。2~(0,)nUNI假设4,rank(X)=k+1n假设1—4(正态性假设除外)也称为线性回归模型的经典假设或高斯(Gauss)假设,满足该假设的线性回归模型,也称为经典线性回归模型(ClassicalLinearRegressionModel,CLRM)。同时满足正态性假设的线性回归模型,称为经典正态线性回归模型(ClassicalNormalLinearRegressionModel,CNLRM)。最小二乘原理:根据被解释变量的所有观测值与估计值之差的平方和最小的原则求得参数估计量。即使残差平方和最小的参数估计量。二、多元线性回归的最小二乘估计(,),1,2,;0,1,ijiYXinjk——已知目标01122ˆˆˆˆˆ......iiikkiYXXX下面给出两种OLS估计量的表示2n22ii011ikki11i1ˆˆˆˆYX...XiinniiRSSeYYni011ikki0i1ni011ikki1i1i1ni011ikkikii1RSS0ˆˆˆ2YX...X10ˆRSSˆˆˆ02YX...XX0ˆRSSˆˆˆ02YX...XX0ˆkRSS最小化的一阶条件:1.偏导数法ni011ikkii1ni011ikki1ii1ni011ikkikii1ˆˆˆYX...X0ˆˆˆYX...XX0ˆˆˆYX...XX0e0i即je0j1,2,3,......,kiiXnn011ikkiii1i1nn011ikki1i1i1i1nn011ikkiii1i1ˆˆˆX...XYˆˆˆX...XYˆˆˆX...XYiikikiXXXXnnn011ikkii11i1nnnn201i11ikki1ii1i111i1nnnn20ki11ikikkiiki111i1ˆˆˆX...XYˆˆˆXX...XXYXˆˆˆXXX...XYXiiiiiiiin正规方程组:01122ˆˆˆˆkkYXXX由第一个方程,可得nnn011ikkii11i1nnnn201i11ikki1ii1i111i1nnnn20ki11ikikkiiki111i1ˆˆˆX...XYˆˆˆXX...XXYXˆˆˆXXX...XYXiiiiiiiinnn1iki11nnn21i1iki1i111X......XXX......XX..............................................................................................................................iiiiin 0111211nnn2i1ikiki111ˆ11......1ˆ..................................................................ˆXXX......XnkkiiiXXX 1212n.........................................................................................................kkknYYXXXY nn1iki11nnn21i1iki1i111X......XXX......XX..............................................................................................................................iiiiin nnn2i1ikiki111....................................XXX....
本文标题:第四章多元线性回归模型.
链接地址:https://www.777doc.com/doc-2093248 .html