您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 金融资料 > 清华大学五道口金融学院潘文卿第三章多元线性回归模
第三章多元线性回归模型**多元线性回归模型是我们课程的重点,原因在于:多元线性回归模型应用非常普遍;原理和方法是理解更复杂计量经济学模型的基础;内容较为丰富。从而,我们应不遗余力地学,甚至是不遗余力地背!!!本章主要内容多元线性回归模型的描述参数的OLS估计OLS估计量的有限样本性质参数估计量的方差-协方差矩阵和随机误差项方差2的估计单方程模型的统计检验多元线性回归模型实例§3.1多元线性回归模型的描述1、多元线性回归模型的形式由于在实际经济问题中,一个变量往往受到多个原因变量的影响;“从一般到简单”的建模思路。所以,在线性回归模型中的解释变量有多个,至少开始是这样。这样的模型被称为多元线性回归模型。多元线性回归模型参数估计的原理与一元线性回归模型相同,只是计算更为复杂。以多元线性回归模型的一般形式——K元线性回归模型入手进行讲解,其模型结构如下:Y=x11+x22+…+xkk+(1)其中,Y是被解释变量(因变量、相依变量、内生变量),x是解释变量(自变量、独立变量、外生变量),是随机误差项,i,i=1,…,k是回归参数。线性回归模型的意义在于把Y分成两部分:确定性部分和非确定性部分。在研究中,我们根本无法了解式(1)所示的总体模型的特征,而只能通过样本特征来近似考察。设经过n次试验,得到n个样本,如下所示:y1x11x12…x1ky2x21x22…x2k……ynxn1xn2…xnk从而得到表达式如下:Yi=xi11+xi22+…+xikk+i(2)其中,式(1)称为总体线性模型;式(2)称为样本线性模型。在计量经济学分析中,通常会借助矩阵工具,在此亦将多元线性模型表示成矩阵形式,以便于下一步的数学运算。)1n(n21)1(21)n(nn1n22211111)1n(n21kkkkjkjkjxxxxxxxxxyyy(3)写成一般形式为:Y=X+(4)针对式(4),在这里主要讲参数估计和统计推断,但在此之前,我们要先回顾一下什么模型才是多元线性回归模型,即了解线性回归模型的6大假设,这一点十分重要。(1)线性性。即要求模型关于参数是线性的,关于扰动项是可加的。(2)满秩。说明解释变量之间是线性无关的,这一假设很重要,在后面会经常受到。(3)回归性。x与不相关。(4)x的DGP是外生的。x相对于y是外生的,是非随机的。(5)球形扰动。同方差性和非自相关性。(6)正态假设。2、多元回归方程及偏回归系数的含义称为多元回归方程(函数)。多元回归分析(multipleregressionanalysis)是以多个解释变量的固定值为条件的回归分析,并且所获得的是诸变量X值固定时Y的平均值。诸i称为偏回归系数(partialregressioncoefficients)。在经典回归模型的诸假设下,对(1)式两边求条件期望得E(Y|X1,X2,…Xk)=x11+x22+…+xkk偏回归系数的含义如下:1度量着在X2,X3,…,Xk保持不变的情况下,X1每变化1个单位时,Y的均值E(Y)的变化,或者说1给出X1的单位变化对Y均值的“直接”或“净”(不含其他变量)影响。其他参数的含义与之相同。例:其中,Ct=消费,Dt=居民可支配收入Lt=居民拥有的流动资产水平β2的含义是,在流动资产不变的情况下,可支配收入变动一个单位对消费额的影响。这是收入对消费额的直接影响。收入变动对消费额的总影响=直接影响+间接影响。(间接影响:收入流动资产拥有量消费额)但在模型中这种间接影响应归因于流动资产,而不是收入,因而,β2只包括收入的直接影响。在下面的模型中:这里,β是可支配收入对消费额的总影响,显然β和β2的含义是不同的。偏回归系数bj就是xj本身变化对y的直接(净)影响。ttttuLDC321βββntuDCttt,...,2,1,需要说明的是,如果令x1≡1,则1便是常数项。习惯上把常数项看成为一个虚变量的系数,在参数估计过程中该虚变量的样本观测值始终取1。通常,一定要假设在模型中有常数项,即尽量让模型包含常数项,以中心化误差。§3.2参数的OLS估计•参数的OLS估计附录:极大似然估计和矩估计投影和投影矩阵分块回归和偏回归偏相关系数我们的模型是:iKKi1iiiiXβ....XβYYYeˆˆˆ1残差为:一、参数的OLS估计普通最小二乘估计原理:使样本残差平方和最小Y=x11+x22+…+xkk+关键问题是选择的估计量b(或),使得残差平方和最小。βˆ要使残差平方和22ˆˆiKKi11iiXβ...XβYeQ0ˆ...,,0ˆ1KQQ于是得到关于待估参数估计值的K个方程(即正规方程组):为最小,则应有:按矩阵形式,上述方程组可表示为:iik2iKKi1ik1ii2iKi2Ki1i21ii1iKi1K2i11YXXβ......XXβ........................YXXXβ......XXβYXXXβ......Xβ)'(XXβ'XY即YXXX'β)'(nnKKKnnk212iKi1iKiKi12i1YYYXXXXXXXXXβ...ββXXXXXX........................ˆˆˆ........................21212221212111=YYeeene...21上述结果,亦可从矩阵表示的模型出发,完全用矩阵代数推导出来。uXYβXY其中:残差可用矩阵表示为:残差平方和)()(YYYY)β()β(XYXY)β)(β(XYXYββββXXXYYXYYnnieeeeeeeeeQ......21212注意到上式中所有项都是标量,且β)ˆ(XYYXβββ2XXYXYYQ0β)(eeYXXXβYXXX1)(β与采用标量式推导所得结果相同。因为x是满秩的(假设2),所以(X‘X)-1存在。所以,得到的估计为用向量展开或矩阵微分法(前导不变后导转置),我们可得到关于待估参数估计值的正规方程组:令故注:这只是得到了求极值的必要条件。到目前为止,仍不能确定这一极值是极大还是极小。接下来考察求极值充分条件。注意到上述条件只是极小化问题的必要条件,为了判断充分性,我们需要求出目标函数的Hessian矩阵:如果这个Hessian矩阵是正定的,则可以判断所得到的解是唯一的最小二乘解。显然,根据正定矩阵的定义或者正定矩阵的判断准则,可知当矩阵的满秩条件满足时,矩阵是正定的,因此最小二乘解的充分性成立。从而,OLS估计量为:XX2ˆˆ)ˆ(2QYXXX1)(β样本回归线的数值性质对于线性模型和相应的最小二乘估计,则有:(1)最小二乘残差的和为零。即01niie(2)回归超平面通过数据的均值点,即bxy(3)从回归方程中获得的拟合值的均值等于样本观测值的均值,即yyˆ需要注意的是,上述命题成立的前提是线性模型中包含常数项,也就是第一个解释变量是“哑变量”形式。这样一个思考题目就是,当线性模型中不包含常数项时,结论是什么样的?证明:(1)根据正规方程,可知:0)(eXXbyXyXXbX这说明对于矩阵X的每一列kx,都有0exk,由于矩阵X的第1列中都是1,所以得到(因此这条性质成立的前提条件是回归模型中包含常数项):0),,,)(1,,1,1(121niineeee(2)正规方程0yXXbX表示为矩阵形式为:nTnKnKKKnKnKKTnKnKKyyyxxxxxxbbbxxxxxxxxxxxx2122221122122221122222112111111111将上述矩阵方程的第一个方程表示出来,则有:niiKniiKniiniiybbbxxx12111211根据数据的样本均值定义,则有:niiKniiniixnxnxn112111,,1,1x也即:bxy(3)的证明方法1因为Σei=0,所以对两边求和即可。eyy方法2根据拟合值的定义bXyˆ,有yXXbXYX)XX(XXYˆX1则有:nTnKnKKnTnKnKKyyyxxxxxxyyyxxxxxx212222112212222112111ˆˆˆ111上述矩阵方程的第一个方程可以表示为:niiniiyy11ˆ则有:yyˆ附录:极大似然估计对于一元线性回归模型:iiiXY10i=1,2,…n随机抽取n组样本观测值iiXY,(i=1,2,…n),假如模型的参数估计量已经求得到,为0和1,那么iY服从如下的正态分布:iY~),ˆˆ(210iXN于是,iY的概率函数为2102)ˆˆ(2121)(iiXYieYPi=1,2,…,n回忆一元线性回归模型将该或然函数极大化,即可求得到模型参数的极大或然估计量。因为iY是相互独立的,所以Y的所有样本观测值的联合概率,也即或然函数(likelihoodfunction)为:),,,(),ˆ,ˆ(21210nYYYPL21022)ˆˆ(21)2(1iinXYne由于或然函数的极大化与或然函数的对数的极大化是等价的,所以,取对数或然函数如下:2102*)ˆˆ(21)2ln()ln(iiXYnLL对L*求极大值,等价于对210)ˆˆ(iiXY求极小值:0)ˆˆ(ˆ0)ˆˆ(ˆ21012100iiiiXYXY同理,分析多元线性回归模型Y的随机抽取的n组样本观测值的联合概率)ˆ()ˆ(21))ˆˆˆˆ((212122222211022)2(1)2(1),,,(),ˆ(XYXYeeyyyPLnxxxynnnkikiiin对数似然函数为参数的极大似然估计结果与参数的普通最小二乘估计相同LLnLnLn*'()()()()2122YXYX()XXXY1附录:矩估计(MomentMethod,MM)矩估计是基于实际参数满足一些矩条件而形成的一种参数估计方法。随机变量的均值和方差如何得到?例:总体:E(Y-μ)=0样本矩(用样本矩估计总体矩):满足相应的矩条件:ˆT1tt0)ˆ(YT1同理,方差的估计量是样本的二阶中心矩。现在,考虑一元线性回归模型中的假设条件:0)E(x0)(Ettt其所对应的样本矩条件分别为:T1tT1tt10tt0)xb-b-(yT1ˆT1T1tT1tt10tttt0)xbby(xT1ˆxT1可见,与OLS估计量的正规方程组是相同的。多元线性
本文标题:清华大学五道口金融学院潘文卿第三章多元线性回归模
链接地址:https://www.777doc.com/doc-244899 .html