您好,欢迎访问三七文档
多元回归分析CH414.1从一元到多元在一元回归分析中,只有一个自变量。隐含的前提是,影响因变量的主要因素只有一个,其它影响都是随机性的。经济变量之间的关系往往涉及到多种因素和多个变量。一个经济变量的影响因素往往不止一个。24.2例子:消费的影响因素在第2章中的消费函数是这里我们默认工资是唯一重要的影响因素如果把非工资性收入加入模型,则消费函数为这使得我们在研究工资收入对消费的影响时,可以剥离非工资性收入的影响。反之亦然。312ConsumWageu123ConsumWageE-IncomeuE-Income4.3多元回归模型的OLS方法第2章总体回归函数可以推广到多元函数(PRF)或变量分别记为,用来表示恒取1的“变量”。每次观察实际上是维空间的一个点4122kkYXXu122()kkEYXX2(,,,)iikiYXX2,,kXX1X4.3.1残差平方和寻找超平面,使散点与它的纵向距离最小如果超平面记为则残差(散点到平面的纵向距离)为残差平方和为5122ˆˆˆkkYXX122ˆˆˆˆˆiiiiikkiuYYYXX21221ˆˆˆ()niikkiiSRSSYXX4.3.2正规方程残差平方和最小的必要条件6122111222121221ˆˆˆ2()(1)0ˆˆˆˆ2()()0ˆˆˆˆ2()()0ˆniikkiiniikkiiiniikkikiikSYXXSYXXXSYXXX4.3.3正规方程有唯一解的条件矩阵的秩为,其中712(,,,)kXXXXk213112232223111kknnknXXXXXXXXXXi.e.||0XX4.3.4正规方程的解当n=3时,正规方程的解为(小写字母:离差)8122332233232222232323222332222323ˆˆˆ()()()()ˆ()()()()()()()ˆ()()()iiiiiiiiiiiiiiiiiiiiiiYXXyxxyxxxxxxxyxxyxxxxxxx4.4多元CLRM的假设为了保证多元回归OLS估计量具有良好的性质,并利用样本回归函数(SPF)推测总体回归函数(PRF)的性质,需要对多元回归模型做适当的假设。这些假设与一元回归模型是类似的。但要增加一个假设:自变量之间不存在完全共线性。94.4.1线性假设(参数线性)假设1:因变量与自变量具有线性关系即存在形如的方程准确地描述了变量之间的关系。这就是总体回归函数(PRF)。或写成10122kkYXXu122()kkEYXX4.4.2自变量不是随机变量假设2:自变量是非随机的:在重复抽样的过程中,每个自变量的取值保持不变。该假设帮助我们理解“重复抽样”情形下OLS估计量的分布规律,判断OLS估计量的“优劣”。11X(2,,)jXjk4.4.3误差项均值为零假设3:给定自变量,随机误差项的均值为0,即该假设与等价,其直观含义是,因变量在其均值的上下“波动”,均值是“波动”的中心。122,,kXX2122(|,,)kkkEYXXXXiu2(|,,)0ikEuXX4.4.4同方差假设假设4:误差项的方差相等,即的条件方差是常数,亦即该假设的含义是,对于不同自变量,扰动项的“波动幅度”是相同的,对应的因变量有相同的“波动幅度”——方差。1322var()()iiuEuiuiuiY4.4.5误差项无自相关假设5:各个误差项之间无自相关。对任意的,和之间的相关系数为0,即14ijiujucov(,)0ijuu4.4.6无完全共线性假设6:解释变量之间不存在完全共线性,或者说,任何一个解释变量不能表示成其他解释变量的线性函数。等价的表述是向量组线性无关1512(,,,)kXXX4.5高斯-马尔科夫定理如果以上假设(1-6)成立,则最小二乘(OLS)估计量是最优线性无偏估计量。最优的含义是,在所有线性无偏的估计中,最小二乘估计量的方差最小。满足假设(1-6)的回归模型称为经典线性回归模型,简称CLRM。164.6OLS估计量的BULE性质假设1-6满足时,OLS估计量是1.线性的(linear):因变量的线性函数。2.无偏的(unbiased):估计量的均值或数学期望等于真实的参数。即3.最优的或有效的(Bestorefficient):如果存在其它线性无偏的估计量,其方差必定大于OLS估计量的方差。17ˆ()iiE4.7误差项的正态性假设为了获得OLS估计量的分布,还需要增加如下假设假设7:误差项服从正态分布该假设与一元回归模型类似,其合理性由中心极限定理来保证。182(0,)iuN4.8OLS估计量的抽样分布在假设1-7下,OLS估计量服从正态分布该结论是假设检验的基础194.9学生t-分布如果假设(1-7)成立,则其中是的估计量:后者可用误差项的标准差来表示,但是未知的,用其无偏估计量(等于参数的个数)来代替,则得到。20ˆˆ()iinkitse2ˆiunk2ˆ()se2ˆ()sek2ˆ()set-分布(df较大)接近正态分布21-6-4-2024600.050.10.150.20.250.30.350.4T.DISTNORM.DIST4.11假设检验假设检验的原理:在零假设下计算统计量,如果统计量“异常”,则拒绝零假设。零假设就是对我们关心的参数“赋值”,这也是统计量计算的前提。由样本数据得到的统计值是一次实验的结果,“异常”是指该结果是“小概率”事件。224.12由SRF推断PRF利用26个家庭(Data2-1)的数据,把非工资收入和工资收入同时作为解释变量,得到消费的回归方程:为了验证非工资收入对消费的影响,需要检验总体消费函数(PRF)中E-Income的系数是否为零。2321490.668Wage0.685E-Incomese=(0.0587)(0.119)Y3X2X3t统计量的计算如果成立,则当前的样本242322322ˆˆ(26323)ˆˆ()()tsese03H:033ˆ0.6855.76ˆ0.119()tse23pr.(||2.069)0.05t4.13选取显著性水平选取,则(查表)从而是小概率事件,拒绝零假设犯第类错误的概率小于事实上,拒绝原假设几乎不会犯错误。2523pr.(||2.069)0.05t5%{||5.76}t5%Ipr.(||5.76)7.236tE0H4.14单边检验若预期,我们对犯第类错误的概率有新的评估。作双边检验时,是拒绝区域。作单边检验时如果,的估计量是绝对值较大的负数,从而判断,接受零假设。拒绝区域变成单尾。犯第类错误的概率修正为双边检验的一半。如果,拒绝,犯错概率小于或等于2.5%。本例犯错概率小于26||2.069t30I3ˆ302.069tI32.069t0H3.626E4.15单边检验的拒绝区域27拒绝域4.15置信区间由得到我们有95%的把握断言,区间包含,称它为的置信区间。2823pr.(||2.069)10.95t333ˆpr.2.0692.0690.95ˆ()se3pr.0.440.930.95[0.44,0.93]334.16拟合优度拟合优度用于度量样本回归线拟合样本点(散点)的好坏程度拟合优度本质上就是在多大程度上能用自变量解释因变量的变化或者说因变量的变动有多大“比例”来源于自变量的变动294.17因变量变异的分解恒等式即的总变异中能用解释的比例是30ˆˆˆˆ()()()1,2,,iiiiiiYYYYYYYYuin222111ˆˆ()()nnniiiiiiYYYYuTSSESSRSSY/ESSTSS4.18拟合优度的定义很显然,拟合优度为0则表明自变量对因变量没有任何解释力,为1时则意味着样本回归线通过所有的样本点。3121ESSRSSRTSSTSS201R4.19校正拟合优度增加一个自变量,拟合优度增加。增加一个自变量损失一个自由度(正规方程多一个方程),但这种“不利影响”没有体现在拟合优度中。我们需要一个指标,它能“权衡”增加自变量的“得失”。324.20校正拟合优度的定义拟合优度的本质:被自变量解释的比例?或多大的比例是误差导致的?的方差分别用无偏估计量来代替:得到33var(),var()1RSSTSSuYnkn221111(1)RSSnnRRnkTSSnk2var()1var()uRY&uY4.21校正拟合优度增加的条件上式中是自变量的个数(含常数项)增加新变量导致校正拟合优度增加的充要条件是:新变量对应的t统计量的绝对值大于1。34k4.22拟合优度与校正拟合优度如果分别用有用其有偏估计量代替:就得到先前的拟合优度:35&uYvar(),var()RSSTSSuYnn21RSSESSRTSSTSS4.23联合检验-检验主要用于检验某个系数的显著性,但有时需要检验一组条件是否成立,这就是联合检验。基本思路是比较受限模型和非受限模型的拟合优度(或残差平方和),如果拟合优度(残差平方和)“变化较大”,则约束“失当”,拒绝零假设(受限模型成立)。36t4.24瓦尔德检验非受限和受限模型分别为限制条件是瓦尔德检验的步骤:计算两个回归方程的残差平方和与,再构造如下统计量:37111(U)mmmmkkYXXXu122(R)mmYXXu012H:0mmkURSSRRSS(4.14)据假设,分子分母均服从卡方分布,故若统计量异常,拒绝,称联合显著。针对联合假设的检验称为瓦尔德检验。3822222()/[()]/[()]()/()(1)/()RUcUURURSSRSSkmFRSSnkRRkmRnk,ckmnkFF1,,mk0H4.25瓦尔德检验的直观解释由(4.14)可见瓦尔德检验的直观含义:如果加上约束条件(去掉一些自变量)后,拟合优度变化不大,说明这些变量无关紧要,是联合不显著的;如果拟合优度变化较大,则它们作为一个“集体”对被解释变量是有影响的,是联合显著的。394.26F分布的拒绝区域40012345600.10.20.30.40.50.60.70.80.91Fdensityfunction4.15%4.15%4.15%FDistributiondf=(2,10)拒绝域4.27瓦尔德检验的特殊情形时,瓦尔德检验就是整体显著性检验,原假设变为:所有自变量系数为零。统计量变为总体显著性检验等价于拟合优度为零的检验411m0H22/(1)/(1)/()(1)/()UUcUUESSkRkFRSSnkRnk4.28例子:房屋价格的影响因素利用DATA4.1,考虑回归模型(4.16)其中3个自变量分别是面积、卧室数量、浴室数量。检验卧室和浴室数量的联合显著性。零假设是,上述方程和受限方程的拟合优度分别是与由(4.14)计算得到统计量:421234PriceSqftBedroomsBaths+u034H:020.835976UR20.820522RR查表:由于,不能拒绝零假设。即使选择显著性水平,也不能拒绝零假设:故是联合不显著的。4.22中的F分布图有助于理解联合检验。43(0.8359760.820522)/20.471(10.835976)/(
本文标题:计量经济学ch4.
链接地址:https://www.777doc.com/doc-2046010 .html