您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 销售管理 > 多元线性回归三大问题
§4.1异方差性§4.2序列相关性§4.3多重共线性§4.4随机解释变量问题第五章经典单方程计量经济学模型:放宽基本假定的模型基本假定违背主要包括:(1)随机误差项序列存在异方差性(2)随机误差项序列存在序列相关性(3)解释变量之间存在多重共线性(4)解释变量是随机变量且与随机误差项相关的随机解释变量问题(5)模型设定有偏误(6)解释变量的方差不随样本容量的增加而收敛本章主要学习:前4种基本假定违背§4.1异方差性一、异方差的概念二、异方差的类型三、实际经济问题中的异方差性四、异方差性的后果五、异方差性的检验六、异方差的修正七、案例对于模型ikikiiiiXXXY2210如果出现:即对于不同的样本点,随机误差项的方差不再是常数,而互不相同,则认为出现了异方差性(Heteroskedasticity)。一、异方差的概念(i=1,2,…,n)Varii()s=2二、异方差的类型异方差一般可归结为三种类型:(1)单调递增型:si2随X的增大而增大(2)单调递减型:si2随X的增大而减小(3)复杂型:si2与X的变化呈复杂形式三、实际经济问题中的异方差性实际经济问题中,易出现异方差的情况:例4.1.1:截面资料下研究居民家庭的储蓄行为:Yi=0+1Xi+i其中:Yi:第i个家庭的储蓄额Xi:第i个家庭的可支配收入。i的方差往往随Xi的增加而增加,呈现单调递增型变化。例4.1.2,以绝对收入假设为理论假设、以截面数据为样本建立居民消费函数:Ci=0+1Yi+i将居民按照收入等距离分成n组,取每组平均数为样本观测值。一般情况下,居民收入服从正态分布:中等收入组人数多,两端收入组人数少。而人数多的组的平均数的误差小,人数少的组平均数的误差大。所以样本观测值的观测误差随着解释变量观测值的不同而不同,往往引起异方差性。本例中,i的方差随解释变量X(收入)的观测值的增大而呈U形变化,是复杂型的一种。例4.1.3,以某一行业的企业为样本建立企业生产函数模型:被解释变量:产出量Y解释变量:资本K、劳动L、技术A,123iiiiieYAKL经验表明:对采用截面数据作样本的计量经济学问题,由于在不同样本点上解释变量以外的其他因素的差异较大,所以往往存在异方差。出现异方差的原因是因为中包括了测量误差和模型中被省略的一些因素对因变量的影响。四、异方差性的后果计量经济学模型一旦出现异方差性,如果仍采用OLS估计模型参数,会产生下列不良后果:1.参数估计量非有效OLS估计量仍然具有线性性,无偏性,但不具有有效性(最小方差)。即异方差性违反了OLS假定,故模型不能再用OLS估参。因为在有效性证明中利用了E(’)=s2I而且,在大样本情况下,尽管参数估计量具有一致性,但仍然不具有渐近有效性。2.变量的显著性检验失去意义变量的显著性检验中,构造了t统计量其他检验也是如此。它是建立在s2不变而正确估计了参数标准差的基础之上的。Si3.模型的预测失效一方面,由于上述后果,使得模型不具有良好的统计性质;所以,当模型出现异方差性时,OLS参数估计值的变异程度增大,从而造成对Y的预测误差变大,降低预测精度,预测功能失效。五、异方差性的检验检验方法很多检验的共同思路:由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。•问题在于用什么来表示随机误差项的方差一般的处理方法:VarEeiii()()~22~()eyyiiils0首先采用OLS法估计模型,以求得随机误差项的估计量(注意,该估计量是不严格的),我们称之为“近似估计量”,用~ei表示。于是有几种异方差的检验方法:1.图示法(1)用X-Y的散点图进行判断看是否存在明显的散点扩大、缩小或复杂型趋势(即不在一个固定的带型域中)(2)X-~ei2的散点图进行判断看是否形成一斜率为零的直线~ei2~ei2XX同方差递增异方差~ei2~ei2XX递减异方差复杂型异方差2.帕克(Park)检验与戈里瑟(Gleiser)检验基本思想:尝试建立方程:ijiiXfe)(~2或ijiiXfe)(|~|选择关于变量X的不同的函数形式,对方程进行估计并进行显著性检验,如果存在某一种函数形式,使得方程显著成立,则说明原模型存在异方差性。如:帕克检验常用的函数形式:ieXXfjijis2)(或ijiiXeslnln)~ln(22若在统计上是显著的,表明存在异方差性。由于的具体形式未知,故需进行各种形式的试验。3.戈德菲尔德-匡特(Goldfeld-Quandt)检验G-Q检验克服以上困难。G-Q检验以F检验为基础,适用于样本容量较大、异方差递增或递减的情况。Xfj)(G-Q检验的基本思想:先按某一解释变量对样本排序,将排序后的样本一分为二,对子样①和子样②分别作回归,然后利用两个子样的残差平方和之比构造F统计量进行异方差检验。由于该统计量服从F分布,因此假如存在递增的异方差,则F远大于1;反之就会等于1(同方差)、或小于1(递减方差)。G-Q检验的步骤:①将n对样本观察值(Xi,Yi)按某一有可能引起异方差的解释变量观察值Xi的大小排队;②将序列中间的c=n/4个观察值除去,并将剩下的观察值划分为较小与较大的容量相同的两个子样本,每个子样样本容量均为(n-c)/2;③对每个子样分别进行OLS回归,并计算各自的残差平方和;④在同方差性假定下,构造如下满足F分布的统计量)12,12(~)12(~)12(~2122kcnkcnFkcnekcneFii⑤给定显著性水平,确定临界值F(v1,v2),若FF(v1,v2),则拒绝同方差性假设,表明存在异方差。当然,还可根据两个残差平方和对应的子样的顺序判断是递增型异方差还是递减异型方差。4.怀特(White)检验怀特检验不需要排序,且适合任何形式的异方差。怀特检验的基本思想与步骤(以二元为例):iiiiXXY22110然后做如下辅助回归iiiiiiiiXXXXXXe215224213221102~可以证明,在同方差假设下:(*)R2为(*)的可决系数,h为(*)式解释变量的个数,表示渐近服从某分布。注意:辅助回归仍是检验与解释变量可能的组合的显著性,因此,辅助回归方程中还可引入解释变量的更高次方。如果存在异方差性,则表明确与解释变量的某种组合有显著的相关性,这时往往显示出有较高的可决系数以及某一参数的t检验值较大。当然,在多元回归中,由于辅助回归方程中可能有太多解释变量,从而使自由度减少,有时可去掉交叉项。六、异方差的修正模型检验出存在异方差性,可用加权最小二乘法(WeightedLeastSquares,WLS)进行估计。•加权最小二乘法的基本思想:加权最小二乘法是对原模型加权,使之变成一个新的不存在异方差性的模型,然后采用OLS估计其参数。即对加了权重的残差平方和实施OLS法:21102)]ˆˆˆ([kkiiiiXXYWeW其中:Wi为权数•例如,如果对一多元模型,经检验知:222)()()(ssjiiiiXfEVar在采用OLS方法时:对较小的残差平方ei2赋予较大的权数;对较大的残差平方ei2赋予较小的权数。新模型中,存在222)()(1))(1())(1(sijiijiijiEXfXfEXfVar即满足同方差性,可用OLS法估参。ijiijijiijiXXfXXfXfYXf22110)(1)(1)(1)(1ijikijikXfXXf)(1)(1•一般情况下:对于模型Y=X+存在:Wμμμμ2)()(0)(sECovEW即存在异方差性显然W是一对称正定矩阵,故存在一可逆矩阵D使得W=DD’用D-1乘以方程:Y=X+的两边,得到一个新的模型:μDXβDYD111***μβXY该模型具有同方差性。因为I2s1211211111)()()(DDDDDΩDDμμDDμμDμμ**ssEEE**1***)(ˆYXXXβYWXXWXYDDXXDDX11111111)()(这就是原模型Y=X+的加权最小二乘估计量,是无偏、有效的估计量。这里权矩阵为D-1,它来自于原模型残差项的方差-协方差矩阵s2W。•如何得到s2W?从前面的推导过程看,它来自于原模型残差项的方差—协方差矩阵。因此仍对原模型进行OLS估计,得到随机误差项的近似估计量ěi,以此构成权矩阵的估计量,即2212~~ˆneeWs这时可直接以|}~|/1,|,~|/1|,~|/1{211neeediagD作为权矩阵。•注意:在实际操作中人们通常采用如下的经验方法:不对原模型进行异方差性检验,而是直接选择加权最小二乘法,尤其是采用截面数据作样本时。如果确实存在异方差,则被有效地消除了;如果不存在异方差性,则加权最小二乘法等价于普通最小二乘法。七、案例——中国农村居民人均消费函数例4.1.4中国农村居民人均消费支出主要由人均纯收入来决定。农村人均纯收入包括:(1)从事农业经营的收入;(2)包括从事其他产业的经营性收入(3)工资性收入;(4)财产收入;(4)转移支付收入。考察从事农业经营的收入(X1)和其他收入(X2)对中国农村居民消费支出(Y)增长的影响,可用以下双对数模型:22110lnlnlnXXY表4.1.4中国2001年各地区农村居民家庭人均纯收入与消费支出相关数据(单位:元)地区人均消费支出Y从事农业经营的收入1X其他收入2X地区人均消费支出Y从事农业经营的收入1X其他收入2X北京3552.1579.14446.4湖北2703.361242.92526.9天津2050.91314.62633.1湖南1550.621068.8875.6河北1429.8928.81674.8广东1357.431386.7839.8山西1221.6609.81346.2广西1475.16883.21088.0内蒙古1554.61492.8480.5海南1497.52919.31067.7辽宁1786.31254.31303.6重庆1098.39764.0647.8吉林1661.71634.6547.6四川1336.25889.4644.3黑龙江1604.51684.1596.2贵州1123.71589.6814.4上海4753.2652.55218.4云南1331.03614.8876.0江苏2374.71177.62607.2西藏1127.37621.6887.0浙江3479.2985.83596.6陕西1330.45803.8753.5安徽1412.41013.11006.9甘肃1388.79859.6963.4福建2503.11053.02327.7青海1350.231300.1410.3江西1720.01027.81203.8宁夏2703.361242.92526.9山东1905.01293.01511.6新疆1550.621068.8875.6河南1375.61083.81014.1普通最小二乘法的估计结果:21ln5084.0ln3166.0655.1ˆlnXXY(1.87)(3.02)(10.04)2R=0.78312R=0.7676DW=1.89F=50.53RSS=0.8232可看出:其他收入(不是农业经营收入)的增长,对农村人均消费支出的增长更有刺激作用。异方差检验从结果分析中可认为,不同地区农村人均消费支出的差别主要来源于非农经营收入和其他收入的差别。因此,如果存在异方差性,则可能是X2引起的。图示检验法表明存在单调递增型异方差进一步的统计检验(1)G-Q检验将原始数据按
本文标题:多元线性回归三大问题
链接地址:https://www.777doc.com/doc-4546493 .html