您好,欢迎访问三七文档
第三章回归模型的扩展利用回归分析的估计、检验理论可以建立一个较好的因果关系模型,但是数理统计方法主要适用于研究可控的自然现象,对于无法通过人为控制进行“实验”的社会经济现象,其适用性就受到一定限制。因此,对于传统的回归分析方法,人们在理论、方法和应用上都有了许多发展。本章主要讨论三个方面的“扩展”内容:(1)古典回归模型基本假定不成立时所产生的问题;(2)如何反映定性因素的影响;(3)如何反映滞后因素的影响,将静态模型转化成动态模型。第一节异方差性古典回归模型包含了若干基本假定,在这些基本假定成立的前提下,应用最小二乘法可以得到无偏、有效的参数估计量,而且可以构造F检验、t检验、系数的标准误差等统计量来评价模型的优劣。但是许多经济现象并不一定都能满足这些假定,这必然会影响回归分析的估计和检验结果。在古典回归模型的若干假定中间,是不容易成立的是同方差假定、非自相关假定和无多重共线性假定。因此,在本章的前三节中我们将着重分析这三个假定,并且对每一个假定都依次讨论以下问题:(1)假定的含义及其违反的原因;(2)假定违反时将会产生什么不利影响;(3)如何检验假定是否成立;(4)假定违反时的处理方法。一、异方差性及其产生的原因对于线性回归模型ikikiiixbxbxbby22110同方差假定为:niDi,,2,1)(2即对于不同的样本点,随机误差项的离散程度是相同的;如果出现:niDii,,2,1)(2常数则称模型出现了异方差性(Heteroskedasticity)例如,利用横截面资料建立居民储蓄函数时,对于低收入家庭,其满足基本消费支出之后的剩余收入已经不多,所以各个家庭之间的储蓄存款不会有太大差异;但对于高由入家庭,因受储蓄心理、消费习惯、家庭成员构成等因素的影响,各个家庭之间的储蓄存款可能会有很大差异,即随机误差项的方差会明显地大于低收入家庭。又如,以总产值作为解释变量建立企业的成本函数时,由于管理水平、生产技术条件等因素的影响,使得同一生产规模的企业有不同的生产成本;但生产规模较小的企业,其生产成本的差异不会很大,而生产规模较大的企业则可能会产生较大的差异,即随机误差项的方差有增大的趋势。模型产生异方差性主要有以下原因:(1)模型中遗漏了影响逐渐增大的因素。例如,储蓄函数中的证券投资、利息、消费者行为等因素;成本函数中的管理水平、生产技术条件和规模效益等因素;消费函数中的家庭财产、消费心理等因素。(2)模型函数形式的误差。如将指数曲线模型误设成了线性模型,则误差有增大的趋势。(3)随机因素的影响,如政策变动、自然灾害、金融危机等。因此,经济分析中经常会遇到异方差性的问题。而且经验表明,利用横截面数据建立模型时,由于在不同样本点上(解释变量之外)其他因素影响的差异较大,所以比时间序列资料更容易产生异方差性。二、异方差性的影响模型一旦出现异方差性,将会产生以下不利影响:(一)最小二乘估计不再是有效估计因为在高斯——马尔可夫定理的证明过程中曾利用了同方差假定,随机误差项为异方差时,OLS估计仍然是无偏估计,但不再具有最小方差的特性,即存在其他的参数估计方法,其估计误差将小于OLS估计的误差。(二)无法正确估计系数的标准误差以一元线性回归模型为例,在高斯——马尔可夫定理的证明过程中曾经得:22222)(/()()()()ˆ(xx)k)(DkkDkbDbDiiiiiiii在同方差情况下在非自相关情况下其中:2)(/)(xxxxkiii。这样,如果再以2的无偏估计量)2/(ˆ22nei估计2,就可以得到bˆ的标准误差为:xxiSxxbS222ˆ)(ˆ)ˆ(但是,在异方差的情况下,2i是一些不同的数,只有估计出每一个2i之后才能得到系数的标准误差,这在只有一组样本观察值的情况下是无法做到的。而且,如果设:),,2,1,0(ˆ22niiii则在异方差情况下,系数的标准误差为:xxiixxixxiiiiiSxxSSxxkkbS222222222)(ˆˆ)(ˆ)ˆ(因此,如果仍然用xxS/ˆ2计算系数的标准误差,将会产生估计偏差;偏差的大小取决于第二个因子值的大小,当其大于1时,则会过低估计系数的误差;反之,则做出院过高的估计。(三)t检验的可靠性降低因为在异方差情况下,无法正确估计系数的标准误差)ˆ(bS,这直接影响到t统计量值的正确确定。因为:)ˆ(ˆbSbt所以用t检验来判断解释变量影响的显著性将失去意义。(四)增大模型的预测误差异方差性的存在一方面使模型夫去了良好的统计性质,另一方面由于随机误差项的方差与模型的预测区间密切相关())ˆ(ˆ),ˆ(ˆ(2/2/bStbbStb,在2i逐渐增大的情况下,模型的预测误差也随着增大。上述分析表明,实际经济总是中经常会出现异方差性,这将直接影响回归模型的估计、检验和应用。因此,在建立计量经济模型的过程中,应该检验模型是否存在异方差性;如果不存在异方差性(当然要求其他假定也同时成立),则可以用回归分析方法建立模型;否则,应该采用其他的参数估计方法建立模型。三、异方差性的检验为了检验模型是否存在异方差性,需要事先了解随机误差项取值的概率分布情况。但是随机误差项的变化是由模型之外其他因素的综合影响来决定,其取值情况是无法观测的。实际研究中,一般是通过对残差分布情况的分析来推测随机误差项的分布特征,因为残差项ie描述的也是解释变量之外其他因素的综合影响,可以将其作为随机误差项i的估计量。例1我国制造工业利润函数。表3-1列出了1998年我国主要制造工业销售收入与销售利润的统计资料。表3-1我国制造工业1998年销售利润与销售收入情况单位:亿元行业名称销售利润销售收入行业名称销售利润销售收入食品加工业食品制造业饮料制造业烟草加工业纺织业服装制品业皮革羽绒制品木材加工业家具制造业造纸及纸制品印刷业文教体育用品石油加工业187.25111.42205.42183.87316.79157.7081.7035.6731.06134.4090.1254.40194.453180.441119.881489.891328.593862.901779.101081.77443.74226.781124.94499.83504.442363.80医药制造业化学纤维制造橡胶制品业塑料制品业非金属矿制品黑色金属冶炼有色金属冶炼金属制品业普通机械制造专用设备制造交通运输设备电子机械制造电子通讯设备238.7181.5777.84144.34339.26367.47144.29201.42354.69238.16511.94409.83508.151264.10779.46692.081345.002866.143868.281535.161948.122351.681714.734011.533286.154499.19化学原料制品502.614195.22仪器仪表设备72.46663.68现以表3-1数据资料为例,介绍检验异方差性的一些常用方法(一)图示检验法1、相关图分析“方差”即为随机变量取值的离散程度。由于被解释变量y与误差项的方差相同,因此通过观察y与x的相关图,可以分析y的离散程度与解释变量之间是否存在着相关关系;如果随着x值的增加,y的离散程度呈现逐渐增大(或减小)的趋势,则表明模型存在着递增(或递减型)的异方差性。建立回归模型时,为了判断模型的函数形式,一般要观察被解释变量与解释变量的相关图,此时也可以大致判断模型是否存在异方差性。图3-1(P72)为销售利润与销售收入的相关图,从图中可以明显看出,随着销售收入的增加,销售利润的平均水平不断提高,但其离散程度同时也在逐步扩大,即呈现出递增型的异方差性。2、残差分布图分析建立回归模型之后,在方程窗口中点击Resids按钮可以得到模型的残差分布图,如果残差分布的离散程度有明显扩大的趋势,则表明存在着异方差性。注意观察之前需要先将数据关于解释变量排序,命令格式为:SORTX图示检验法只能粗略地判断模型是否存在异方差性,当异方差性不太明显时,还需要采用一些较为精确的检验方法。(二)戈德菲尔德——匡特(Goldfeld—Quandt)检验戈德菲尔德检验,简称G—Q检验,它的原理可以用图3-2直观表示。图3-2G—Q检验原理图为了检验异方差性,将样本按解释变量排序后分成两部分,再利用样本1和样本2分别建立回归模型,并求出各自的残差平方和RSS1和RSS2。如果误差项的离散程度相同(即为同方差的),则RSS1和RSS2的值应该大致相同;若两者之间存在显著差异,则表明存在异方差性。检验过程中为了“夸大”残差的差异性,一般先在样本中部去掉C个数据(通常取C=n/4),再利用F统计量判断差异的显著性:12RSSRSSF~)13()12,12(kcnkcnF其中,一般取RSS1RSS2。K为参数的个数,对于给定的显著水平,若FF,则表样本1C个数据样本2明存在异方差性;反之,则不存在异方差性。例如,例1中样本数据个数n=28,C=n/4=7,为了使两个子样本的容量相同,从中间去掉8个数据(即取C=8)。因此,利用EViews进行G—Q的具体步骤为:SORTX将样本数据关于X排序SMPL110确定子样本1LSYCX求出RSS1=2579.59SMPL1928确定子样本2LSYCX求出RSS2=63769.67=63769.67/2579.59计算出F=24.72取05.0时,查F分布表得44.3)1110,1110(05.0F,而44.372.2405.0FF,所以存在(递增的)异方差性。从检验过程可以看出,G—Q检验适用于检验样本容量较大、异方差性呈递增或递减的情况,而且检验结果与数据剔除个数C的选取有关。(三)怀特(White)检验White检验是通过建立辅助回归模型的方式来判断异方差性。不妨设回归模型为二元线性回归模型:iiiixbxbby22110则White检验的具体步骤为:(1)估计回归模型,并计算残差的平方2ie。(2)估计辅助回归模型:iiiiiiiivxxaxaxaxaxaae215224213221102即将残差平方关于所有解释变量的一次项、二次项和交叉乘积项进行回归(其中,iv是满足古典回归模型假定的误差项),实际上还可以引进解释变量的高次项,但这样会使样本的自由度在幅度下降,所以一般只引入二次项;而且在样本容量较小、解释变量个数相对较多的情况下,为了保证自由度,在辅助回归模型中可以省去交叉乘积项。(3)计算辅助回归模型的判定系数2R,可以证明,在同方差的假设下(即假设0:543210aaaaaH),渐近地有:2nR~)23()(2q其中,自由度q为辅助回归模型中的自变量个数(此时q=5)。(4)对于给定的显著水平,若)(22qnR,则拒绝原假设0H,即认为)0(iai中至少有一个显著地不等于0,模型存在异方差性;反之,则认为不存在异方差性。利用EViews软件可以直接进行White检验。例如,对例1的我国制造工业利润函数,White检验的具体步骤为:(1)建立回归模型:LSYCX(2)检验异方差性:在方程窗口中依次点击View\ResidualTest\WhiteHeteroskedasticity此时可以选择在辅助回归模型中是否包含交叉乘积项(Crossterms),本例为一元回归模型,辅助回归模型中只有x和x2两项,不存在交叉乘积项。招待命令后,屏幕将显示辅助回归模型的估计结果及以下信息:WhiteHeteroskedasticityTest:F-statistic3.607090Probability0.042040Obs*R-squared6.270439Probability0.043490其中,F值为辅助回归模型的F统计量值。取显著水平05.0,由于99.5)2(2
本文标题:计量经济学第五讲
链接地址:https://www.777doc.com/doc-2061952 .html