您好,欢迎访问三七文档
第六章异方差性◆学习目的通过本章的学习,了解什么是异方差性,异方差性是如何形成的,异方差性导致什么样的后果,怎样检验和处理具有异方差性的模型。◆基本要求1)掌握异方差性的概念、异方差性的后果和几种常见的检验方法。2)了解加权最小二乘法原理,并能运用加权最小二乘法估计线性回归模型。3)了解异方差稳健推断原理。引子:更为接近真实的结论是什么?根据四川省2000年21个地市州医疗机构数与人口数资料,分析医疗机构与人口数量的关系,建立卫生医疗机构数与人口数的回归模型。对模型估计的结果如下:式中表示卫生医疗机构数(个),表示人口数量(万人)。(291.5778)(0.644284)ˆ-563.05485.3735iiYX20.785456R20.774146R69.56003F(-1.931062)(8.340265)tYX参数标准误差模型显示的结果和问题●人口数量对应参数的标准误差较小;●t统计量远大于临界值,可决系数和修正的可决系数结果较好,F检验结果明显显著;表明该模型的估计效果不错,可以认为人口数量每增加1万人,平均说来医疗机构将增加5.3735个。然而,这里得出的结论可能是不可靠的,平均说来每增加1万人口可能并不需要增加这样多的医疗机构,所得结论并不符合真实情况。有什么充分的理由说明这一回归结果不可靠呢?更为接近真实的结论又是什么呢?◆异方差性及其产生原因◆异方差性的影响◆异方差性的检验◆异方差性的的修正第六章异方差性第一节异方差性及其产生原因同方差的含义同方差性:对所有的有:(6.1)因为方差是度量被解释变量的观测值围绕回归线(6.2)的分散程度,因此同方差性指的是所有观测值的分散程度相同。01122E()...iiikkiYXXX(1,2,...,)iin2Var()=iuσY图形表示XY概率密度X设模型为如果对于模型中随机误差项有:第一节异方差性及其产生原因iu01122...1,2,...,iiikkiiYXXXuin2Var(),1,2,3,...,iiuin(6.4)(6.3)—、异方差性的含义即对于不同的样本点,随机干扰项的方差不再是常数,而是互不相同,则认为出现了异方差(Heteroskedasticity)。进一步,把异方差看成是由于某个解释变量的变化而引起的,则22Var()()iiiufX(6.4)图形表示XY概率密度异方差性是指模型违反古典假定中的同方差性,即各残差项的方差并非相等。一般地,由于数据观测质量、数据异常值、某些经济变化的特性、模型设定形式的偏误等原因,导致了异方差的出现。主要原因往往是重要变量的遗漏,所以很多情况下,异方差表现为残差方差随着某个(未纳入模型的)解释变量的变化而变化。二、异方差的类型2()iifX常数i同方差性假定是指回归模型中不可观察的随机误差项条件的方差是一个常数,因此每个的条件方差不随X的变化而变化,即有以解释变量X为i2()iifX不再是常数,2i在异方差的情况下,总体中的随机误差项的方差通常它随解释变量值的变化而变化,即i2()iifX根据2i与解释变量X的关系,异方差一般可归结为三种类型(如图):(1)单调递增型:2i随X的增大而增大;(2)单调递减型:(3)复杂型:随X的增大而减小;2i随X的变化呈复杂形式。2i三、异方差产生的原因例6-1居民储蓄模型在截面资料下研究居民家庭的储蓄行为,假定储蓄行为模型为01iiiSYiSiY其中,为第i个家庭的储蓄额,为第i个家庭的可支配收入。析:iiiY在该模型中,假定的方差为常数往往不符合实际情况。对于高收入的方差往往随的这属于递增型异方差。家庭来说,储蓄的差异较大;低收入家庭的储蓄则更有规律性(如为某一特定的目的而储蓄),差异较小。因此增加而增加,(一)截面数据中总体各单位的差异通常认为,截面数据较时间序列数据更容易产生异方差。这是因为同一时点不同对象的差异,一般说来会大于同一对象不同时间的差异。不过,在时间序列数据发生较大变化的情况下,也可能出现比截面数据更严重的异方差。三、异方差产生的原因例6-2干中学模型人们在学习的过程中,其行为误差随时间而减少。在这种情况下,会减小。i2i的方差可以预料例如,考虑一次打字测验,在给定的一段时间里,打字出错个数与用于打字练习的小时数有关系。随着打字练习小时数增加,不仅平均打错字个数下降,而且打错字个数的方差也下降,这属于递减型的异方差。资料收集技术的改进可能会使2i减小。例如,相较于没有先进设备的银行,那些拥有先进数据处理设备的银行,在他们对帐户的每月或每季财务报告中,会出现更少的差错。(二)数据的测量误差样本数据的观测误差有可能随研究范围的扩大而增加,或随时间的推移逐步积累,也可能随着观测技术的提高而逐步减小。以某一行业的企业为样本建立企业生产函数模型Yi=Ai1Ki2Li3ei被解释变量:产出量Y解释变量:资本K、劳动L、技术A,那么:每个企业所处的外部环境对产出量的影响被包含在随机误差项中。每个企业所处的外部环境对产出量的影响程度不同,造成了随机误差项的异方差性。这时,随机误差项的方差并不随某一个解释变量观测值的变化而呈规律性变化,呈现复杂型。三、异方差产生的原因(三)模型中省略了某些重要的解释变量假设正确的计量模型是:假如略去,而采用当被略去的与有呈同方向或反方向变化的趋势时,随的有规律变化会体现在(6.5)式的中。3iX01122iiiiYXXu3iX*011iiiYXu2iX1iX*iu(6.5)*iu1iX例6-3股票价格和消费者价格12345678910111213141516171819200510152025300510152025价格变化率序号股票价格变化率消费者价格(%)考虑如下20个国家在第二次世界大战后直至1969年间的股票价格(Y)和消费者价格(X)的百分比变化的散点图。图中,对智利的观测值Y和X远大于对其他国家的观测值,故可视为一个异常值,在这种情况下,同方差性的假定就难以维持了。三、异方差产生的原因例6-4假性异方差两个变量有真实关系:201iiiYX其中i满足线性回归模型的假定,即满足零均值和不变方差的假定。01iiiYX如果我们误以为Y和X之间的关系为:并认为()0iE,那么2220011()()[()()]iiiiiVarEEXX记20011()()()iiifXXX,则2222()()(())()iiiiiVarEEfXfX()iVariX因此是的函数,即我们建立的模型具有异方差。(四)模型的设定误差模型的设定主要包括变量的选择和模型数学形式的确定。模型中略去了重要解释变量常常导致异方差,实际就是模型设定问题。除此而外,模型的函数形式不正确,如把变量间本来为非线性的关系设定为线性,也可能导致异方差。第二节异方差性的影响1.参数估计量非有效计量经济学模型一旦出现异方差,如果仍然用普通最小二乘法估计模型参数,会产生一系列不良后果。2.OLS估计的随机干扰项的方差不再是无偏的3.基于OLS估计的各种统计检验非有效4.模型的预测失效1.参数估计量非有效根据前面有关OLS参数估计量的无偏性和有效性的证明过程,可以看到,当计量经济学模型出现异方差时,其普通最小二乘法参数估计量仍然具有无偏性和一致性,因为同方差假设在证明无偏性和一致性时并没有起作用。但在异方差情况下OLS估计量不再具有有效性,因为在有效性证明中利用了2()EI而且在大样本情况下,OLS估计量也不具有渐进有效性。为详细说明异方差使OLS参数估计量的无效性,我们考虑一元回归模型:(6-2)01iiiYX该模型参数的OLS估计量可以写为对于该模型,我们假定除同方差假设外,其他的高斯马尔科夫假设都成立。如果模型随机误差项包含异方差,那么有2(|)iiiVarX这一异方差取决于iX的值。12ˆiiixyx2211221ˆ()()niiiniixVarx(6-3)212ˆ()iVarx(6-4)显然(6-3)式与(6-4)式不同,只有在22i时两者才是相同的。在上述给定的异方差情况下,1ˆ的方差为容易证明而同方差假设下,1ˆ的OLS估计方差为2.OLS估计的随机干扰项的方差不再是无偏的异方差时OLS估计的随机误差项的方差不再是真实随机干扰项方差的无偏估计,正是因为这一点才使得OLS估计的参数不再是有效的,这可从(6-3)式中直接看出来。2211221ˆ()()niiiniixVarx(6-3)3.基于OLS估计的各种统计检验非有效1)t统计量不再服从t分布;3)F统计量也不再服从F分布;4)LM(拉格朗日乘数检验)统计量也不再有渐近2分布。总而言之,在异方差情况下,我们建立在高斯马尔科夫定理基础上的用来检验各种假设的统计量都不再是有效的,OLS估计量不再是最佳线性无偏估计量。变量的显著性检验中,构造了t统计量由于方差不是常数而是变数,这时一般意义上t比值的分布是未知的,不再遵从t-分布,使得t检验失效;同理,在异方差条件下,F比值也不再是遵从F-分布,F检验也失效。4.模型的预测失效当模型出现异方差时,一方面,由于上述后果,使得OLS估计不再具有良好的统计性质;另一方面,由于在被解释变量预测值的置信区间中也包含有参数估计量的标准差,所以,如果仍然使用OLS估计量,将导致预测区间偏大或偏小,预测功能失效。判断下列说法是否正确,并简要说明为什么。(1)当异方差出现时,最小二乘估计是有偏的和不具有最小方差特性——有效性;(2)当异方差出现时,常用的t和F检验失效;(3)如果回归模型中遗漏一个重要变量,则OLS残差必定表现出明显的趋势。第三节异方差性检验用什么来表示随机干扰项的方差???问题:一般的处理方法是首先采用普通最小二乘法估计模型,以求得随机干扰项的估计量,用ˆie表示。这样我们有22ˆ()()ˆˆ()iiiiiOLSVarEeeYY即用2ˆie来表示随机干扰项的方差。检验思路:由于异方差性就是相对于不同的解释变量观测值,随机误差项具有不同的方差。那么:检验异方差性,也就是检验随机误差项的方差与解释变量观测值之间的相关性及其相关的“形式”。对于解释变量引起的异方差,我们可以用如下几种方法来检验异方差。一、图示检验法二、帕克(Park)检验与戈里瑟(Gleiser)检验三、G-Q(Goldfeld-Quandt)检验四、F检验五、拉格朗日乘子检验六、怀特检验一、图示检验法(一)相关图形分析方差描述的是随机变量取值的(与其均值的)离散程度。因为被解释变量与随机误差项有相同的方差,所以利用分析与的相关图形,可以初略地看到的离散程度与之间是否有相关关系。如果随着的增加,的离散程度为逐渐增大(或减小)的变化趋势,则认为存在递增型(或递减型)的异方差。uYXXYYXY用1998年四川省各地市州农村居民家庭消费支出与家庭纯收入的数据,绘制出消费支出对纯收入的散点图,其中用表示农村家庭消费支出,表示家庭纯收入。1Y1X图形举例设一元线性回归模型为:运用OLS法估计,得样本回归模型为:由上两式得残差:绘制出对的散点图◆如果不随而变化,则表明不存在异方差;◆如果随而变化,则表明存在异方差。(二)残差图形分析12iiiYββXu12ˆˆˆiiY=β+βXˆ-iiieYY2ieiXiuiuiXiX一、图示检验法~ei2~ei2XX同方差递增异方差~ei2~ei2XX递减异方差复杂型异方差图6-2不同异方差类型(图示检验法只能进行大概的判断)二、帕克(Park)检验与戈里瑟(Gleiser)检验基本思想:2ˆieˆ||iejX以或为被解释变量,以原模型的某一个解释变量为解释变量,建立如下回归方程:2ˆ()ijiiefX或ˆ()ijiiefX选择
本文标题:第六章--异方差性
链接地址:https://www.777doc.com/doc-5311944 .html