您好,欢迎访问三七文档
第四章特殊变量第一节虚拟变量第二节随机解释变量第三节滞后变量第一节虚拟变量一、虚拟变量及其作用二、虚拟变量的设置三、虚拟变量的特殊应用一、虚拟变量及其作用到目前为止,回归模型中的变量均为具有数量性质的变量,如产量、销售量、价格、成本、消费物价指数等。但是,在经济分析和经济预测中,还存在另一类因素,它反映了地域、经济结构、性别、战争、季节以及政府经济政策变化等具有属性性质的品质变量的影响,它们只表示某种特征的存在与不存在,我们把这类定性变量称为虚拟变量。第一节虚拟变量为了在模型中反映这类因素的影响,并提高模型的精度,需要将这类变量“量化”。为此,根据这类变量的属性类型,人们构造仅取“0”或“1”的人工变量,通常称这类变量为虚拟变量(dummyvariables),用符号表示。例如,D女性男性政策宽松政策紧缩销售淡季销售旺季农村居民城镇居民01010101DDDD在计量经济模型中引入虚拟变量的作用:(1)可以描述和测量定性因素的影响;(2)能够正确反映经济变量之间的相互关系,提高模型的精度;(3)便于处理异常数据,当样本资料存在异常数据时,可以设置虚拟变量(即将异常数据作为一个特殊的定性因素):正常时期异常时期01D二、虚拟变量的设置(一)虚拟变量的引入方式虚拟变量作为解释变量引入模型有三种方式:加法方式、乘法方式和混合方式。1.加法方式考虑以下模型:iiiiuDXY210(4.1.1)其中,为居民的消费支出,为居民的年均可支配收入,为虚拟变量:iYiXiD其他城镇居民01iD当(4.1.1)式中的服从经典假定条件时,非城镇居民消费支出和城镇居民消费支出分别为iuiiiiXDXYE120)()1,((4.1.2)与(4.1.3)式表明非城镇居民与城镇居民两种类型收入函数的斜率相同(均为),若,则两者的差别仅在截距水平。(4.1.2)(4.1.3)iiiiXDXYE10)0,(102iiiiuDXY210其他城镇居民01iD加法方式引入虚拟变量时实际上反映的是定性因素对截距的影响,即平均水平的差异情况:在相同的收入水平情况下,城镇居民的消费支出比非城镇居民多支出个单位。22.乘法类型定性因素的影响不仅表现在截距上,有时可能还会影响斜率。例如,居民家庭的教育费用支出Yi除了受收入水平Xi的影响之外,还与子女的年龄结构密切相关。随着收入水平的提高,家庭教育支出的边际消费倾向可能会发生变化。为了反映“子女的年龄结构”这一定性因素对斜率的影响,设置虚拟变量:将家庭教育费用支出函数表示为:无适龄子女有适龄子女01iDiiiiiuXDXY210(4.1.4)iiiiXDXYE10)0,((4.1.5)iiiiXDXYE)(210)1,((4.1.6)当(4.1.4)式中的服从经典假定条件时,无适龄子女和有适龄子女的家庭教育支出分别为:iu若,则表明家庭教育支出的边际消费倾向发生了变化,系数描述了定性因素的影响程度。022iiiiiuXDXY210(4.1.4)3.混合方式以混合方式引入虚拟变量,是指同时采用加法方式和乘法方式将虚拟变量引入到模型中。通过这种方式引入虚拟变量能够同时考查在样本期内定性因素对模型截距项和斜率系数的影响。例如,设某行业职工收入主要受教育年数、性别和地理位置(东部、西部)的影响,考虑到两个定性因素之间可能存在交互影响,以及各自对行业职工收入的影响,采用混合方式引入虚拟变量建立如下回归模型:iiiiiiiuDDDDXY)(214231210(4.1.7)个职工位于西部第个职工位于东部第个职工为女性第个职工为男性第iiDiiDii010121当(4.1.7)式中的服从经典假定条件时,则由(4.1.7)式可得不同性别职工的平均收入函数分别为:女职工:男职工:iuiiiiiiXDDDXYE123012)()0,,(iiiiiiXDDDXYE12432012][)1,,()(iiiiiiiuDDDDXY)(214231210(5-7)由此可知,若,则表明不同性别在收入上的差异与其所在的地理位置有关。04个职工位于西部第个职工位于东部第个职工为女性第个职工为男性第iiDiiDii010121例4-1表4-1列出了1998年我国城镇居民人均收入与彩电每百户拥有量的统计资料。(二)虚拟变量的设置原则1.一个因素多个类型在有截矩项的模型中,当一个定性变量含有m个类别时,应向模型中引入m-1个虚拟变量。在无截矩项的模型中,定性因素有m个相互排斥的类型时,引入m个虚拟变量。例如,考虑以下模型:其中,Yi为年医疗保健费用支出,Xi为居民的年可支配收入,D1i、D2i为虚拟变量:iiiituDDXY231210(4.1.10)其他个居民大专及大专以上第其他个居民只是高中教育第iDiDii010121当(5-10)式服从经典假定条件时,有:受教育程度在高中以下的居民年医疗保健费用支出:受教育程度在高中的居民年医疗保健费用支出:受教育程度在大专及大专以上的居民年医疗保健费用支出:iiiiiXDDXYE1021)0,0,(iiiiiXDDXYE12021)()0,1,(iiiiiXDDXYE13021)()1,0,(iiiituDDXY231210(4.1.10)其他大专及大专以上其他只是高中教育010121iiDD这表明,三种不同教育程度居民的医疗保健费用年均支出的起点水平(截距)不同,差异截距系数为。对(4.1.10)式进行回归,检验和的检验可以发现与高中以下教育水平相比,另两种类型截距的差异在统计上是否存在显著差异。关于的联合假设检验,也可由方差分析或F检验完成。32和0:20H0:30Ht032iiiituDDXY231210(4.1.10)再例如:城镇居民和农村居民住房消费支出的模型可设定为其中,为居民的住房消费支出,为居民的可支配收入,为虚拟变量,012iiiiCXDuiCiYiD农村居民城镇居民01iD这里,区分城镇居民和农村居民的定性变量的类型有两个。但是,如果引入了2个虚拟变量其他农村居民和其他城镇居民010121iiDD则012132iiiiiCXDDu这时,当时,有;反之,当时,有。11iD02iD02iD11iD即对于任何被调查的居民家庭都有132iiDD模型存在完全多重共线性,从而陷入“虚拟变量陷阱”。012233iiiiiCXDDu例如,在模型(4.1.10)中,如果除了考虑户主的受教育程度外,还考虑户主性别,则家庭的消费模型可设为2.多个因素若干不同的类型01213243iiiiiiYXDDDu(4.1.12)310iD户主是女性户主是男性当(4.1.12)式满足经典假定条件时,有以下类型:12301(,000)iiiiiiEYXDDDX,,户主为高中以下文化程度的女性家庭年医疗保健费用支出为123041(,001)++iiiiiiEYXDDDX,,()123021(100)++iiiiiiEYXDDDX,,,()1230241(101)+++iiiiiiEYXDDDX,,,()户主为高中文化程度的女性家庭消费支出为户主为高中文化程度的男性家庭消费支出为户主为高中以下文化程度的男性家庭年医疗保健费用支出为123031(010)()iiiiiiEYXDDDX,,,户主为大专及大专以上程度的女性家庭年医疗保健费用支出为1230341(011)()iiiiiiEYXDDDX,,,户主为大专及大专以上程度的男性家庭年医疗保健费用支出为一般地把虚拟变量取值为“0”所对应的类别称作基础类别,“0”表示这种属性或特征不存在,虚拟变量取“1”代表与基础类型相比较的类型。三、虚拟变量的特殊应用(一)分段回归有的社会经济现象的变动,会在解释变量达到某个临界值时发生突变,为了区分不同阶段的截距和斜率可利用虚拟变量进行分段回归。例4-2改革开放以来,随着经济的发展中国城乡居民的收入快速增长,同时城乡居民的储蓄存款也迅速增长。经济学界的一种观点认为,20世纪90年代以后由于经济体制、住房、医疗、养老等社会保障体制的变化,使居民的储蓄行为发生了明显改变。为了考察改革开放以来中国居民的储蓄存款与收入的关系是否已发生变化,以城乡居民人民币储蓄存款年底余额代表居民储蓄Y,以国民总收入GNI代表城乡居民收入,分析居民收入对储蓄存款影响的数量关系。(二)模型结构的稳定性检验利用不同的样本数据估计同一形式的计量经济模型,可能会得到不同的估计结果。如果估计的参数之间存在显著差异,则称模型结构是不稳定的,反之则认为是稳定的。模型结构的稳定性检验主要有两个用途:一是分析模型结构对样本变化的灵敏度,如多重共线检验;二是比较两个(或多个)回归模型的差异情况,即分析模型结构是否发生了显著变化。例4-3表4-3中给出了中国1980-2001年以城乡储蓄存款新增额代表的居民储蓄S以及以GNP代表的居民收入的数据。以1991年为界,判断1991年前后的两个时期中中国居民的储蓄-收入关系是否已发生变化。(三)调整季节波动利用季节或月份资料建立模型时,经常存在季节波动。使用虚拟变量也可以反映季节因素的影响。例4-4表4-4给出了1965-1970年美国制造业利润和销售额的季度数据。假定利润不仅与销售额有关,而且与季度因素有关。要求对下列两种情况分别估计利润模型:(1)如果认为季度影响使利润平均值发生变异,应如何引进虚拟变量?(2)如果认为季度影响使利润对销售额的变化率发生变异,应如何引进虚拟变量?一、随机解释变量问题对于模型niuXXXYikikiii,,2,1,22110(5.2.1)如果存在一个或多个随机变量作为解释变量,则称原模型存在随机解释变量问题,对这一问题,假设(4.2.1)式中X2为随机解释变量,可分三种不同情况加以讨论。第二节随机解释变量(1)随机解释变量与随机干扰项独立,即(2)随机解释变量与随机干扰项同期无关但异期相关,即0)(),(22uXEuXCovniuXEuXCoviiii,,2,10)(),(220,0)(),(22suXEuXCovsiisii,0)(),(22iiiiuXEuXCovni,,2,1(3)随机解释变量与随机干扰项同期相关,即niuXXXYikikiii,,2,1,22110单方程模型假设解释变量是确定性变量,这一假设在保证最小二乘估计的性质、确定参数估计量的分布性质和数字特征方面起到了很重要的作用。但是,计量经济学模型一旦出现随机解释变量,如果仍采用普通最小二乘法估计模型参数,不同性质的随机解释变量会产生不同的后果。二、随机解释变量的后果iiiuXY10(1)如果X与u相互独立,得到的参数估计量仍然是无偏一致估计量。(2)如果X与u同期不相关,而异期相关,得到的参数估计量有偏,但却是一致的。(3)如果X与u同期相关,得到的参数估计量有偏且非一致的。例如,一元线性回归模型三、工具变量法由以上讨论可以看出,如果模型中含有随机解释变量,而且又与随机干扰项相关的话,运用普通最小二乘法求得的模型参数估计量是有偏的。如果随机解释变量与随机干扰项异期相关,则可通过增大样本容量的办法来得到一致估计量;但如果同期相关,即使增大样本容量也无济于事,这时,最常用的办法就是使用工具变量法。(一)工具变量
本文标题:第四章-特殊变量
链接地址:https://www.777doc.com/doc-8134824 .html