您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > S8章 虚拟变量模型
本章将主要介绍经典单方程计量经济学模型中引入虚拟变量的问题。第八章虚拟变量模型在前面几章中,主要介绍了经典线性回归模型及其在若干基本假定下的估计问题,并分析了一个或多个假定不满足时所产生的后果及其可能的改进措施。然而上述方法还不能解决经济生活中遇到的全部问题。如何考察某一突发事件、性别、季节、受教育程度等对经济行为带来的影响??例如:第八章虚拟变量模型◆学习目的了解虚拟变量、虚拟变量模型的概念,掌握虚拟变量设置的原则和引入模型的方法。◆基本要求1)认识到虚拟变量是建立计量经济学模型经常会遇到的问题;2)了解虚拟变量、虚拟变量模型的概念;3)掌握虚拟变量设置的原则、虚拟变量模型的建模方法及应用。◆虚拟变量◆虚拟变量模型第八章虚拟变量模型第一节虚拟变量◆虚拟变量的引入◆虚拟变量的设置原则一、虚拟变量为什么要引入“虚拟变量”??如商品需求量、价格、收入、产量等许多经济变量是可以定量度量的或者说是可以直接观测的但是也有一些影响经济变量的因素无法定量度量或者说无法直接观测如职业、性别对收入的影响,战争、自然灾害对GDP的影响,季节对某些产品(如冷饮)销售的影响等。为了能够在模型中反映这些因素的影响,并提高模型的精度,需要将它们人为地“量化”,这种“量化”通常是通过引入“虚拟变量”来完成的。这种用两个相异数字来表示对被解释变量有重要影响而自身又没有观测数值的一类变量,称为虚拟变量(dummyvariables)。虚拟变量也称为哑变量或定性变量。虚拟变量的特点是:1.虚拟变量是对经济变化有重要影响的不可测变量。2.虚拟变量是赋值变量,一般根据这些因素的属性类型,构造只取“0”或“1”的人工变量,通常称为虚拟变量,记为D。这是为了便于计算而把定性因素这样数量化的,所以虚拟变量的数值只表示变量的性质而不表示变量的数值。基础类型和肯定类型取值为1;一般地,在虚拟变量的设置中,比较类型和否定类型取值为0。例如:1)表示性别的虚拟变量可取为D1=1男性0女性2)表示文化程度的虚拟变量可取为D2=1本科及以上学历0本科以下学历3)表示地区的虚拟变量可取为D3=1城市0农村4)表示消费心理的虚拟变量可取为D4=1喜欢某种商品0不喜欢某种商品5)表示天气变化的虚拟变量可取为D5=0雨天1晴天二、虚拟变量模型同时含有一般解释变量与虚拟变量的模型称为虚拟变量模型。在模型中,虚拟变量可作为解释变量,也可作为被解释变量,但主要是用作解释变量。一个以性别为虚拟变量来考察职工薪金的模型如下:(8-1)i012iiiYXD其中例如:iY——为职工的薪金;iX——为职工工龄;iD=1——代表男性iD=0——代表女性三、虚拟变量的引入虚拟变量作为解释变量引入模型有两种基本方式:加法方式和乘法方式。1.加法方式上述职工薪金模型(8-1)中性别虚拟变量的引入就采取了加法方式,女职工的平均薪金为:01,0iiiiEYXDX在该模型中,如果仍假定iE=0,则男职工的平均薪金为:021,1iiiiEYXDXi012iiiYXD从几何意义上看(图8-1),图8-1男女职工平均薪金示意图假定20,则两个函数有相同的斜率,但有不同的截距。这意味着,男女职工平均薪金对工龄的2。变化率是一样的,但两者的平均薪金水平相差可以通过传统的回归检验,对2的统计显著性进行检验,以判断男女职工的平均薪金水平是否有显著差异。例如:在截面数据基础上,考虑个人保健支出对个人收入和教育水平的回归。教育水平考虑三个层次:高中以下,高中,大学及其以上D1=1高中0其它D2=1大学及其以上0其它这时需要引入两个虚拟变量:模型可设定如下:(8-2)i012132iiiiYXDD高中以下:E(Yi|Xi,D1i=0,D2i=0)=β0+β1Xi高中:大学及其以上:E(Yi|Xi,D1i=1,D2i=0)=(β0+β2)+β1XiE(Yi|Xi,D1i=0,D2i=1)=(β0+β3)+β1Xi在()iE=0的初始假定下,容易得到高中以下、高中、大学及其以上教育水平个人平均保健支出的函数:32000假定,且,则其几何意义如图8-2所示。图8-2不同教育程度人员保健支出示意图还可将多个虚拟变量引入模型中以考察多种“定性”因素的影响。例如:在职工薪金模型(8-1)的例子中,再引入学历的虚拟变量i012iiiYXDD2=1本科及以上学历0本科以下学历则职工薪金的回归模型可设计如下:(8-3)Yi=β0+β1Xi+β2Di+β3D2i+μi于是,不同性别、不同学历职工的平均薪金分别由下面各式给出:女职工本科以下学历的平均薪金:男职工本科以下学历的平均薪金:女职工本科以上学历的平均薪金:男职工本科以上学历的平均薪金:E(Yi|Xi,D1i=0,D2i=0)=β0+β1XiE(Yi|Xi,D1i=1,D2i=0)=(β0+β2)+β1XiE(Yi|Xi,D1i=0,D2i=1)=(β0+β3)+β1XiE(Yi|Xi,D1i=1,D2i=1)=(β0+β2+β3)+β1Xi2.乘法方式——斜率的变化例如:根据消费理论,消费水平C主要取决于收入水平X。但在一个较长的时期,人们的消费倾向会发生变化,尤其是在自然灾害、战争等反常年份,消费倾向往往出现变化。这种消费倾向的变化可通过在收入的系数中引入虚拟变量来考察。设Dt=1正常年份0反常年份则消费模型可建立如下:012tttttCXDX(8-4)这里,虚拟变量Dt以与Xt相乘的方式引入了模型中,从而可用来考察消费倾向的变化。在E(μt)=0的假定下,上述模型所表示的函数可化为:正常年份:012(,1)()ttttECXDX反常年份:01(,0)ttttECXDX图8-3不同年份消费倾向示意图假定20,则其几何图形如图8-3所示。如果在模型中同时使用加法和乘法两种方式引入虚拟变量,则回归线的截距和斜率都会改变。例如:对于改革开放前后储蓄-收入模型,可设定为(8-5)0112()ttttttYDXDX其中,Y为储蓄,X为收入,Dt为虚拟变量Dt=1改革开放以后0改革开放以前显然在式(8-5)中,同时使用加法和乘法两种方式引入了虚拟变量。在E(μt)=0的假定下,上述模型所表示的函数可化为:改革开放以前:E(Yt|Xt,Dt=0)=α0+β1Xt改革开放以后:则其几何图形如图8-4所示。E(Yt|Xt,Dt=1)=(α0+α1)+(β1–β2)Xt12假定0且0,改革开放以前改革开放以后XY图8-4改革开放前后储蓄函数示意图3.临界指标的虚拟变量的引入在经济发生转折时,可通过建立临界指标的虚拟变量模型来反映。例如:进口消费品数量Y主要取决于国民收入X的多少,中国在改革开放前后,Y对X的回归关系明显不同。这时,可以t*=1979为转折期,以1979年的国民收入Xt*为临界值,设如下虚拟变量:10Dt=t≥t*t<t*则进口消费品的回归模型可建立如下:*012()ttttttYXXXD(8-6)如果用OLS法得到该模型的回归方程为*012ˆˆˆˆ()tttttYXXXD(8-7)则两个时期进口消费品函数分别为当t<t*=1979时01ˆˆˆttYX当t≥t*=1979时*0212ˆˆˆˆˆ()()tttYXX几何图形如图8-5所示图8-5转折期回归示意图4.数值变量作为虚拟变量引入有些变量虽然是数量变量,即可以获得实际观测值,但在某些特定情况下把它选取为虚拟变量则是方便的,以虚变量引入计量经济学模型更加合理。譬如年龄因素虽然可以用数字计量,但如果将年龄作为资料分组的特征,则可将年龄选作虚拟变量。例如:家庭教育经费支出不仅取决于其收入,而且与年龄因素有关。按年龄划分为三个年龄组:6—18岁年龄组(中小学教育);19—22岁年龄组(大学教育);其它年龄组。于是设定虚拟变量D1=16-18岁年龄组0其它D2=119-22年龄组0其它则家庭教育经费支出模型可设定为(8-8)012132iiiiiYXDD其中,Yi是第i个家庭的教育经费支出;Xi是第i个家庭的收人;虚拟变量D1i、D2i分别表示第i家庭中是否有6—18岁和19—22岁的成员。5.虚拟变量交互效应分析当分析解释变量对变量的影响时,大多数情形只是分析了解释变量自身变动对被解释变量的影响作用,而没有深入分析解释变量间的相互作用对被解释变量影响。前面讨论的分析两个定性变量对被解释变量影响的虚拟变量模型中,暗含着一个假定:两个定性变量是分别独立地影响被解释变量的但是在实际经济活动中,两个定性变量对被解释变量的影响可能存在一定的交互作用,即一个解释变量的边际效应有时可能要依赖于另一个解释变量。为描述这种交互作用,可以把两个虚拟变量的乘积以加法形式引入模型。考虑下列模型Yi=α0+α1D1i+α2D2i+βXi+μi(8-9)其中,Yi为农副产品生产总收益,Xi为农副产品生产投入,D1i为油菜籽生产虚拟变量,D2i为养蜂生产虚拟变量。这里D1i=1发展油菜籽生产0其它D2i=1发展养蜂生产0其它例如:显然,(8-9)式描述了是否发展油菜籽生产与是否发展养蜂生产的差异对农副产品总收益的影响。虚拟解释变量D1i和D2i是以加法形式引入的,那么暗含着假定:油菜籽生产和养蜂生产是分别独立地影响农副产品生产总收益。但是,在发展油菜籽生产时,同时也发展养蜂生产,所取得的农副产品生产总收益可能会高于不发展养蜂生产的情况。即在是否发展油菜籽生产与养蜂生产的虚拟变量D1i和D2i之间,很可能存在着一定的交互作用,且这种交互影响对被解释变量—农副产品生产总收益会有影响。为描述虚拟变量交互作用对被解释变量的效应,在(8-9)式中以加法形式引入两个虚拟解释变量的乘积,即Yi=α0+α1D1i+α2D2i+α3(D1iD2i)+βXi+μi(8-10)(1)基础类型:不发展油菜籽生产,也不发展养蜂生产时农副产品生产平均总收益E(Yi|Xi,D1=0,D2=0)=α0+βXi(8-11)(2)比较类型:同时发展油菜籽生产和养蜂生产时,农副产品生产平均总收益E(Yi|Xi,D1=1,D2=1)=α0+α1+α2+α3+βXi(8-12)α1为是否发展油菜籽生产对农副产品生产总收益的截距差异系数;α2为是否发展养蜂生产对农副产品生产总收益的截距差异系数;α3为同时发展油菜籽生产和养蜂生产时对农副产品生产总收益的交互效应系数。α0~α3组成截距水平。其中关于交互效应是否存在,可借助于交互效应虚拟解释变量系数的显著性检验来加以判断。如果t检验表明交互效应D1iD2i在统计意义上显著时,说明交互效应对Yi存在显著影响。四、虚拟变量的设置原则每一定性变量所需的虚拟变量个数要比该定性变量的类别数少1,即如果定性变量有m个类别,则只在模型中引入m-1个虚拟变量。例如:已知冷饮的销售量Y除受k个定量变量Xi的影响外,还受一个定性变量季节即春、夏、秋、冬四季变化的影响。要考察该四季的影响,只需引入三个虚拟变量即可:D1t=1春季0其它D2t=1夏季0其它D3t=1秋季0其它则冷饮销售量的模型为011112233ttkktttttYXXDDD…(8-13)D4t=1冬季0其它在上述模型中,若再引入第四个虚拟变量则冷饮销售模型变量为01111223344ttkkttttttYXXDDDD…(8-14)其矩阵形式为(8-15)()YXD如果只取六个观测值,其中春季与夏季取了两次,秋、冬各取到一次观测值,则其中111122133144155166110001010010010()100011100010100kkkkkkXXXXXXXXXXXXXD模型(8-14)参数无法唯一求出()XD显然,中的第1
本文标题:S8章 虚拟变量模型
链接地址:https://www.777doc.com/doc-24549 .html