您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第七章经典计量经济模型的专门问题.
1引子:男女大学生的消费真的有差异吗?“当代大学生的消费结构呈现出多元化趋势。大学生除了日常生活费开支以外,还有人际交往、网络通讯、书报、衣着、化妆品、电脑、旅游、食品、学习用品、各种考证等消费。不同性别大学生的消费结构有所不同,专科生、本科生、研究生的消费结构更有差异。不同年级之间,男女同学之间,消费水平、消费结构、消费方式上都存在着差异。”(注:来源于Solie教育网、网易教育频道、新华网等:共青团中央、全国学联共同发布的《2004中国大学生消费与生活形态研究报告》)为了研究男女大学生、不同层次大学生、不同年级大学生的消费结构是否有差异,需要将这些定性的因素引入计量模型,怎样才能在模型中有效地表示这些定性因素的作用呢?2第七章经典计量经济模型的专门问题◆虚拟变量回归◆模型的设定误差3一、虚拟变量回归(一)什么是虚拟变量数量变量属性变量可用数量表现的变量表明属性的变量属性变量:不能精确计量的说明某种属性或状态的定性变量,如性别、民族、战争、政治事件◆本身是定性的变量(非此即彼)◆本来是连续数量变量也可转换为二分类变量(如上线/不上线)虚拟变量:人工构造的取值为0和1的作为属性变量代表的变量称虚拟变量,一般常用D表示D=0表示某种属性或状态不出现或不存在D=1表示某种属性或状态出现或存在4虚拟变量的作用●作为属性因素的代表,如性别●作为某些非精确计量的数量因素的代表,如受教育程度●作为某些偶然因素或政策因素的代表,如战争●时间序列分析中作为季节(月份)的代表●分段回归,研究斜率、截距的变动●比较两个回归模型●虚拟被解释变量概率模型:被解释变量本身是定性变量5虚拟变量模型6虚拟变量的设置规则1、虚拟变量D取值为0,还是取值为1,要根据研究的目的决定其中:D取值为0的类型—基础类型,是比较的基准D取值为1的类型—与基础类型比较的类型2、要避免落入“虚拟变量陷阱”如果模型中每个定性因素有m个相互排斥的类型,模型中只能引入m-1个虚拟变量,否则会出现多重共线性如:一个定性因素有两种类型,设两个虚拟变量,若,若,显然有,存在完全的多重共线性21DD和0121DD则1021DD则211DD21DD和7(二)虚拟解释变量回归定性变量可以影响截距,也可以影响斜率,还可以同时影响截距和斜率截距不同斜率不同截距与斜率都不同1、用虚拟变量表示不同截矩的回归——加法类型虚拟变量以加法方式引入模型的作用:改变模型中截距8(1)解释变量只有一个分为两种互斥类型的定性变量的回归这类模型又称方差分析模型如例如:Y为居民年可支配收入D=0为非城镇居民D=1为城镇居民作用:研究当其他条件不变时,城镇居民与非城镇居民的年可支配收入是否有差异分析条件期望:基础类型:比较类型:为差异系数,对系数的t检验可检验是否有显著差异注意:这里一个定性变量具有两种类型,只使用了一个虚拟变量iiiYDu(0)iEYD(1)iEYD9(2)解释变量包含一个定量变量和一个分为两种类型的定性变量的回归例如:Y为服装消费X为收入,D=0为男性D=1为女性分析条件期望:基础类型:比较类型:为差异截距系数,对系数的t检验:可检验定性因素对截距是否有显著影响注意:●应服从基本假定●定性变量具有两种类型,只使用了一个虚拟变量iiiiuXDY10iiiXDXYE0)0,(iiiXDXYE)()1,(101iu110又如其中:——年工资——工龄D=1大学毕业及以上D=0其他(非大学毕业)非大学毕业(基准类型)大学毕业及以上iiiiuXDY10iiiXDXYE0)0,(iiiXDXYE)()1,(10iYiXiYiX10大学毕业非大学毕业11例1:随机调查美国旧金山地区20个家庭的储蓄情况,拟建立年储蓄额Y对年收入X的回归模型。通过对样本点的分析发现,居于上部的6个点都是自己有房的家庭,居于下部的14个点都是租房住的家庭。而这两类家庭所对应的观测点各自都表现出明显的线性关系。于是给模型加入一个定型变量“住房情况”,用D表示,定义如下:D=0(租房户)D=1(有房户)123ttttYXD120.00.51.01.52.02.53.03.551015202530354045XY13利用数据得到回归方程如下:(-5.2)(16.9)(11.0)R^2=0.99,DW=2.27由于虚拟变量回归系数显著不为零,说明对住房状况不同的两类家庭来说,回归函数截距项确实明显不同。若模型不引入虚拟变量,回归方程为:(-3.5)(11.6)R^2=0.88,DW=1.85比较可决系数,说明该模型引入虚拟变量非常必要。^0.32040.06750.8273tttYXD^0.56670.0963ttYX14(3)解释变量包含一个定量变量和一个两种以上类型的定性变量的回归类型:高中以下、高中毕业、大学毕业及以上——三种类型模型:例如为年工资为工龄=1只是高中毕业=1大学毕业及以上=0其他=0其他基础类型:(高中以下)比较类型:(高中)(大学及以上)差异截距系数为和问题:如果还要区分“专科以下”、“专科”、“本科”、“硕士”、“博士”应怎么办?iiiXDDXYE021)0,0,(01122iiiiiYDDXu12iiiXDDXYE)()0,1,(1021iiiXDDXYE)()1,0,(2021iYiX1D1D2D2D15注意:●应服从基本假定●一个定性变量有三种类型,使用了两个虚拟变量,和代表的是同一个定性变量的两种不同类型●两个差异截距系数和表示的都是与基础类型的差异●一个定性变量多种类型时,虚拟变量可同时取值为0,但不能同时取值为1,因同一定性变量的各类型间“非此即彼”2iu1D2D116例2:已知1982年第一季度至1988年第四季度全国按季节市场用煤销售量Y(万吨),下图是关于煤销量对时间t的序列图。01,0002,0003,0004,0005,0006,0001982198319841985198619871988XY17从图中可以看出煤销售量随季节不同呈明显的周期性变化。由于受取暖用煤的影响,每年第四季度的销售量大大高于其他季度,给出三个虚拟变量,设D1=1(第四季度)D2=1(第三季度)0(其他季度)0(其他季度)D3=1(第二季度)0(其他季度)这里是以第一季度为基础类别(也可以选取其他)18构建模型,以时间t为解释变量估计结果如下:(26.04)(10.81)(13.43)(1.96)(0.83)R^2=0.95,DW=1.2,F=100.4由于D2、D3的系数没有显著性,说明第二、三季度可以归并入基础类别第一季度。于是只考虑一个虚拟变量D1,把季节因素分为第四季度和第一、二、三季度两类。12314253ttYtDDD^1232431.2491388.09201.8485tYtDDD19从上式剔除虚拟变量D2、D3,得煤销售量的模型如下:(32.03)(10.63)(14.79)R^2=0.94,DW=1.4,F=184.9^12515.8649.731290.91tYtD20(4)解释变量包含一个定量变量和两个定性变量模型这里的和代表的是两个不同的定性变量例如:Y为文化消费支出,X为收入基础类型:对比类型:用t检验分别检验和的统计显著性:验证两个定性变量对截距是否有影响iiiiiuXDDY22110iD1iD2iiiXDDXYE12021)()1,0,(iiiXDDXYE121021)()1,1,(12iiiXDDXYE11021)()0,1,(iiiXDDXYE1021)0,0,(10iD20iD11iD21iD高中及以上文化程度农村居民城镇居民高中以下文化程度21注意:●应服从基本假定●两个定性变量分别有两种类型,用了两个虚拟变量两个定性变量和一个定性变量三种类型都用了两个虚拟变量,但其性质是不同的●K个定性变量可选用K个虚拟变量去表示,这不会出现“虚拟变量陷阱”●代表不同定性变量的虚拟变量,可以同时为0,也可同时为1,因为不同定性变量间没有“非此即彼”的关系。iu222、用虚拟变量表示不同斜率的回归——乘法类型模型中斜率系数的差异,可用以乘法形式引入的虚拟变量去表示。23(1)回归模型比较——结构变化的检验模型基础类型:对比类型:可看出:以加法引入虚拟变量D的系数是截距的差异系数,以乘法引入虚拟变量D的系数是斜率的差异系数用t检验分别检验和的显著性:可检验此定性变量对截距和斜率是否有显著影响,即检验两个回归的结构是否有差异1120()iiiiiiYXDuDXiiiXDXYE10)0,(0211(,1)()()iiiEYXDX1224例3:已知中国进出口贸易总数据。试检验改革开放前后该时间序列的斜率是否发生变化。定义虚拟变量D如下:D=0(1950~1978),D=1(1979~1984)以时间t为解释变量,进出口贸易总额为被解释变量,估计结果如下:(1.35)(6.2)(-8.4)(9.6)=0.2818+0.0746t,D=0(1950~1978)-33.5991+1.3305t,D=1(1979~1984)^0.28180.074635.88091.2559tYtDtD25优点:●用一个回归替代了多个回归,简化了分析过程●可方便地检验各种假设●合并回归增加了自由度,可提高参数估计的精确性注意:●所比较的方程应是同方差,否则会出现异方差●应服从基本假定iu26(2)交互效应分析基本思想:分析两个定性变量对被解释变量影响的虚拟变量模型,暗含着假定:两个定性变量是分别独立影响被解释变量的。但在实际经济活动中,两个定性变量对被解释变量的影响可能存在交互作用。为描述这种交互作用,把两个虚拟变量的乘积以加法形式引入模型。模型:其中:——代表第一个定性变量的虚拟变量——代表第二个定性变量的虚拟变量()——描述二者交互效应的虚拟变量因为是交互效应的截距差异系数,可以通过对的显著性的检验,判断是否存在交互效应1iD2iD21iiDDiiiXDDXYE)()1,1,(3210213321210123()iiiiiiiDDDDYXu27例如其中:——种油菜籽和养蜂的收入——投入的资金——代表是否种油菜籽的虚拟变量=1种油菜籽=0不种油菜籽——代表是否养蜂的虚拟变量=1养蜂=0不养蜂()——描述种油菜籽与养蜂的交互效应iiiiiiiuXDDDDY)(213221101iD2iDiiDD21iYiX1iD1iD2iD2iD28(3)分段线性回归基本思想:有的社会经济现象的变动,会在解释变量达到某个临界值时发生突变,为了区分不同阶段的截距和斜率可利用虚拟变量进行分段回归第一段回归,当≤时(是临界值)第二段回归,当时整理得例如:不同销售业绩的奖励方式不同0iXiX*X*X*X(1)01iiiYXu)2(*21*10))(()(iiiuXXXY*(2)0212()iiiYXXuX*XY029如何实现分段回归?模型形式其中:1若≥0若≤第一段回归第二段回归注意:●第一、二段回归不仅截距不同,而且斜率也不同●分为两段回归时用了一个虚拟变量推理:分为K段回归时,可用K—1个虚拟变量*012()iiiiiYXXDXuDiXiX*X*X0*1(,,0)iiiiEYXDXX**0212(,),1)(iiiiEXXDXXY*XX2110*02XY1130例4:已知中国货币流通量LM数据(1952-1998)。通过对LM序列
本文标题:第七章经典计量经济模型的专门问题.
链接地址:https://www.777doc.com/doc-2118884 .html