您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 虚拟变量6452836875
1第5章虚拟变量2问题的提出1、计量经济学模型,需要经常考虑属性因素的影响。例如,职业、战争与和平、繁荣与萧条、文化程度、灾害、季节2、属性因素往往很难直接度量它们的大小。只能给出它们的“Yes—D=1”或”No—D=0”、或者它们的程度或等级。3、为了反映属性因素和提高模型的精度,必须将属性因素“量化”。通过构造0-1型的人工变量来量化属性因素。6模型中引入虚拟变量的必要性现实经济生活错综复杂,往往要求人们按照经济变量的质或量的不同,分别进行处理。因此,回归模型中,往往有必要引入虚拟变量,以表示这些质的区别。例如,消费函数,对于平时与战时,萧条与繁荣,乃至性别、教育程度、季节性等等,都会因质的有不同表现出不同的差异。7一、虚拟变量的定义虚拟变量是一用以反映质的属性的一个人工变量,通常记为D(Dummy)。虚拟变量D只取0或1两个值对基础类型或肯定类型设D=1对比较类型或否定类型设D=08虚拟变量举例1本科学历D=0非本科学历0“文革”时期D=1非“文革”时期9二、虚拟变量的引入虚拟变量在模型中,可以作解释变量,也可以作因变量。虚拟变量作解释变量时出现在方程的右端虚拟变量作因变量(被解释变量)时出现在方程的左端10三、虚拟变量模型引入虚拟变量后,回归方程中同时含有一般解释变量和虚拟变量,称这种结构的模型为虚拟变量模型11四、模型中引入虚拟变量的作用1、分离异常因素的影响,例如分析我国GDP的时间序列,必须考虑“文革”因素对国民经济的破坏性影响,剔除不可比的“文革”因素。2、检验不同属性类型对因变量的作用,例如工资模型中的文化程度、季节对销售额的影响。3、提高模型的精度,相当与将不同属性的样本合并,扩大了样本容量(增加了误差自由度,从而降低了误差方差)。12五、虚拟变量设置的原则在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:1、如果模型中包含截距项,而有m种互斥的属性类型,在模型中引入m-1个虚拟变量。例如,性别有2个互斥的属性,引用2-1=1个虚拟变量再如,文化程度分小学、初中、高中、大学、研究生5类,引用4个虚拟变量132、如果模型中不包含截距项,则一个质变量有m种特征,只需要引入m个虚拟变量。15第一节、变参数模型一、截距变动模型虚拟变量D与其它解释变量在模型中是相加关系,称为虚拟变量的加法引入方式。例如,讨论消费问题,消费水平C主要由收入水平Y决定,但是当特殊情况出现时政府会采取对消费品限量供应措施,因此引入虚拟变量D来表示这些特殊情况与非特殊情况。17二、斜率变动模型模型中虚拟变量与其它解释变量是相乘关系,称为虚拟变量的乘法引入方式。乘法引入方式引起斜率变动D=1异常时期D=0正常时期设定模型Y=b0+b1x+b2Dx+e异常时期模型:(截距相同斜率不同)Y=b0+(b1+b2)x+e正常时期模型:(截距相同斜率不同)Y=b0+b1x+e18三、截距与斜率同时变动模型D=1异常时期D=0正常时期设定模型Y=b0+b1x+b2D+b3Dx+e异常时期模型:(截距与斜率均不同)Y=(b0+b2)+(b1+b3)x+e反常时期模型:(截距与斜率均不同)Y=b0+b1x+e19第二节、数量因素与变参数模型在经济转折时期,可以建立临界值指标的虚拟变量模型来反映设转折时期t*转折时期的指标值=x*虚拟变量D=1(t=t*)D=0(tt*)模型y=b0+b1x+b2(x-x*)D+ett*时y=b0+b1x+et=t*时y=b0-b2x*+(b1+b2)x+e当t=t*时,x=x*两式计算的y相等,两条直线在转折期连接成一条折线20临界折线的图例y=b0+b1x*(t*)X*xyy=b0+b1x+b2(x-x*)D21第一节运用虚拟变量改变回归直线的截距b2b0xcY=b0+b1XY=(b0+b2)+b1XY=b0+b1X+b2D+eD=0正常D=1反常22第二节运用虚拟变量改变回归直线的斜率C=b0+b1xC=b0+(b1+b2)xxcY=b0+b1X+b2DXD=1反常D=0正常23第三节运用虚拟变量同时改变回归直线的截距和斜率Y=(b0+b2)+(b1+b3)x+eY=b0+b1x+e正常时期Y=b0+b1X+b2D+b3DX+eD=1反常D=0正常24本章例题例1设某地区职工工资的收入模型为:iitXY10式中,Y是职工工资收入;X是工龄考虑职工收入受教育程度的影响而引入合适的虚拟变量,对上述模型加以改进。25解:教育程度一般分为:高中以下,高中,大学及以上(包括大专)这样教育程度有三个特征,故引入两个虚拟变量,并设教育程度的改变,只影响截距的变动。D1=,0,1(高中—1,其它—0)012D(大学及以上—1,其它—0)则,截距变动模型:iiiDDXY231210截距和斜率都变动的模型:iiiiiDXDXDDXY251423121026例2、设季节的变化对某种商品的需求量有相当大的影响,该商品的需求模型为:ttttXXY22110式中,Y是商品的需求量,X1是价格,X2时收入,为了反映四个季节对商品需求量的影响,假定引入四个虚拟变量:01itD(第i季度—1,其它季度—0)(4,3,2,1i)问是否可用普通最小二乘法进行估计?为什么27解:通过观察,很容易发现:14321DDDD,说明虚拟解释变量D1,D2,D3,D4存在完全的多重共线性从而无法用普通最小二乘法进行估计。反映季节因素的商品需求模型为:tttttttDDDXXY3524132211028例3、由经济理论得知,进口消费品数量Y主要取决于国民收入X,我国改革开放前后进口消费品的数量发生明显变化,以1979年为转折期,建立进口消费品需求模型,并反映这种变化。29解:设我国进口消费品需求模型为:tttXY10以1979*t年为转折期,并设1979年的国民收入为tX*,并引入虚拟变量:**,0,1ttttDt进口消费品需求模型为:ttttttDXXXY*210当1979年以前,Dt为0,模型为:tttXY101979年以后,Dt为1,模型为ttttXXY21*2030第5章习题一、单项选择题1、如果一个回归模型中不包含截距项,对一个具有m个特征的质的因素需要引入的虚拟变量的个数为:A、mB、m-1C、m-2D、m+1312、设个人消费函数Yi=c0+c1Xi+ui中,消费支出Y不仅与收入X有关,而且与消费者的性别、年龄构成有关,年龄构成可分为青年、中年和老年三个层次,假设边际消费倾向不变,则考虑上述因素的影响,该函数引入虚拟变量的个数为:A、1个;B、2个;C、3个;D、4个3、设某商品需求模型为Yi=B0+B1Xi+ut,其中Y是商品的需求量,X是商品的价格,为了考虑全年12个月份季节变动的影响,假设模型中引入了12个虚拟变量,则会产生的问题是:A、异方差;B、序列相关;C、不完全的多重共线性;D、完全的多重共线性324、设截距和斜率同时变动模型为Yi=a0+a1D+B1Xi+B2(DXi)+ui,如果统计检验表明()成立,则上式为截距变动模型A、a1不等于0,B2不等于0;B、a1不等于0,B2等于0;C、a1等于0,B2等于0;D、a1等于0,B2等于0.335、若随机解释变量的变动,被解释变量的变动存在两个转折点,即有三种变动模型,则在分段线性回归模型中应引入虚拟变量的个数为:A、1个;B、2个;C、3个;D、4个二、分析题某行业利润Y不仅与销售额X有关,而且与季节因素有关。(1)如果认为季节因素使利润平均值发生变异,应如何引入虚拟变量?(2)如果认为季节因素使利润对销售额的变化额发生变异,应如何引入虚拟变量?34(3)如果认为上述二种情况都存在,又应如何引入虚拟变量?请对上述三种情况分别设定利润模型。虚拟变量是将非数量的品质因素影响加以量化描述的一种假设的变量,是对事物属性变化的一种虚拟的量化反应。在回归分析中,一些社会经济和自然现象的变化,如政治或经济政策的改变、自然条件的变化及文化风俗等等,都会对回归模型的建立和准确的预测带来影响。35如果将虚拟变量的出现和不出现加以变量化的约定,在一个回归模型中反映其出现和发展的轨迹,这样就可以提高回归模型预测的准确性。具体步骤如下:(1)分析历史数据的特征。分析历史数据就是将现象的历史资料数据通过做图表的方法,对其变化的轨迹进行分析判断。36通常做法是:在直角坐标系中将历史数据的点连接成轨迹线并加以分析。假如在现象发展的进程中除了相关变量的影响如果有虚拟变量发生,在轨迹线上会出现跳跃性的转折点。这些变化通常是某种政治、经济政策的改变或自然因素发生根本性变化的缘故,传统的回归模型对这些转折点的处理是无能为力的。37这里有必要注意的是虚拟变量D对YT的影响主要有两种形式:A,反映某种因素发生重大变异或政府政策发生变化的跳跃、间断的模型;B,具有转折点的系统趋势变化模型。38(2)建立虚拟变量的回归模型。在确定虚拟变量产生的个数和时间点后,就可以建立带虚拟变量的回归模型了。虚拟变量的个数的确定对方程的建立至关重要。在回归分析中,已有的自变量的个数已影响因变量的发展,而虚拟变量的引入使得回归模型的自变量个数得到改变。在建立虚拟变量的回归模型前,应首先按传统的方法建立回归模型,再将虚拟变量带入模型中。39如题。设计量模型:Y=a1+a2X+a3Z+e,若变量P作为制度因素通过对X、Z的影响间接地影响Y,那么在检验P对Y的影响时,可否直接回归方程Y=a1+a2*P*X+a3*P*Z+e?这是叫做交互项吗?回归结果出来以后,应该怎么解释呢?P可以直接放到模型1里面和X、Z共同作为自变量进行回归吗?40P可以与X、Z生成交互项然后重新放入模型中进行回归加入了较互项以后,具体解释如下,x和z对因变量Y的边际影响在一定程度上受P数值大小的决定,如果交互项足够显著的话。因此,加了交互项以后,最好要分析原自变量对因变量的边际影响(其值通过计算Y对x或z的导数求得)。关于是否将P作为独立自变量加入,根据你分析问题的需要而定,如果该变量的系数不够显著,便无必要加入了。4142
本文标题:虚拟变量6452836875
链接地址:https://www.777doc.com/doc-30693 .html