您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 《虚拟变量回归》PPT课件
1虚拟变量回归1很多研究认为,影响商品房价格的因素有多个方面,例如:1.成本费用因素:包括土地、建筑物建造成本、其他费用;2.房地产供求因素:包括住房需求量、房地产开发量等;3.经济因素:包括宏观经济状况、物价状况、居民收入状况等;4.人口因素:包括人口密度、家庭结构等;5.社会因素:包括社会治安、城市化水平、消费心理等;6.行政(政策)因素:包括土地与住房制度、房地产价格政策等;7.区域因素:包括所处地段的市政基础设施、交通状况等;8.个别因素:包括朝向、结构、材料、功能设计、施工质量等;9.房地产投机因素:投机者在房地产市场中的投机活动;10.自然因素:包括自然环境、地质、地形、地势及气候等。(资料来源:徐静;武乐杰,房地产价格影响因素的解释结构模型分析,金融经济,2009年10期)2引子1影响房地产价格的复杂因素3在影响房地产价格的众多因素中,有定量的因素:成本因素、房地产供求因素、经济因素、人口因素等;也有定性的因素:社会因素、行政因素、区位因素、个别因素、投机因素、自然因素等。在研究房地产价格影响机理时,需要分析那些不易量化的定性因素对房地产价格是否真的有显著影响。能否把定性的因素也引入计量经济模型中呢?怎样才能在模型中有效地表示这些定性因素的作用呢?引子2男女大学生的消费真的有差异吗?当代大学生在消费结构呈现出多元化趋势。大学生除了日常生活费开支以外,还有人际交往、网络通讯、书报、衣着、化妆品、电脑、旅游、食品、学习用品、各种考证等消费。不同性别大学生的消费结构有所不同,专科生、本科生、研究生的消费结构更有差异。不同年级之间,男女同学之间,消费水平、消费结构、消费方式上都存在着差异。(注:来源于新华网等:共青团中央、全国学联共同发布的《2004中国大学生消费与生活形态研究报告》)为了研究男女大学生、不同层次大学生、不同年级大学生的消费结构是否有差异,需要将这些定性的因素引入计量模型,怎样才能在模型中有效地表示这类定性因素的作用呢?4第一节虚拟变量一、什么是虚拟变量5变量可分以为两类:数量变量与属性变量可用数量表现的变量只表明属性的不连续变量属性变量:不能精确计量的说明某种属性或状态的定性变量,如性别、民族、战争、政治事件◆本身是定性的二分类变量(非此即彼)◆本来是连续变量也可转换为定性变量(如上线/不上线)问题:属性变量一般难以直接用数据去度量虚拟变量:人工构造的取值为0和1的作为属性变量代表的变量称虚拟变量,一般常用D(dummy)表示D=0表示某种属性或状态不出现或不存在D=1表示某种属性或状态出现或存在虚拟变量的作用●作为属性因素的代表,如性别(男/女)●作为某些非精确计量的数量因素的代表,如受教育程度(高中及以下、专科、本科及以上)●作为某些偶然因素或政策因素的代表,如伊拉克战争、“911事件”、四川汶川大地震●时间序列分析中——作为季节(月份)的代表●分段回归——研究斜率、截距的变动●比较两个回归模型的差异●虚拟被解释变量模型:被解释变量本身是定性变量●面板数据回归中的应用6二、虚拟变量模型虚拟变量模型:包含有虚拟变量的模型称虚拟变量模型三种类型:1.解释变量中只包含虚拟变量作用:假定其他因素都不变,只研究某种定性因素在某定量变量上是否表现出显著差异(只论有无显著差异,不论差异的原因)2.解释变量中既含定量变量,又含虚拟变量作用:研究定量变量和虚拟变量同时对被解释变量的影响3.虚拟被解释变量模型:被解释变量本身取值为0或1作用:对某社会经济现象进行“是”与“否”判断研究(离散选择模型)7三、虚拟变量的设置规则1、虚拟变量取值虚拟变量D取值为0,还是取值为1,要根据研究的目的去决定,注意区分所代表的基础类型和比较类型D取值为0的类型—基础类型,作为比较的基准D取值为1的类型—与基础类型相比较的类型例如:D=0如果是女性(基础类型)D=1如果是男性(比较类型)D=0为“911事件”以前(基础类型)D=1为“911事件”以后(比较类型)D=0不是大学毕业生(基础类型)D=1是大学毕业生(比较类型)89和取值均为0的类型—基础类型:是比较的基准,代表了基准组(西部地区)的截距或分别取值为1的类型—是与基础类型比较的类型01122iiiiiYDDXu其中和为(与西部的)差异截距系数102为东部地区为中部地区为其他(不是东部)为其他(不是中部)11D10D21D20D1D1D2D2D又如,研究东、中、西部地区居民收入X与消费支出Y的关系:0iiiYXu11D当时01iiiYXu21D当时02iiiYXu注意:各类型间“非此即彼”,和不能同时取值为11D2D(是为了说明与基础类型的差异,而不是非基础类型相互之间比较的差异)10(1)对于有截距项的模型如果模型中每个定性因素有m个相互排斥的类型,模型中只能引入m-1个虚拟变量,否则会出现完全多重共线性例如:一个定性因素有三种类型,若设三个虚拟变量若;若,等等。显然此时,而截距对应的变量正是1,再次生成了截距项,则导致了完全的多重共线性,这称为“虚拟变量陷阱”。12310,0DDD则21310,0DDD则1231DDD0112233iiiiiiYDDDXu01231DDD2、避免落入“虚拟变量陷阱”11模型为此时虽然有,,,且,但因没有截距项(或视截距项对应变量为0),所以不会出现完全的多重共线性。注意:此时等参数不再是差异截距系数,而分别是相应类型的截距。112233iiiiiiYDDDXu12310,0DDD则21310,0DDD则31210,0DDD则123,,1231,0,0DDD时1iiiYXu2131,0,0DDD时2iiiYXu3121,0,0DDD时3iiiYXu(2)对于无截距项模型1231DDD第二节虚拟解释变量回归定性变量作为解释变量,既可以影响模型的截距,也可以影响模型的斜率,还可以同时影响截距和斜率一、用虚拟变量表示不同截矩的回归——加法类型虚拟变量以加法方式引入模型的作用:可以改变模型中截距,可分为各种情况去设置虚拟变量12只使截距变动(平行回归)只使斜率变动(共点回归)使截距与斜率都变动(不同的回归)131.解释变量只有一个分为两种类型的定性变量无定量变量的回归这种模型又称方差分析模型其中:Y为公立学校教师工资,D=0为农村学校;D=1为城镇学校分析条件期望:基础类型:比较类型:为差异截距系数,通过对系数的t检验:可检验在其他因素不变的条件下,城乡教师的工资是否有显著差别特点:假定其他因素都不变,只研究某种定性因素在某定量变量上是否表现出显著差异(只论有无显著差异,不论差异的原因)iiiYDu(0)iEYD(1)iEYD132、解释变量包含一个定量变量和一个分为两种类型的定性变量的回归例1:Y为服装消费X为收入,D=0为男性D=1为女性分析条件期望:基础类型:比较类型:为差异截距系数。对系数的t检验:可检验定性因素对截距是否有显著影响注意:●应服从基本假定●这里一个定性变量具有两种类型,只使用了一个虚拟变量(为什么?)iiiiuXDY10iiiXDXYE0)0,(iiiXDXYE)()1,(101iu114例2其中:——年工资——工龄D=1大学毕业及以上D=0其他(非大学毕业)非大学毕业(基准类型)大学毕业及以上iiiiuXDY10iiiXDXYE0)0,(iiiXDXYE)()1,(10iYiXiYiX10大学毕业非大学毕业15注意:同一个虚拟变量取值意义的设定要”非此即彼”3、解释变量包含一个定量变量和一个两种以上类型的定性变量的回归例如:高中以下、高中毕业、大学毕业及以上——三种类型模型——年工资——工龄=1只是高中毕业=1大学毕业及以上=0其他=0其他基础类型:(高中以下)比较类型:(高中)(大学及以上)差异截距系数为和问题:如果还要区分“专科”、“本科”、“硕士”、“博士”应怎么办?iiiXDDXYE021)0,0,(01122iiiiiYDDXu12iiiXDDXYE)()0,1,(1021iiiXDDXYE)()1,0,(2021iYiX1D1D2D2D16注意:●应服从基本假定●一个定性变量有三种类型,使用了两个虚拟变量,和代表的是同一个定性变量的两种不同类型●同一个虚拟变量取值意义的设定要”非此即彼”●两个差异截距系数和表示的都是与基础类型的差异●一个定性变量有多种类型时,虚拟变量可同时取值为0,但不能同时取值为1,因同一定性变量的各类型间“非此即彼”2iu1D2D1174、解释变量包含一个定量变量和两个定性变量例如模型:Y为文化支出,X为收入用t检验分别检验和的统计显著性:可以分别验证两个定性变量对截距是否有显著影响iiiiiuXDDY22110iD1iD2iiiXDDXYE12021)()1,0,(iiiXDDXYE121021)()1,1,(12iiiXDDXYE11021)()0,1,(iiiXDDXYE1021)0,0,(10iD20iD11iD21iD高中及以上文化程度农村居民城镇居民高中以下文化程度18对比类型:这里的和代表的是两个不同的定性变量,各分为两种类型基础类型:注意:●应服从基本假定●两个定性变量分别有两种类型,可以用两个虚拟变量,不会落入虚拟变量陷阱(为什么?)注意:“两个定性变量个两种类型”和“一个定性变量三种类型”都用了两个虚拟变量,但其性质是不同的。●K个定性变量可选用K个虚拟变量去表示,这不会出现“虚拟变量陷阱”●代表不同定性变量的虚拟变量,可以同时为0,也可同时为1,因为代表不同定性变量的虚拟变量之间并没有“非此即彼”的关系。iu19二、用虚拟变量表示不同斜率的回归加法形式引入虚拟变量只能分析不同截距(平行回归)的差异模型中斜率系数的差异,可用以乘法形式引入的虚拟变量去表示。——乘法类型重合回归同截距(共点)回归非相似(不同)回归20不同截距(平行回归)211.回归模型比较——结构变化的检验回顾:邹氏参数稳定性检验可以检验模型结构是否发生了变化:结构无变化作受约束模型;结构变化作无约束模型但是,邹氏检验只能检验模型结构是否发生变化,不能说明具体变化了多少,也不能说明究竟是截距变化还是斜率变化。1212()[,(2)](2)URUkFFknnknnRSSRSSRSkS2122用虚拟变量对结构变化的检验模型基础类型:对比类型:可看出:以加法引入虚拟变量D的系数是截距的差异系数,以乘法引入虚拟变量D的系数是斜率的差异系数用t检验分别检验和的显著性:可检验此定性变量对截距和斜率是否有显著影响,即检验两个回归的结构是否有差异优点:●用一个回归替代了多个回归,简化了分析过程●可方便地检验各种假设●合并回归增加了自由度,提高参数估计的精确性注意:●所比较的方程应是同方差,否则会出现异方差●应服从基本假定1120()iiiiiiYXDuDXiiiXDXYE10)0,(iiiXDXYE)()()1,(21101iu22.交互效应分析基本思想:分析两个定性变量对被解释变量影响的虚拟变量模型,暗含着假定:两个定性变量是分别独立影响被解释变量的。但在实际经济活动中,两个定性变量对被解释变量的影响可能存在交互作用。为描述这种交互作用,可把代表两个定性因素的虚拟变量的乘积以加法形式引入模型。模型:其中:——代表第一个定性变量的虚拟变量——代表第二个定性变量的虚拟变量()——描述二者交互效应的虚拟变量因为其中是交互效应的截距差异系数,可以通过对
本文标题:《虚拟变量回归》PPT课件
链接地址:https://www.777doc.com/doc-4959872 .html