您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第10章_虚拟变量回归模型
虚拟变量回归模型2虚拟变量的性质因变量受到一些定性变量的影响如:性别、种族、季节、不同历史时期等这类定性变量称为虚拟变量(dummyvariables)用D表示虚拟变量虚拟变量的取值通常为0和1虚拟变量—定性变量或分类变量令Y=年薪,建立如下模型:iiiuDBBY21男性就业者的平均年薪:1)0|(BDYEii女性就业者的平均年薪:21)1|(BBDYEii如果B2=0?说明不存在性别歧视例1:建立模型研究女性在工作中是否受到歧视定义一个虚拟变量:,女性,男性10D如果B2<0?说明存在性别歧视4包含一个定量变量、一个定性变量的回归模型(一)加法模型例1,再引入一个变量X=工作年限建立如下模型:iiiiuDBXBBY321如果B3=0?说明不存在性别歧视iiXBBYE21)(iiXBBBYE231)()(男性就业者的平均年薪:女性就业者的平均年薪:,女性,男性10D如果B3<0?说明存在性别歧视。5虚拟变量只影响截距不影响斜率——加法模型)()0,(21男性iiiiXBBDXYE)()()1,(231女性iiiiXBBBDXYE6如果随着工龄增加,男性与女性的年薪差距发生变化,则模型设为(二)乘法模型iiiiiuXDBXBBY321)()(21男性iiXBBYE)()()(321女性iiXBBBYE图2描绘了男性年薪增加较快的情况。虚拟变量只影响斜率而不影响截距的模型为乘法模型7(三)混合模型加法模型和乘法模型的结合:iiiiiiuDBXDBXBBY4321)()(21男性iiXBBYE)()()()(3241女性iiXBBBBYE用来表示截距和斜率都发生变化的模型,称为混合模型。例P768有多种分类情况下虚拟变量的应用例2、研究本科生、研究生和MBA毕业生的初职月薪有何差异。按照学历标准,有三类人员需引入两个虚拟变量其他研究生011D其他毕业生012MBAD9表1:本科生、研究生和MBA毕业生的初职月薪单位:人民币元D1D2YD1D2YD1D2Y0130001010000050001340010150000400013200101200004500125001012000046001250010140000700012700101600006000140001010000050001360010140000450012400101100004000125001080000550数据见表1其他研究生011D其他毕业生012MBADY=初职月薪uDBDBBY23121=建模:10根据表1的数据得OLS回归结果如下:212497719501DDYt=(4.45)(4.52)(15.59)75.128,898.0,905.022FRR截距项:本科生的平均初职月薪,研究问题的基准类;D1的系数:研究生与本科生平均初职月薪的差额;D2的系数:MBA毕业生与本科生平均初职月薪的差额。11引入的虚拟变量个数应该比研究的类别少一个,否则就会造成完全多重共线,即通常说的虚拟变量陷阱。12包含一个定量变量、两个定性变量的回归模型例3:研究的问题中需要按不同标准引入多个定性变量例:研究大学教师的年薪是否受到性别、学历的影响。按性别标准教师分:男、女两类引入一个虚拟变量;按学历标准大学教师分:大学本科、研究生、博士三类引入两个虚拟变量总计需要引入三个虚拟变量:女教师男教师011D012其他研究生D其他博士013D13年薪与教龄的关系本科女教师本科男教师研究生女教师研究生男教师博士女教师博士男教师分析的基准类本科女教师•B3:性别差异系数•B4:研究生与本科生的收入差异•B5:博士与本科生的收入差异;•B4、B5学历差异从上面分析结果可以得到各类别教师收入间的差异。令Y=年薪,X=教龄,建立模型如下:iiiuDBDBDBXBBY35241321E(Yi)=B1+B2XiE(Yi)=(B1+B3)+B2XiE(Yi)=(B1+B4)+B2XiE(Yi)=(B1+B3+B4)+B2XiE(Yi)=(B1+B5)+B2XiE(Yi)=(B1+B3+B5)+B2Xi14虚拟变量在季节分析中的应用每个季节的消费不同事实真的如此?如何验证?虚拟变量的引入与定义:一年四季,引入三个虚拟变量其他二季度数据012D其他三季度数据013D其他四季度数据014D建立模型ttttttuXBDBDBDBBY5443322115回归模型中的结构稳定性检验建立模型来拟合经济发展出现转折的情况16回归模型中的结构稳定性检验建立模型来拟合经济发展出现转折的情况**01ttttDt回归方程为ttttuDXBDBXBBY4321tttuXBBY21tttuXBBBBY)()(423117回归模型中的结构稳定性:虚拟变量法**01ttttDt进口商品支出回归方程为*123()ttttttYBBXBXXDu两条不同时期的直线在转折点连起成为一条折线。18用OLS法估计得到*123ˆ()tttttYbbXbXXD年1978*tt0tD12ˆttYbbX年1978*tt1tD*1323ˆ()()tttYbbXbbX做假设检验:H0:b3=0,H1:b30如果拒绝原假设,说明存在结构变化。19虚拟变量的交互影响婚姻状况与性别对工资的影响married:已婚取1famle:女性取1ˆlog()0.3210.1100.2130.301wagefemalemarriedfemalemarried
本文标题:第10章_虚拟变量回归模型
链接地址:https://www.777doc.com/doc-4129654 .html