您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 本科经济计量学第6章第4版
第6章16.1虚拟变量的性质6.2ANCOVA模型:包含一个定量变量、一个两分定性变量的回归模型6.3包含一个定量变量、一个多分定性变量的回归6.4包含一个定量变量、多个定性变量的回归6.5比较两个回归6.6虚拟变量在季节分析中的应用6.7应变量也是虚拟变量的情形:线性概率模型6.8总结前面我们考虑的回归模型中的解释变量都是定量变量,本章将介绍在模型中如何引入定性变量并使模型更加丰富和完善。这类定性变量称为虚拟变量。虚拟变量的性质虚拟变量(dummyvariable):一种通常表明了具备或不具备某种性质的定性变量。通常将这类变量取值为0,1。用符号D表示。方差分析模型(ANOVA):解释变量仅是虚拟变量的模型。协方差模型(ANCOVA):回归模型中的解释变量有些是定量的,有些是定性的。模型的一个例子:Yi=B1+B2Di+ui(6-1)其中,Y=每年食品支出男性女性,0,1iD此时的解释变量仅是一个虚拟变量。假定随机扰动项满足古典线性回归模型的基本假定,根据模型(6-1)得到:男性食品支出的期望为:121)0()0|(BBBDYEii2121)1()1|(BBBBDYEii女性食品支出的期望为:用OLS法很容易检验零假设:男女平均食品支出无显著性差异(即B2=0),并可根据t检验值判定b2是否统计显著。男、女食品支出与税后收入和年龄数据首先对数据进行整理,得到表6-2。例6.1男、女个体消费者每年的食品支出表6-1给出了2000~2001年男、女每年食品支出(美元)和税后收入(美元)的数据。年龄女性食品支出女性税后收入男性食品支出男性税后收入2519831155722301158925~3429872938737573332835~4429933146338213615145~5431562955432913544855~6427062513734293298865221714952253320437食品支出与税后收入、性别和年龄的关系观察值性别食品支出税后收入111983115572129872938731299331463413156295545127062513761221714952702230115898037573332890382136151100329135448110342932988120253320437然后利用这些数据建立虚拟变量模型:(Y是食品支出,女性取为1):Yi=B1+B2Di+ui用OLS回归结果如下::LeastSquaresSample:112Includedobservations:12VariableCoefficientStd.Errort-StatisticProb.C3176.833233.044613.631870.0000d1-503.1667329.5749-1.5267140.1578R-squared0.189026Meandependentvar2925.25AdjustedR-squared0.107929S.D.dependentvar604.387S.E.ofregression570.8404Akaikeinfocriterion15.6831Sumsquaredresid3258588.Schwarzcriterion15.7639Loglikelihood-92.09865F-statistic2.33086Durbin-Watsonstat1.582001Prob(F-statistic)0.15782Eviews输出结果如下:利用EViews软件操作讲解。从回归结果可以看出,估计的男性的平均食品支出为3176.83美元,女性的平均食品支出为3176.83-503.17=2673.66美元。回归结果也表明,b2是统计不显著的,也即男性与女性在食品支出上的差异不显著。前面已经说过,这类解释变量仅是虚拟变量的模型被称为方差分析模型(ANOVA)。实际上,这类模型的确可以用于判断两组(或多组)均值是否有显著不同。本例中,男女平均食品支出无显著性差异。虚拟变量的一些性质:(1)为了区别男、女两类的不同,我们仅引入了一个虚拟变量。一个虚拟变量足可以区分两个不同的种类。若模型包含截距项,如果模型(6-1)写为:其中,Y表示食品支出。iiiiUDBDBBY23121,女性,男性011iD,男性,女性012iD由于D1i与D2i存在完全共线性,所以无法估计模型(6-6)。(6-6)假定有一个样本,该样本包括三个男性,两个女性。其数据矩阵如下:cD1D2男Y1110男Y2110女Y3101男Y4110女Y5101数据矩阵右边的第一列代表了共同的截距B1。容易验证:D1=(1-D2)或D2=(1-D1)也即D1和D2完全共线性。陷入虚拟变量陷阱。一般的规则是:如果一个定性的变量有m类,则要引入(m-1)个虚拟变量。否则就会陷入虚拟变量陷阱(dummyvariabletrap),就会出现完全多重共线性。(2)虚拟变量的赋值是任意的。(3)赋值为0的一类常称为基准类(base)、对比类(benchmark)、控制类(control)、或遗漏类(omittedcategory)。基准类的选择也是根据研究的目的而定的。(4)虚拟变量D的系数称为差别截距系数,表明取值为1的类的截距值与基准类截距值的差距。工会化程度与工作权利法为了研究工作权利法的效果(该法禁止了各种工会保护措施。因此预期通过工作权利法的州比未通过的州工会化程度低),Brennan等人建立了工会会员(属于工会的工人占所有工人的百分比)对工作权利法的函数模型。数据见表6-3(新教材P216)。函数模型如下:PVTi=B1+B2RWLi+Ui其中PVT代表工会化程度,RWL是虚拟变量,通过工作权利法的州赋值为1,未通过的赋值为0。回归结果如下(见Eviews文件)DependentVariable:PVTVariableCoefficientStd.Errort-StatisticProb.C19.806671.16269117.035200.0000RWL-9.3916671.838376-5.1086760.0000R-squared0.352214Meandependentvar16.05000AdjustedR-squared0.338719S.D.dependentvar7.831263S.E.ofregression6.368320Akaikeinfocriterion6.579727Sumsquaredresid1946.664Schwarzcriterion6.656207Loglikelihood-162.4932F-statistic26.09857Durbin-Watsonstat0.847527Prob(F-statistic)0.000006回归结果表明,通过工人工作权利法的州中,工会化程度平均为10.415%,未实施工人权利法的州中,工会化程度平均为19.8%。因为虚拟变量的系数显著不为零。所以通过工作权利法的州与未通过的州的工会化程度有显著差异。模型:包含一个定量变量、一个两分定性变量的回归模型一个ANCOVA模型:Yi=B1+B2Di+B3Xi+ui(6-8)其中,Y—食品支出X—税后收入D=,男性,女性01上面模型包含了一个定量变量X和一个定性变量D(性别)。对模型的解释如下:Yi=B1+B2Di+B3Xi+ui假定E(ui)=0,则男性平均食品支出为:E(Yi|Xi,Di=0)=B1+B3Xi女性平均食品支出为:E(Yi|Xi,Di=1)=(B1+B2)+B3Xi是两条同斜率不同截矩的平行直线。:LeastSquaresSample:112Includedobservations:12VariableCoefficientStd.Errort-StatisticProb.C1506.244188.00968.0115290.0000X0.0589820.0061179.6417450.0000d1-228.9868107.0582-2.1388990.0611R-squared0.928418Meandependentvar2925.250AdjustedR-squared0.912511S.D.dependentvar604.3869S.E.ofregression178.7693Akaikeinfocriterion13.42239Sumsquaredresid287626.1Schwarzcriterion13.54361Loglikelihood-77.53432F-statistic58.36471Durbin-Watsonstat1.925985Prob(F-statistic)0.000007Eviews输出结果如下:比较该结果与前例结果。男性平均食品支出为:iiiXXY0589.0257.12770589.0987.228244.1506ˆˆ1506.2440.0589(611)iiYX女性平均食品支出为:(6-10)税后收入XY食品支出包含一个定量变量、一个多分定性变量的回归考虑表6-4(新教材P219)提供的数据。该表给出了1951年美国50个州的公立学校和哥伦比亚公立学校教师的平均薪水和每个学生的公共教育支出的数据。现在想知道教师薪水是否有地区差异。地区分为三类:东北和中北部(21个)、南部(17个)、西部(13个)。定义虚拟变量如下:,其他地区,东北和中北部地区012D,其他地区,南部地区013D不考虑学生支出,我们可以考察如下模型:Yi=B1+B2D2i+B3D3i+ui(6-12)如果考虑学生支出,我们可以考察如下模型:Yi=B1+B2D2i+B3D3i+B4Xi+u西部地区的公立学教师平均年薪水:E(Yi|D2=0,D3=0,Xi)=B1+B4Xi东北和中北部地区的公立学教师平均年薪水:E(Yi|D2=1,D3=0,Xi)=(B1+B2)+B4Xi南部地区的公立学教师平均年薪水:E(Yi|D2=0,D3=1,Xi)=(B1+B3)+B4Xi回归直线是三条同斜率不同截矩的平行直线。:LeastSquaresSample:151Includedobservations:51VariableCoefficientStd.Errort-StatisticProb.C26158.621128.52323.179520.0000d2-1734.4731435.953-1.2
本文标题:本科经济计量学第6章第4版
链接地址:https://www.777doc.com/doc-3203036 .html