您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 本科经济计量学第6章(第4版)
第6章虚拟变量回归模型第6章26.1虚拟变量的性质6.2ANCOVA模型:包含一个定量变量、一个两分定性变量的回归模型6.3包含一个定量变量、一个多分定性变量的回归6.4包含一个定量变量和多个定性变量的回归6.5比较两个回归6.6虚拟变量在季节分析中的应用6.7应变量也是虚拟变量的情形:线性概率模型6.8小结第6章3前面我们考虑的回归模型中的解释变量都是定量变量,本章将介绍在模型中如何引入定性变量并使模型更加丰富和完善。这类定性变量称为虚拟变量。第6章46.1虚拟变量的性质虚拟变量(dummyvariable):一种通常表明了具备或不具备某种性质的定性变量。通常将这类变量取值为0,1。用符号D表示。方差分析模型(ANOVA):解释变量仅是虚拟变量的模型。协方差模型(ANCOVA):回归模型中的解释变量有些是定量的,有些是定性的。第6章5我们来看ANOVA模型的一个例子:Yi=B1+B2Di+ui(6-1)其中,Y=每年食品支出男性女性,0,1iD此时的解释变量仅是一个虚拟变量。假定随机扰动项满足古典线性回归模型的基本假定,根据模型(6-1)得到:男性食品支出的期望为:121)0()0|(BBBDYEii2121)1()1|(BBBBDYEii女性食品支出的期望为:用OLS法很容易检验零假设:男女平均食品支出无显著性差异(即B2=0),并可根据t检验值判定b2是否统计显著。第6章6表6-1男、女食品支出与税后收入和年龄数据首先对数据进行整理,得到表6-2。例6.1男、女个体消费者每年的食品支出表6-1给出了2000~2001年男、女每年食品支出(美元)和税后收入(美元)的数据。年龄女性食品支出女性税后收入男性食品支出男性税后收入2519831155722301158925~3429872938737573332835~4429933146338213615145~5431562955432913544855~6427062513734293298865221714952253320437第6章7表6-2食品支出与税后收入和性别的关系观察值性别食品支出税后收入111983115572129872938731299331463413156295545127062513761221714952702230115898037573332890382136151100329135448110342932988120253320437然后利用这些数据建立虚拟变量模型:(Y是食品支出,女性取为1):Yi=B1+B2Di+ui用OLS回归结果如下:第6章8DependentVariable:YMethod:LeastSquaresSample:112Includedobservations:12VariableCoefficientStd.Errort-StatisticProb.C3176.833233.044613.631870.0000d1-503.1667329.5749-1.5267140.1578R-squared0.189026Meandependentvar2925.25AdjustedR-squared0.107929S.D.dependentvar604.387S.E.ofregression570.8404Akaikeinfocriterion15.6831Sumsquaredresid3258588.Schwarzcriterion15.7639Loglikelihood-92.09865F-statistic2.33086Durbin-Watsonstat1.582001Prob(F-statistic)0.15782Eviews输出结果如下:利用EViews软件操作讲解。第6章9从回归结果可以看出,估计的男性的平均食品支出为3176.83美元,女性的平均食品支出为3176.83-503.17=2673.66美元。回归结果也表明,b2是统计不显著的,也即男性与女性在食品支出上的差异不显著。前面已经说过,这类解释变量仅是虚拟变量的模型被称为方差分析模型(ANOVA)。实际上,这类模型的确可以用于判断两组(或多组)均值是否有显著不同。本例中,男女平均食品支出无显著性差异。第6章10虚拟变量的一些性质:(1)为了区别男、女两类的不同,我们仅引入了一个虚拟变量。一个虚拟变量足可以区分两个不同的种类。若模型包含截距项,如果模型(6-1)写为:其中,Y表示食品支出。iiiiUDBDBBY23121,女性,男性011iD,男性,女性012iD由于D1i与D2i存在完全共线性,所以无法估计模型(6-6)。(6-6)第6章11假定有一个样本,该样本包括三个男性,两个女性。其数据矩阵如下:cD1D2男Y1110男Y2110女Y3101男Y4110女Y5101数据矩阵右边的第一列代表了共同的截距B1。容易验证:D1=(1-D2)或D2=(1-D1)也即D1和D2完全共线性。陷入虚拟变量陷阱。第6章12一般的规则是:如果一个定性的变量有m类,则要引入(m-1)个虚拟变量。否则就会陷入虚拟变量陷阱(dummyvariabletrap),就会出现完全多重共线性。(2)虚拟变量的赋值是任意的。(3)赋值为0的一类常称为基准类(base)、对比类(benchmark)、控制类(control)、或遗漏类(omittedcategory)。基准类的选择也是根据研究的目的而定的。(4)虚拟变量D的系数称为差别截距系数,表明取值为1的类的截距值与基准类截距值的差距。第6章13例6.2工会会员比例与工作权利法为了研究工作权利法的效果(该法禁止了各种工会保护措施。因此预期通过工作权利法的州比未通过的州工会化程度低),Brennan等人建立了工会会员比例(属于工会的工人占所有工人的百分比)对工作权利法的函数模型。数据见表6-3(下页)。函数模型如下:PVTi=B1+B2RWLi+Ui其中PVT代表工会化程度,RWL是虚拟变量,通过工作权利法的州赋值为1,未通过的赋值为0。第6章14第6章15回归结果如下(见Eviews文件)DependentVariable:PVTVariableCoefficientStd.Errort-StatisticProb.C15.480000.75803220.421300.0000RWL-7.1609521.181308-6.0618870.0000R-squared0.428548Meandependentvar12.53137AdjustedR-squared0.416886S.D.dependentvar5.437150S.E.ofregression4.151912Akaikeinfocriterion5.723441Sumsquaredresid844.6804Schwarzcriterion5.799199Loglikelihood-143.9477F-statistic36.74647Durbin-Watsonstat2.419970Prob(F-statistic)0.000000回归结果表明,通过工人工作权利法的州中,工会化程度平均为8.32%,未实施工人权利法的州中,工会化程度平均为15.48%。因为虚拟变量的系数显著不为零。所以通过工作权利法的州与未通过的州的工会化程度有显著差异。第6章16图6-1私营部门的工会化程度(PVT)与通过工作权利法的州第6章176.2ANCOVA模型:包含一个定量变量、一个两分定性变量的回归模型一个ANCOVA模型:Yi=B1+B2Di+B3Xi+ui(6-8)其中,Y—食品支出X—税后收入D=,男性,女性01上面模型包含了一个定量变量X和一个定性变量D(性别)。第6章18对模型的解释如下:Yi=B1+B2Di+B3Xi+ui假定E(ui)=0,则男性平均食品支出为:E(Yi|Xi,Di=0)=B1+B3Xi女性平均食品支出为:E(Yi|Xi,Di=1)=(B1+B2)+B3Xi是两条同斜率不同截矩的平行直线。第6章19DependentVariable:YMethod:LeastSquaresSample:112Includedobservations:12VariableCoefficientStd.Errort-StatisticProb.C1506.244188.00968.0115290.0000X0.0589820.0061179.6417450.0000d1-228.9868107.0582-2.1388990.0611R-squared0.928418Meandependentvar2925.250AdjustedR-squared0.912511S.D.dependentvar604.3869S.E.ofregression178.7693Akaikeinfocriterion13.42239Sumsquaredresid287626.1Schwarzcriterion13.54361Loglikelihood-77.53432F-statistic58.36471Durbin-Watsonstat1.925985Prob(F-statistic)0.000007Eviews输出结果如下:比较该结果与前例结果。第6章20男性平均食品支出为:iiiXXY0589.0257.12770589.0987.228244.1506ˆˆ1506.2440.0589(611)iiYX女性平均食品支出为:(6-10)税后收入XY食品支出第6章216.3包含一个定量变量、一个多分定性变量的回归考虑表6-4提供的数据。该表给出了美国综合排名前65所大学研究生接受率及其他方面的数据。现在想知道这65所大学研究生接受率是否有地区差异。地区分为三类:南部(22所大学)、东北和中北部(33所)、西部(10所)。定义虚拟变量如下:,其他地区,东北和中北部地区012D,其他地区,西部地区013D不考虑学生学费支出,我们可以考察如下模型:Yi=B1+B2D2i+B3D3i+ui(6-12)第6章22由:Yi=B1+B2D2i+B3D3i+ui(6-12)很容易得到三个地区的研究生的平均接受率:东北和中北部地区:E(Yi|D2=1,D3=0)=B1+B2西部地区:E(Yi|D2=0,D3=1)=B1+B3南部地区(基准类):E(Yi|D2=0,D3=0)=B1利用Eviews软件运用OLS估计得到如下结果:第6章23DependentVariable:YIncludedobservations:65VariableCoefficientStd.Errort-StatisticProb.C44.540913.09755314.379380.0000D2-10.680303.998924-2.6707940.0097D3-12.500915.541072-2.2560450.0276R-squared0.122076Meandependentvar37.19538AdjustedR-squared0.093756S.D.dependentvar15.26186S.E.ofregression14.52881Akaikeinfocriterion8.235199Sumsquaredresid13087.36Schwarzcriterion8.335556Loglikelihood-264.6440F-statistic4.310587Durbin-Watsonstat0.957259Prob(F-statistic)0.017667即:南部地区研究生的平均接受率约为44.54%,东北和中北部地区约为33.86%,西部地区约为32.04%。见Eviews文件第6章24如果考虑学生年学费支出,我们可以考察如下模型:Yi=B1+B2D2i+B3D3i+B4Xi+u南部地区学校研究生的
本文标题:本科经济计量学第6章(第4版)
链接地址:https://www.777doc.com/doc-3203034 .html