您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 多重共线性和自相关的检验和解决
《计量经济学》课程实训项目报告项目名称多重共线性和自相关的检验及解决方法实训日期2012.11.23实训人53班级统计1005学号1004100508指导教师张维群应用软件SPSS实训地点实验楼314实训目的1.多重共线性和自相关的检验及解决方法的软件操作能力训练2.验证多重共线性和自相关的检验及解决方法的理论,并加深理解。实训内容1.根据自己在网上寻找到的感兴趣的数据,用膨胀因子法和相关系数法对其进行是否存在多重共线性的检验;运用图示法和D-W法对数据是否存在自相关进行检验。2.若检验出有多重共线性,则用逐步回归法剔除对因变量影响不大的解释变量;若检验出存在自相关,则用广义差分法建立新的模型进行解决。实训数据资料说明1.问题:我国GDP的增长率与第一产业增长率、第二产业增长率、第三产业增长率用最小二乘法回归时的模型是否存在多重共线性和自相关。若存在,先解决多重共线性再解决自相关并重新估计。2.指标有哪些?自变量有x1:第一产业增长率,x2:第二产业增长率,x3:第三产业增长率。因变量是y:GDP的增长率。3.数据来源什么地方?数据是从网上查找的,数据包括从1981—2010年我国的GDP增长率、第一产业增长率、第二产业增长率和第三产业增长率,为时间序列数据,样本量为30。实训结果与简要分析首先对原始数据进行用普通最小二乘法进行大致的拟合,并选择LinearRegression-Statistics-Collinearitydiagnostics,即用膨胀因子法对原模型进行多重共线性检验,结果如下:ModelSummaryModelRRSquareAdjustedRSquareStd.ErroroftheEstimate1.982a.965.961.55883表1ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression224.079374.693239.176.000aResidual8.12026.312Total232.19929表2CoefficientsaModel1(Constant)第一产业增长率第二产业增长率第三产业增长率UnstandardizedCoefficientsB.690.187.456.287Std.Error.400.047.030.042StandardizedCoefficientsBeta.169.742.344t1.7273.97115.0456.837Sig..096.001.000.000CollinearityStatisticsTolerance.740.553.531VIF1.3511.8091.883表3由表1可知模型的可决系数R^=0.9650.8,可见其拟合程度较好。由表2可知对于方程显著性的F检验,P值远小于0.05,所以模型的线性关系在95%以上的置信水平下显著成立。由表3可知对模型参数的t检验,P值均远远小于0.05,说明x1、x2、x3均通过了变量的显著性检验。在检验多重共线性的结果中,第一、二、三产业增长率的VIF都小于经验值10,所以运用膨胀因子法检验多重共线性的结果是解释变量间的不存在线性相关关系,接下来用相关系数法进行检验。结果如下:X1、X2、X3的相关系数矩阵CoefficientCorrelationsaModel第三产业增长率第一产业增长率第二产业增长率1Correlations第三产业增长率1.000-.479-.651第一产业增长率-.4791.000.445第二产业增长率-.651.4451.000Covariances第三产业增长率.002-.001-.001第一产业增长率-.001.002.001第二产业增长率-.001.001.001表4由表4可以看出,各解释变量之间的的相关系数并不高,在一定程度上验证了膨胀因子法显示的解释变量间的不存在线性相关关系的结论。下面对模型是否有自相关进行检验和解决:一、检验自相关1.图示法(1)拟合图GDP增长率与第一产业增长率拟合图GDP增长率与第二产业增长率拟合图图1图2GDP增长率与第三产业增长率拟合图图3分析:图1、图2、图3分别是第一产业增长率、第二产业增长率、第三产业增长率和GDP增长率的拟合图。由拟合图可以大致看出,数据点都大部分偏向回归线的一边,可见第一、二、三产业的增长率与GDP增长率的回归很有可能存在正的自相关,下面用残差图法进行检验。(2)残差图GDP增长率与模型残差的拟合图分析:由残差图推断该模型可能正的自相关,但要更加准确的确定是否具有自相关还需要继续进行D-W检验。2.D-W检验在用最小二乘法进行回归时,选择LinearRegression-Statistics-Durbin-Watson,得到结果如下:ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.982a.965.961.55883.537表5由表5可知,D-W值为0.537,小于三个解释变量,样本量为30的D-W统计量的Ld值1.214。可见,该数据存在正的自相关。二、解决自相关运用广义差分法解决自相关。需要建立新的模型:11t31t21t101-tt)-x()-x()-x(-1y-ytttttxxx)(由D-W值=0.537可以估计出=1-2537.0=0.7315,将新的因变量和解释变量分别计算出来再进行回归即得到以下结果:ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.993a.987.985.296401.862表6ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression164.891354.964625.615.000aResidual2.19625.088Total167.08728表7CoefficientsaModel1(Constant)nx1nx2nx3UnstandardizedCoefficientsB.072.247.405.372Std.Error.088.023.030.040StandardizedCoefficientsBeta.271.625.419t.81910.84613.2979.193Sig..420.000.000.000CollinearityStatisticsTolerance.844.238.253VIF1.1854.2023.948表8由表6可知模型的可决系数R^由0.965提高到了0.987,可见模型的拟合程度更好了。由表7可知对于方程显著性的F检验,P值远远小于0.05,所以模型的线性关系在95%以上的置信水平下显著成立。由表8可知对模型参数的t检验,P值均接近于0,说明x1、x2、x3均通过了变量的显著性检验。尤其是D-W值,由0.537变到了1.862,比较接近于2,可见自相关有了很大的改善。并且用膨胀因子法得出的VIF10,可见新的模型也不存在多重共线性。从新的模型可以看出,对参数1、2、3的估计值就是原模型三个解释变量的参数估计值,而现在的常数项为)(-10,所以0等于新模型常数项的估计值除以1-,即0=7315.01072.0=0.2682。所以新模型为:2682.0y+0.2471x+0.4052x+0.3723x综上所述,该模型不存在多重共线性但存在自相关,运用广义差分法解决自相关后,模型的拟合程度有显著提升,得到优化的模型将更有利于帮助我们分析经济问题。实训总结分析这次试验完成得比上次轻松了许多,因为使用软件的频率增加使得用起来更得心应手。这次的问题是检验和解决模型的多重共线性和自相关,因为多重共线性比自相关的影响程度更大,且对整个模型的变量个数都有影响,所以先检验和解决多重共线性再检验和解决自相关。经过膨胀因子和相关系数法检验本模型得出模型不存在多重共线性的结论,所以只需考虑自相关。自相关的检验和异方差类似,分为图示法和D-W法,在图示法部分完全一致,只是观察的特征不同。D-W法的检验结果显示模型存在正自相关,于是采用广义差分法对模型进行改善。经过计算得出了新的自变量和因变量,对其重新拟合的结果比之前的结果要好很多,可见对模型的优化是有效果的。每次看到这样的结果都很欣慰。一个好的模型是我们能让分析更准确和有效的重要保证,所以这是我们迈向成功的第一步。我会继续尽最大的努力学习计量经济学这门有趣又有用的学问,感谢张老师!
本文标题:多重共线性和自相关的检验和解决
链接地址:https://www.777doc.com/doc-2546807 .html