您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 股票报告 > 统计学回归分析大作业
建筑业总产值影响因素的分析一、问题的提出通过研究1995-2012年我国建筑行业总产值与建筑行业的动力装备率、劳动力人数、技术装备率以及国有企业总产值在行业总产值中所占比重的关系,来建立建筑行业总产值与其影响因素直接的归回模型,并分析其原因。本文全部数据来源于《中国统计年鉴》。表1.11995-2012年建筑行业总产值及其影响因素年份建筑行业总产值(亿元)动力装备率(千瓦/人)劳动力人数(万人)技术装备率(元/人)国有企业所占比重19955793.754.701497.874264.000.6319968282.254.602121.874154.000.5019979126.484.102101.514729.000.50199810061.994.302029.995127.000.45199911152.864.502020.135756.000.44200012497.604.601994.306304.000.40200115361.564.862110.667136.000.35200218527.184.912245.199675.000.30200323083.874.852414.279957.000.26200427745.385.802557.869297.000.26200534552.105.102699.929273.480.24200641557.164.922878.169109.140.22200751043.714.973133.719208.360.21200862036.815.503314.959915.000.20200976807.745.203672.5610088.000.20201096031.134.664160.449547.040.192011116463.325.663852.4712025.290.182012137217.865.694267.2413374.170.17为了研究影响建筑行业总产值的因素,把建筑行业总产值(亿元)作为被解释变量Y,将动力装备率(千瓦/人)、技术装备率(元/人)、劳动力人数(万人)、国有企业所占比重作为解释变量,分别设为X1、X2、X3、X4,假定其多元线性回归模型表示为:Y=β0+β1X1+β2X2+β3X3+β4X4二、相关性问题图2.1各变量之间的散点图散点图如图2.1所示。简单相关系数如表2.1所示。表2.1简单相关系数可以看出,建筑业总产值与劳动力人数相关度很高,与技术装备率和国有企业所占比重相关度也叫较高,而动力装备率相关度一般。但是由于所有的p值检验都小于0.05,所以变量还是可以用于建模的。三、建立回归模型利用强行进入发,建立初步模型。输出结果如下:1.拟合优度检验可以看出,复相关系数R为0.990,样本决定系数为0.981,调整后相关系数为0.975,说明方程拟合良好。2.回归方程显著性检验由表可知,F为167.393,P值为0,.000,说明回归方程高度显著,各解释变量整体上对被解释变量有高度显著的线形影响。3.回归系数检验由表可知,动力装备率,即X1P值大于0.05,未通过检验。其他变量均通过检验。4.残差分析——正态性检验如图所示,残差与正态分布直接存在较小差距,基本符合正态分布。5.残差分析——异方差分析有图表可知,被解释变量与残差相关系数为0.055,P值0.829,可以说没有异方差现象。6.自相关检验D.W值为1.435.。查表得,dl=0.574,du=1.631,所以不确定。有图示可以认为,残差之间不存在自相关性。7.共线性诊断只有技术装备率的VIF大于10.存在轻微共线性。所以,需要修改模型。四、修改模型1.模型存在的问题1.动力装备率X1未经过回归检验;2.有轻微的共线性;2.修改删除X1,再利用强行进入法建立模型。得到结果如下:DescriptiveStatisticsMeanStd.DeviationN建筑行业总产值42074.5972240200.24425518劳动力人数(万人)2726.283333827.877153618技术装备率(元/人)8274.415562691.38805318国有企业所占比重.3166666667.1378831559918Correlations建筑行业总产值劳动力人数(万人)技术装备率(元/人)PearsonCorrelation建筑行业总产值1.000.961.826劳动力人数(万人).9611.000.830技术装备率(元/人).826.8301.000国有企业所占比重-.747-.842-.928Sig.(1-tailed)建筑行业总产值..000.000劳动力人数(万人).000..000技术装备率(元/人).000.000.国有企业所占比重.000.000.000N建筑行业总产值181818劳动力人数(万人)181818技术装备率(元/人)181818国有企业所占比重181818Correlations国有企业所占比重PearsonCorrelation建筑行业总产值-.747劳动力人数(万人)-.842技术装备率(元/人)-.928国有企业所占比重1.000Sig.(1-tailed)建筑行业总产值.000劳动力人数(万人).000技术装备率(元/人).000国有企业所占比重.N建筑行业总产值18劳动力人数(万人)18技术装备率(元/人)18国有企业所占比重18VariablesEntered/RemovedbModelVariablesEnteredVariablesRemovedMethod1国有企业所占比重,劳动力人数(万人),技术装备率(元/人).Entera.Allrequestedvariablesentered.b.DependentVariable:建筑行业总产值ModelSummarybModelRRSquareAdjustedRSquareStd.ErroroftheEstimateDurbin-Watson1.990a.980.9766231.5130361.590a.Predictors:(Constant),国有企业所占比重,劳动力人数(万人),技术装备率(元/人)b.DependentVariable:建筑行业总产值ANOVAbModelSumofSquaresdfMeanSquareFSig.1Regression2.693E1038.976E9231.163.000aResidual5.436E81438831754.722Total2.747E1017a.Predictors:(Constant),国有企业所占比重,劳动力人数(万人),技术装备率(元/人)b.DependentVariable:建筑行业总产值CoefficientsaModelUnstandardizedCoefficientsBStd.Error1(Constant)-228727.62423531.485劳动力人数(万人)50.4803.486技术装备率(元/人)8.6661.552国有企业所占比重194120.92631268.974CoefficientsaModelStandardizedCoefficientstSig.CorrelationsBetaZero-orderPartial1(Constant)-9.720.000劳动力人数(万人)1.04014.479.000.961.968技术装备率(元/人).5805.585.000.826.831国有企业所占比重.6666.208.000-.747.856CoefficientsaModelCorrelationsCollinearityStatisticsPartToleranceVIF1(Constant)劳动力人数(万人).544.2743.647技术装备率(元/人).210.1317.635国有企业所占比重.233.1238.138a.DependentVariable:建筑行业总产值CoefficientCorrelationsaModel国有企业所占比重劳动力人数(万人)技术装备率(元/人)1Correlations国有企业所占比重1.000.343.761劳动力人数(万人).3431.000-.245技术装备率(元/人).761-.2451.000Covariances国有企业所占比重9.777E837445.78336909.143劳动力人数(万人)37445.78312.156-1.324技术装备率(元/人)36909.143-1.3242.408a.DependentVariable:建筑行业总产值CollinearityDiagnosticsaModelDimensionEigenvalueConditionIndex113.6941.0002.2893.5763.01515.9414.00336.835CollinearityDiagnosticsaModelDimensionVarianceProportions(Constant)劳动力人数(万人)技术装备率(元/人)国有企业所占比重11.00.00.00.002.00.01.01.043.01.88.32.004.99.11.67.96a.DependentVariable:建筑行业总产值ResidualsStatisticsaMinimumMaximumMeanPredictedValue4224.78906135586.5625042074.59722Std.PredictedValue-.9512.350.000StandardErrorofPredictedValue2049.7474660.5262824.607AdjustedPredictedValue3194.88916133515.8281342288.54061Residual-8164.22460911562.820313.000000Std.Residual-1.3101.856.000Stud.Residual-1.5372.123-.016DeletedResidual-11240.48046915130.299805-213.943388Stud.DeletedResidual-1.6252.484.001Mahal.Distance.8958.5642.833Cook'sDistance.000.348.071CenteredLeverageValue.053.504.167ResidualsStatisticsaStd.DeviationNPredictedValue39800.50936918Std.PredictedValue1.00018StandardErrorofPredictedValue830.15918AdjustedPredictedValue39527.97374818Residual5655.00593518Std.Residual.90718Stud.Residual1.02218DeletedResidual7225.22873518Stud.DeletedResidual1.08518Mahal.Distance2.40518Cook'sDistance.09418CenteredLeverageValue.14118a.DependentVariable:建筑行业总产值1.拟合优度分析有表可知,调整样本决定系数为0.976,拟合良好。2.回归方程显著性检测F=231.163。P=0.000,故明显显著。3.回归系数显著性检验三个变量t值均大于1.734,P值均为0.000,故通过检验。4.残差分析——正态性检验有图可以看到,基本符合正态性假设。5.残差分析——异方差分析由残差图和残差相关系数得知,不存在显著的异方差。6.自相关性分析。D.W.指数为1.590.查表得,du=1.27,故不存在自相关。7.共线性诊断各项VIF值均小于10,不存在明显的共线性。8.异常值检验
本文标题:统计学回归分析大作业
链接地址:https://www.777doc.com/doc-2064504 .html