您好,欢迎访问三七文档
民用航空客运量预测分析01020304数据来源年度预测月度预测模型讨论CONTENT0201数据来源PARTONE年度数据04变量选择X1表示国内生产总值(亿元)X2表示财政支出(亿元)X3表示定期航班航线里程(公里)X4表示铁路客运量(万人)X5表示公路客运量(万人)X6表示水运客运量(万人)X7表示民用航空旅客周转量(亿人公里)X8表示入境游客(万人次)X9表示国内居民出境人数(万人次)X10表示旅游人数(百万)Y表示民航客运量05月度数据0602年度预测PARTTWO预测方法利用两种方法进行回归比较08年度预测多元回归分析主成分分析多元回归分析9YX1X2X3X4X5Y10.995780.990360.97380.980490.8607Y.0001.0001.0001.0001.0001YX6X7X8X9X10Y10.416130.999230.846380.990820.99253Y0.068.0001.0001.0001.0001相关系数表从表中可以看出其中除了X6与Y的相关系数不大,也就是水运客运量与民用航空客运量中间并没有很强的关联外,其余因素与民航客运量都有着紧密的联系,这一点从现实生活中来看也是正确的。多元回归分析10相关分析表RootMSEDependentMeanR-SquareAdjR-SqFValuePrF241.64439134000.99970.99932485.82.0001VariableDFParameterStandardtValuePr|t|VarianceEstimateErrorInflationIntercept1199.42772259.498510.090.93180x11-0.003430.01596-0.210.83521764.1656x21-0.031770.04198-0.760.4709729.35745x31-0.000332170.00065376-0.510.625163.49637x41-0.009580.01758-0.540.600891.77256x510.001510.001151.30.2284272.14052x610.011710.097450.120.907318.97009x718.050430.934768.61.0001536.45094x81-0.001780.11995-0.010.988548.72046x91-0.294620.33188-0.890.4006193.97847x101-1.000971.7323-0.580.5793482.39321多元回归分析逐步删除变量后:此时变量x3的t检验没有通过且还存在共线性问题。假设自变量之间在实际生活背景下必然存在相关关系,不再进行处理,对y进行ln变换后回归。我们先就现有数据进行了异常值处理,自相关和异方差的检验。然而发现自相关和异方差都不能通过检验。11VariableDFParameterStandardtValuePr|t|VarianceEstimateErrorInflationIntercept1-192201579.18629-12.17.00010x310.002890.001751.650.11917.12092x410.179730.029156.17.00019.50727x810.501230.201272.490.0255.16999多元回归分析12相关分析表FValuePrFR-SquareAdjR-Sq414.78.00010.98110.9787VariableDFParameterStandardtValuePr|t|VarianceEstimateErrorInflationIntercept1-209151264.44198-16.54.00010x410.220830.0160113.79.00012.58875x810.736350.149944.910.00022.58875此时我们可以看到共线性基本已经消除,且方程参数均通过了t检验。且通过表十一可以看出R^2=0.9811,且方程通过显著性检验。多元回归分析13检验分析表查表可知du=1.53,dl=1.08,此时方程的dw值1.172落在无法判断区。Durbin-WatsonD1.172NumberofObservations191stOrderAutocorrelation0.206DFChi-SquarePrChiSq53.730.5885可以由概率为0.5885,得知方程存在异方差。多元回归分析通过学生化残差,库克距离,杠杆值判断是否存在异常值。因为存在异方差问题,通过多元加权最小二乘进行改进。改进后方程检验与预测。14多元回归分析15相关分析表ObsDependentPredictedStdErrorResidualStdErrorStudent-2-1012Cook'sVariableValueMeanPredictResidualResidualD140396315702.1147-22761106.5-2.057|****||0.568251175190619.5776-73.44691154.7-0.0636|||0355553784528.8172177111991.477||**|0.141456303931474.224716991221.61.391||**|0.097557554757436.4961997.57521235.60.807||*|0.027660946565384.5413-471.11221252.7-0.376|||0.004767228433350.7763-17121262.6-1.356|**||0.047875248861365.3652-13371258.5-1.063|**||0.032985949616418.7934-10221241.7-0.823|*||0.0261087597313465.2462144612251.18||**|0.067111212311796455.8845327.48911228.60.267|||0.003121382713468541.803359.42831193.20.301|||0.006131596816034491.4339-66.53391214.8-0.0548|||0141857618756490.1033-180.01631215.3-0.148|||0.001151925120944431.2399-16931237.4-1.368|**||0.076162305222065425.9583986.99971239.30.796||*|0.025172676925949535.577820.612611960.686||*|0.031182931730182729.0187-865.46931088.9-0.795|*||0.094193193630647783.9864128910501.228||**|0.28多元回归分析16相关分析表PearsonCorrelationCoefficients,N=19Prob|r|underH0:Rho=0x4x8rx410.78340.0124x4.00010.9598x80.783410.01958x8.00010.9366r0.01240.019581Residual11Log-LikelihoodValuesbPower-2.000-161.834-1.500-161.645-1.000-161.595a-.500-161.666.000-161.844.500-162.1101.000-162.4481.500-162.8432.000-163.281x8的相关系数较高,我们选择其作为我们的权重变量。且可知在幂数为-1时,对数似然函数值达到极大。多元回归分析17相关分析表ModelSummaryMultipleR.992RSquare.985AdjustedRSquare.983Std.ErroroftheEstimate447668.262Log-likelihoodFunctionValue-161.595ANOVASumofSquaresdfMeanSquareFSig.Regression204397346853696.0302102198673426848.020509.956.000Residual3206509967997.08916200406872999.818Total207603856821693.12018所以方程R^2=0.985,F值=509.956,P值远小于0.05,说明方程通过了显著性检验。多元回归分析残差图18、Durbin-WatsonD1.801NumberofObservations191stOrderAutocorrelation0.09相关分析图表D-W检验表多元回归分析19时间SRE_1SRE_21994年-2.05697-1.268721995年-0.063610.374031996年1.476781.309351997年1.390591.033871998年0.807370.488341999年-0.37607-0.552262000年-1.35563-1.480792001年-1.06278-1.193562002年-0.82312-0.993312003年1.180320.921942004年0.266560.452412005年0.301240.416412006年-0.054770.158412007年-0.14812-0.029312008年-1.36814-1.360292009年0.796441.456072010年0.686140.808242011年-0.79480-1.607842012年1.227771.07027在19组数据中,普通残差有10组负值,9组正值。正负数目基本相同。而加权残差有8组正值,11组负值。加权残差更偏正向一些。普通残差的绝对值最大为2.05697,我们看到加权残差已经改善到1.26872。虽然仍有出现残差变大的情况,但总体来说,残差得到了一定的改善。多元回归分析20、相关分析图表CoefficientsUnstandardizedCoefficientsStandardizedCoefficientstSig.BStd.ErrorBetaStd.Error(Constant)-21243.2251194.845-17.779.000x4.224.015.784.05115.357.000x8.730.150.248.0514.859.000最终我们得到多元线性回归方程:Y=-21243.225+0.224*x4+0.73*x8我们利用其对2013年的民航客运量进行预测,我们已知2013年:铁路客运量X4=210596.92入境游客X8=12907.78故预测得到2013年民航客运量为35353.16万人。所以在此回归方程下2013年民航客运量的预测值的标准差为21.735,我们可知实际值为35396.63万人误差百分比为0.1228%。主成分分析21上文中可知这组数据的共线性较大时是模型的一个比较严重的问题,所以我们拟采用主成分分析法去规避这个问题,看预测效果是否会更好。EigenvalueDifferenceProportionCumulative18.757830497.706086540.87580.875821.051743950.934069990.10520.98130.117673960.079424610.01180.992740.038249350.019555090.00380.996550.018694260.009879850.00190.998460.008814420.005440080.00090.999370.00337
本文标题:民航客运量预测分析
链接地址:https://www.777doc.com/doc-6845675 .html