您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 基于ARIMA-GM组合模型的邮电业务总量预测
基于ARIMA-GM组合模型的邮电业务总量预测摘要:对传统预测具有波动性及季节性双重趋势时间序列的模型—ARIMA乘积季节模型进行了改进,先用ARIMA乘积季节模型对邮电业务总量历史数据进行识别和拟合,然后用GM(1,1)模型对其带阀值的残差序列进行修正,最后结合二者得到ARIMA-GM这一组合预测模型.利用此模型对09年上半年中国邮电业务总量进行了预测,结果表明,组合预测方法比单项ARIMA乘积季节模型预测具有更高的精度.作为国民经济的基础性、先导性、支柱性的邮电业在经济增长方式转变和经济结构调整的历史性进程中发挥着巨大的作用,不仅满足国家、国民经济各部门以及人民群众的通信需要,而且通过提供优质、高效、低消耗的通信手段,能加快各种信息传递过程,加快社会生产过程,流通过程,节约社会劳动时间,邮电业对经济增长的间接贡献的幅度远大于直接贡献,其意义深远,准确的预测我国邮电业务量有利于邮电部门发展规划和政策的制定,及时解决邮电业存在的问题.邮电业务量往往受许多因素的制约,这些因素之间呈现出错综复杂的关系,其中,既包含线性关系又包含非线性关系,单纯用一种模型进行邮电业务量的预测很难同时考虑到线性和非线性变化.本文提出一种基于ARIMA-GM的组合模型,利用ARIMA乘积季节模型对周期型时间序列提取线性信息,然后用一种带阀值的GM改进模型对其残差进行修正提取非线性特征信息,最后结合二者构造出对邮电业务总量预测的组合预测方法,以弥补ARIMA模型非线性映射性能弱的不足,提高了预测的精度.1原理与方法1.1ARIMA乘积季节模型ARIMA模型,即求和-自回归-移动平均模型,简称B-J模型.在ARIMA模型中,变量的未来取值可以表达为过去若干个取值和随机误差的线性函数,该模型自产生以来,已经广泛的运用到了预测和控制的各个领域.若时间序列在进行D阶季节差分前进行了d阶的逐期差分后达到平稳.,则可以建立随机季节模型与ARIMA模型的结合—ARIMA乘积季节模型.一个阶数为(,,)(,,)spdqPDQ的乘积季节模型可以表示为:()()(1)(1)()()sdsDspptqQtBBBBXBBa其中212()1sssPsPPBBBB212()1sssQsQQBBBB212()1pppBBBB,212()1qpqBBBBta代表挠动或随机误差,s是一个季节循环中观测的个数,B为后移算子,p是自回归阶数,q是移动平均阶数,P是季节自回归阶数,Q是季节移动平均阶数.ARIMA乘积季节模型的建模步骤包括模式识别、参数估计、模型诊断和预测,前三个过程往往是一个模型逐渐完善的过程,需要不断修正最初的选择.1.2GM(1,1)模型灰色系统理论的建模机理主要是通过对已知的信息部分进行数据生成变换,提取有价值的信息,从而实现对整个系统的有效预测与控制.其中灰色GM(1,1)是应用最为广泛的预测模型之一,其实质是对原始数据序列作一次累加生成,使生成序列呈一定规律,并用典型曲线拟合来建立数学模型.建立过程:1作累加生成:累加生成所建立的生成函数是系统建模与预测的基础,假设原始数据序列(0)(0)(0)(0)((1),(2),,())xxxxn根据累加生成计算,可以将(0)x序列生成一个新序列(1)x(1)111((1),(2),,())xxxxn12(0)(0)(0)111((),(),,())nmmmxmxmxm2确定模型:依据新生成的序列,我们可以建立GM(1,1)模型的微分方程式为()(1)tdxaxdt其中,ˆaa,a、的具体求法可参考文献[1],将a、带回方程式,解得时间函数()(1)ˆ(1)(0)tatxtxeaa从而所得到的预测值为(0)(1)(1)ˆˆˆ(1)(1)()xtxtxt.3精度检验:残差检验、关联度检验、后验差检验.1.3ARIMA-GM组合模型由于邮电业务总量的历史数据中既有线性趋势又有非线性趋势,因此可以先使用ARIMA乘积季节模型预测邮电业务总量,获得每个实际观察值的ARIMA模型拟合序列及残差序列,使其线性规律包含在ARIMA模型的预测结果中,这时非线性规律包含在了ARIMA的预测残差序列中,对残差序列可用一阀值更新为非负序列,然后用GM(1,1)模型预测ARIMA乘积季节模型的残差序列,使非线性规律包含在GM模型的预测结果中.最后用ARIMA乘积季节模型的预测结果与GM(1,1)的预测相加得到组合预测模型的预测值,其原理如图所示:图1组合预测模型原理示意图2实例分析参照国家统计局发行的中国经济景气月报,以中国2003年1月到2008年12月的邮电业务总量建模,以2009年1~6月的邮电业务总量作为预测的实际参照值,以验证建模的可靠性.2.1ARIMA乘积季节模型预测邮电业务总量历史数据ARIMA乘积季节模型预测乘积季节模型预测结果(线性)乘积季节模型预测误差(非线性)G-M模型预测G-M模型预测结果(非线性)组合模型预测误差+=组合模型预测结果(线性规律+非线性规律)NOV2008SEP20...JUL2008MAY2008MAR2008JAN2008NOV2007SEP20...JUL2007MAY2007MAR2007JAN2007NOV2006SEP20...JUL2006MAY2006MAR2006JAN2006NOV2005SEP20...JUL2005MAY2005MAR2005JAN2005NOV2004SEP20...JUL2004MAY2004MAR2004JAN2004NOV2003SEP20...JUL2003MAY2003MAR2003JAN2003Date2200.002000.001800.001600.001400.001200.001000.00800.00600.00400.00邮电量图1邮电量历史数据时间序列图图1为2003年1月到2008年12月的邮电总量历史时间序列趋势图,从图中可以看出邮电业务总量总的趋势是增加的,但有的时期也存在局部下降,并且增长幅度不同,尤其是2008年上半年由于一些重大特殊因素的影响,如南方雪灾,汶川地震等导致邮电业务总量有明显较大波动.该时间序列既存在上升趋势又存在方差不齐,因此需要对其平稳化处理.进行一阶差分后发现,自相关图和非自相关图存在周期为12个月的季节波动,故再进行季节差分,经次季节差分后,ARIMA模型出季节波动已经消除,经过对阶数取不同的值拟合后反复比较,选取的ARIMA乘积季节模型为ARIMA12(1,1,0)(0,2,1),拟合之后,残差的pacf和acf条形图如图2、图3所示,从图中可以看出残差acf与pacf图没有任何模式且数值不大,这说明我们的模型选择适当,拟合比较成功.16151413121110987654321LagNumber1.00.50.0-0.5-1.0ACFLowerConfidenceLimitUpperConfidenceLimitCoefficientErrorfor邮电量fromARIMA,MOD_7NOCON16151413121110987654321LagNumber1.00.50.0-0.5-1.0PartialACFLowerConfidenceLimitUpperConfidenceLimitCoefficientErrorfor邮电量fromARIMA,MOD_7NOCON图2自相关(系数)函数图图3偏自相关(系数)函数图2.2组合模型预测为了分析残差子序列之间的关系,对残差子序列(),,qkkDsdpPn,取一常数阀值w得到一个新的非负序列()(),,kqkwkDsdpPn,这样既保持了非负序列与原序列的整体趋势不变,又适用于GM(1,1)模型对原数据的基本要求.针对ARIMA模型拟合后的残差序列,我们选取常数阀值为80.为用GM(1,1)模型预测2009年1~6月份的残差序列,在取一常数阀值80之后,我们把新残差序列按月份分为(06年1月,07年1月,08年1月),(06年2月,07年2月,08年2月),(06年3月,07年3月,08年3月),(06年4月,07年4月,08年4月),(06年5月,07年5月,08年5月),(06年6月,07年6月,08年6月),但从残差序列发现,某些特殊月份进行适当修正,原因是一些特殊重大影响因素,如08南方雪灾、汶川地震等事件都会造成数据出现异常,我们结合06年及07年的数据对08年残差出现明显波动的1、3、5月份数据,采用该点前后月份的平均值与前一年相应月份与相邻上月份的平均值加权得到新值来替代原始数据的值,为计算方便我们一般取权重为0.5,然后对每一组数据运用带阀值的GM(1,1)模型分别进行预测得到2009年1~6月份的业务量残差预测值ˆ()k,预测模型通过了精度检验,进一步还原后得到业务量残差预测值ˆ()qk.将ARIMA乘积季节模型的预测值与GM(1,1)模型的残差预测值综合在一起,我们就得到了组合模型的预测值,具体结果如下表表1所示.表1预测结果对比表从表1可以看出,用组合模型在预测精度方面比ARIMA乘积季节模型有较大提高,这说明运用GM(1,1)模型对残差序列的修正有效的提取了原时间序列的非线性特征信息.进一步计算可知ARIMA乘积季节模型预测的平均相对误差为4.05%,组合模型的平均相对误差为2.55%,可见本文所提出的ARIMA-GM组合模型的预测效果在整体上要优于单一ARIMA乘积季节模型.3结论(1)对具有波动及增长二重趋势的中国邮电业务总量,本文首先用ARIMA乘积季节模型提取其线性规律,继而对修正后的残差序列采用GM(1,1)模型提取其非线性信息,还原后得到残差的非线性信息,最后结合二者得到组合叠加预测模型.(2)本文利用09年上半年中国邮电业务总量进行具体应用研究,结果表明该模型比单纯用ARIMA乘积季节模型具有更好的预测精度.(3)邮电业的业务量往往受到多种因素的影响,如恶劣天气影响,交通运输能力等,对邮电业务量的预测往往很难做到绝对的准确,但总体上完全可以为邮电部门制订业务发展战略,人员调配提供可靠依据.2009年真实值ARIMA预测值相对误差/℅组合模型预测值相对误差/℅1月2015.42154.856.922130.605.722月1975.42029.192.722004.761.493月2244.02379.626.042345.514.524月2214.72277.022.812200.800.635月2274.22368.664.152334.652.666月2286.12324.091.662279.590.28
本文标题:基于ARIMA-GM组合模型的邮电业务总量预测
链接地址:https://www.777doc.com/doc-2568197 .html