您好,欢迎访问三七文档
第一章博克斯—詹金斯预测法第一节概述一模型简介博克斯—詹金斯法,简称B-J法或ARMA法,是以美国统计学家GeogreE.P.Box和英国统计学家GwilymM.Jenkins的名字命名的一种时间序列预测方法。它主要试图解决以下两个问题:一是分析时间序列的随机性、平稳性和季节性;二是在对时间序列分析的基础上,选择恰当的模型进行预测。其预测模型分为:自回归模型(简称AR模型)、滑动平均模型(简称MA模型)和自回归滑动平均混合模型(简称ARMA模型)。下面分别介绍这三种模型:1.自回归模型自回归模型的公式为:tptpttteYYYY2211(9-1)式(9-1)中:p是自回归模型的阶数,原则上p可为任意非负整数,但是在实际应用中p的取值在1~2之间;Yt是时间序列在t期的观测,Yt-1是该时间序列在t-1期的观测值,类似的,Yt-p是时间序列在t-p期的观测值;Ф1,Ф2,…,Фp为自回归模型的参数;et是误差或偏差,表示不能用模型说明的随机因素。2.滑动平均模型滑动平均模型的公式为:qtqtttteeeeY2211(9-2)式(9-2)中:q是滑动平均模型的阶数,原则上q可为任意非负整数,在实际应用中q的取值在1~2之间;Yt是时间序列在t期的观测;et是时间序列模型在t期的误差或偏差,et-1是该时间序列模型在t-1期的误差或偏差,et-2是该时间序列模型在t-2期的误差或偏差,类似地,et-q是时间序列模型在t-q期的误差或偏差;Ф1,Ф2,…,Фp滑动平均模型的参数。3.自回归滑动平均混合模型自回归模型与滑动平均模型的有效组合,便构成了自回归滑动平均混合模型,即:qtqtttptpttteeeeYYYY22112211(9-3)各参数的含义和自回归和滑动平均模型相同。二博克斯—詹金斯法的基本思想博克斯—詹金斯法依据的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,即除去个别的因偶然原因引起的观测值外,时间序列是一组依赖于时间t的随机变量。这组随机变量所具有的依存关系或自相关性表征了预测对象发展的延续性,而这种自相关性一旦被相应的数学模型描述出来,就可以从时间序列的过去值及现在值来于预测其未来值。可见,博克斯-詹金斯法是以时间序列的自相关分析为基础的。三博克斯—詹金斯法的预处理运用博克斯—詹金斯法的前提条件是:作为预测对象的时间序列是一组零均值的平稳随机序列。平稳随机序列的统计特性不随时间的推移而变化。直观地说,平稳随机序列的折线图无明显的上升或下降的趋势如图9-1。但是,大量的社会经济现象随时间的推移,总表现出某种上升或下降的趋势,构成非零均值的非平稳的时间序列。对此的解决方法是在应用ARMA模型之前,对时间序列先进行零均值化和差分平稳化处理。1.零均值化处理所谓零均值化处理,就是指对均值不为零的时间序列中的每一项数值都减去该时间序列的平均数,构成一个新的均值为零的时间序列,即:YYXtt(9-4)式中:nttYnY11是原时间序列的平均数;n是时间序列的个数。2.差分平稳处理所谓差分平稳处理,就是指对零均值的非平稳时间序列进行差分,使之成为平稳的时间序列。即对序列Yt进行一阶差分,得到一阶差分序列tY:)1(,1tYYYttt(9-5)对一阶差分序列tY再进行一阶差分,得到二阶差分序列tY2:)2(,22112tYYYYYYtttttt(9-6)依此类推,可以得到n阶差分序列。一般情况下,非平稳序列在经过一阶差分或二阶差分后都可以实现平稳化。四博克斯—詹金斯法的预测流程博克斯和詹金斯在说明他们的预测方法时,曾绘制了图9-2所示的流程图。该预测方法把预测问题分为三个阶段:(1)模型识别;(2)模型参数估计和模型的检验;(3)预测应用。假设模型的一般分类判断检验该模型是否恰当估计初步使用模型的参数选定可以初步使用的模型利用模型作出预测否是第一阶段:模型的识别第二阶段:参数估计和模型检验第三阶段:预测应用图9-2博克斯-詹金斯法预测流程图在图9-2中,先假设预测模型的一般分类,博克斯—詹金斯法使用的模型是ARMA模型体系。第一阶段:利用自相关分析和偏自相关分析等方法,分析时间序列的随机性、平稳性和季节性,并选定一个特定的模型以拟合时间序列数据。模型的识别是博克斯—詹金斯法预测中至关重要的一步。识别模型是否恰当,需要有一个可以比较的标准,这里给出的标准是:对一般ARMA模型体系中的一些特征,分析其理论特征,把这种特定模型的理论特征,作为鉴别实际模型的标准,观测实际资料与理论特征的接近程度。最后,根据这种分类比较分析的结果,来判定实际模型的类型。第二阶段:用时间序列的数据,估计模型的参数,并进行检验,以判定该模型是否恰当。如不恰当,则返回第一阶段,重新确定模型。第三阶段:当一个恰当的模型选定以后,便进入了第三阶段,即对将来的某一时刻的数值做出预测。第二节重要参数解释一ARMA模型的自相关分析博克斯—詹金斯法是以时间序列的自相关分析为基础的,以便识别时间序列的模式,实现建模和完成预测的任务。自相关分析就是对时间序列求其本期与不同滞后期的一系列相关系数和偏自相关系数,据以识别时间序列的特性。1.自相关系数对时间序列Yt,Yt-k是其滞后1期数据形成的序列,Yt-2是其滞后2期数据形成的序列,一般地,Yt-k是其滞后k期数据形成的序列,时间序列相差k个时期的两项数据序列之间依赖程度或相关程度可用自相关系数rk表示:nttnktkttkYYYYYYr121(9-7)式中:n是时间序列Yt的数据的个数;nttYnY11是时间序列的平均值。相关分析与回归分析中变量之间的相关系数说明两个不同变量之间的相关程度,而自相关系数则是说明同一变量在不同时期的数据之间的相关程度。自相关系数rk与相关分析中的相关系数一样,取值范围在-1到1之间,即-1≤rk≤1。|rk|与1越接近,说明时间序列的自相关程度越高。自相关系数可提供时间序列及其模式构成的重要信息。对于纯随机序列,即一个完全由随机数字构成的时间序列,其各阶的自相关系数接近于零或等于零。而具有明显的上升或下降趋势的时间序列或具有强烈的季节波动或循环波动性质的时间序列,将会有高度的自相关性。这种信息的有用之处在于:我们对现有的时间序列数据及其模式无需任何的了解,就能得到其自相关系数。这些系数可以用来揭示我们所研究的时间序列数据的特性,并能帮助我们选定一个合适的模型。2.偏自相关系数在时间序列中,偏自相关是时间序列tY在给定了121,,,ktttYYY的条件下,通过剔除其它各期的影响,tY与滞后k期时间序列之间的条件相关。它用来度量当其它滞后1,2,3,…,k-1期时间序列的作用已知的条件下,tY与ktY之间的相关程度。这种相关程度可以用偏自相关系数kk来度量:)1,,2,1(,),3,2(,11,1,1,11,11,1111kikrrrrikkkikikktiiikiikikkkk(9-8)在博克斯—詹金斯法中,偏自相关系数被用来配合自相关系数,共同辨认适当的ARMA模型。在自回归模型的识别中,我们可以用偏自相关系数来初步判定模型的阶数;在滑动平均模型中,我们可以用自相关系数来识别滑动平均模型。二ARMA模型参数的初步估计1.P阶自回归模型参数的初步估计p阶自回归模型的公式为:tptpttteYYYY2211(9-9)利用Yule-Walker方程:pppppppprrrrrrrrr22112211211211(9-10)可求得参数p,,,21的值。对于一阶自回归模型AR(1),由式9-9可知:11r(9-11)对于二阶自回归模型AR(2),由式9-10可得:21212221211111rrrrrr(9-12)2.q阶滑动平均模型参数的初步估计q阶滑动平均模型的公式为:qtqtttteeeeY2211(9-13)由公式:2222122111qqkqkkkkr(9-14)可求得参数q,,,21的值。对于一阶滑动平均模型MA(1),由9-14式可得:21111r(9-15)解9-15式得:12112411rr(9-16)对于二阶滑动平均模型MA(2),由9-14式得:2221222221211111rr(9-17)第三节ARMA模型识别与检验一ARMA模型的识别将时间序列的自相关系数与偏自相关系数绘制成图,并标出一定的置信区间,这种图就称为自相关分析图。博克斯—詹金斯法中的自相关分析主要是利用自相关分析图来完成的。在自相关分析图中,自相关系数与偏自相关系数的置信区间(自相关分析图中的两条虚线之间的区域)都取为)/2,/2(nn,这里n是指时间序列中所含的数据的项数。1.P阶自回归模型的识别p阶自回归AR(p)模型的公式为:tptpttteYYYY2211它的偏自相关系数满足:kippiiki1,01,(9-18)因此,pkpkkk,0,非零常数(9-19)亦即,AR(p)模型的偏自相关系数Фkk是以p步截尾的。利用Фkk的截尾性就可以判定出AR(p)模型的阶数。以下是AR(1)和AR(2)的自相关分析图,以供参考之用。1-10k1-10k1-10k1-10k自相关系数偏自相关系数或图9-3一阶自回归模型的自相关分析图1-10k1-10k1-10k1-10k自相关系数偏自相关系数或图9-4二阶自回归模型的自相关分析图2.Q阶滑动平均模型的识别q阶滑动平均MA(q)模型的公式为:qtqtttteeeeY2211它的自相关系数为:qkqkrqqkqkkkq,01,1222212211(9-20)因此,0122221qqqr(9-21)亦即,当kq时,rk=0,但rq≠0,因,MA(q)模型的自相关系数rq具有q步截尾性。利用这一性质,可以判断出MA(q)模型的阶数。以下分别是MA(1)和MA(2)的自相关分析图。1-10k1-10k自相关系数偏自相关系数或图9-5一阶滑动平均模型的自相关分析图1-10k1-10k1-10k1-10k自相关系数偏自相关系数或图9-6二阶滑动平均模型的自相关分析图1-10k1-10k3.ARMA模型的识别由于自回归滑动平均混合模型式由自回归和滑动平均两部分组成,其自相关系数与偏自相关系数多比单纯的自回归模型与滑动平均模型复杂,如图9-7所示。按照博克斯—詹金斯法的要求,时间序列的项数应不少于50项,最好达到100项,自相关系数与偏自相关系数的滞后期最多不超过资料项数的1/4。这一点在使用ARMA模型时应当加以注意。1-10k1-10k1-10k自相关系数偏自相关系数或图9-7ARMA(p,q)模型的自相关分析图1-10k1-10k1-10k或或10k-110k-1或10k-110k-1二ARMA模型的检验对所建的ARMA模型优劣的检验,是通过对原始时间序列与所建的ARMA模型之间的误差序列et进行检验来实现的。若误差序列et具有随机性,就意味着所建立的模型已包含了原始时间序列的所有趋势(包括周期性变动),从而将所建立的模型应用于预测是合适的;反之,若误差序列et不具有随机性,则说明所建立的模型还有改善的余地,应对模型进行修正或重新建模。误差序列的这种随机性可利用博克斯—皮尔斯Q统计量法来进行。Q统计量可按下式
本文标题:博克斯-詹金斯预测
链接地址:https://www.777doc.com/doc-4932030 .html