您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 时间序列ARMA模型在海表温度中的应用
1时间序列ARMA模型在海表温度中的应用作者摘要:时间序列分析是概率统计学中应用性较强的一个分支,其在海表温度的预测等领域也有着广泛应用。海表温度(SST)是海洋与大气之间相互作用的关键因素,本文在对海表温度SST分析的基础上,展示海表温度在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。获得海表温度随时间过程的演变特性与规律,进而预测海表温度的未来发展。本文在时间序列ARMA模型的基础上,利用AIC准则对模型进行定阶,并对时间序列随机项利用Daniel进行平稳性检验以及残差利用Ljung-Box检验进行白噪声检验。关键词:海表温度;ARMA模型;AIC准则;Daniel检验;Ljung-Box检验中图分类号:文献标识码:A文章编号:1引言海表温度不仅是用于描述海洋表层热状况的主要指标,其异常还是海洋影响大气环流和气候变化的重要因子,在海气相互作用研究中,海表温度一直是人们观测、研究和预报的重要对象]1[。海洋约占地球表面积的70%,全球海洋吸收的太阳辐射量约占进入地球大气的总太阳辐射量的70%左右,对大部分存储在海洋表层。这些被存储的能量将以潜热、长波辐射和热交换的形式传输给大气,驱动大气运动。海洋热状况的变化将对大气运动的能量发生重要影响,从而引起全球气候和环境变化。由此可见,海洋是全球气候系统的组成部分,是调节和制约气候异常的重要因素]2[。海表温度是海洋的主要物理参数之一,在大气与海洋间热量、动量及水汽交换中扮演着重要角色。他是决定海气相互作用及气候变化的重要因素]3[。海表温度数据已经被广泛的运用到多个海洋研究领域。例如,海表温度是控制生物种群分布、洄游和繁殖的基本量]4[。因此海表温度数据集的研究、预测在实际生活中有着极其重要的作用。一个时间序列,展示了被研究对象在一段时间内发展变化过程。所谓时间序列方法,就是指在所研究对象的一组实测时间序列基础上,通过各种数学的分析处理手段,寻找序列变化特征、发展趋势与规律,进而对未来某时刻研究对象的状态作出估计。这样,就把影响研究对象的一切因素由“时间”综合起来描述了]5[。ARMA模型理论已被证明是实现平稳时间序列建模的有效工具之一,可用于谱估计、预测、控制、故障诊断等领域,具有广阔应用前景。滑动自回归(ARMA)模型不2仅与它以前时刻的响应有直接关系,而且还与它以前时刻的进入系统的扰动存在着一定的相关关系。这种模型与其他预测方法,具有以下特点:ARMA模型预测只考虑预测序列本身历史数据反映和包容的信息,几乎不直接考虑其他相关指标的信息;ARMA预测方法主要用于短期预测;由于ARMA预测模型不直接考虑其他相互因素的变动,预测方法比较简明,适合于指标数量不大但预测频度较高的预测工作]6[。趋势性、周期性、突变性是时间序列的基本特征,同样海表温度SST也有其相应的性质。而在做ARMA模型前,我们需对时间序列判断并剔除趋势项、周期项,从而得出随机项。目前国内外对ARMA模型的研究已相对较为完整,因此,在ARMA模型的处理方法中比较具有针对性。在对随机项做ARMA模型,首先需要对其进行平稳性检验,通过平稳性检验的随机项才能够用来建立ARMA模型。本文给出了观察时序图、自相关图检验、单位根检验以及Daniel检验法四种方法,并Daniel检验法对本文中随机项序列进行平稳性检验;平稳性检验通过则进行下一步,否则进行差分处理非平稳随机序列,本文对各海域大量的时间序列集做一阶差分,发现所有不平稳随机序列在一阶差分后达到平稳;在ARMA模型中,本文主要考虑的是对模型进行定阶,模型定阶目前主要有三种方法:一、对于平稳序列的自相关函数及偏自相关函数具有很好的截尾性特征的模型,可根据其截尾点来定阶,而对于ARMA模型的ACF与PACF都具有拖尾性,此种方法并不适用。二、残差方差图定阶法只能给出模型定阶的一个粗略的判定,因此本文不作过多考虑。三、在日本学者赤池(Akaike)提出的AIC准则基础上,我们给定阶数的范围从中寻找最优阶数,此种方法精确度相对较高可行,被本文所采用]7[;在ARMA模型阶数确定的基础上,本文求出残差,并利用Ljung-Box检验法对残差进行白噪声检验,证实模型的可靠性。2模型建立与分析滑动自回归(ARMA)模型在预测模型着起着重要的作用,利用其对时间序列海表温度随机项进行定阶,从而进行短期预测,对于海表温度的分析以及海表温度测试的准确性等,具有重要的现实意义。2.1ARMA模型介绍如果时间序列tX是独立的,没有任何相关关系,这样的资料所揭示的统计规律是事物独立的随机变动,系统无记忆能力,对于这样的问题可用多元统计分析进行研究;而如果时间序列tX之间有一定联系,我们需找出其运动规律,并根据这个规律建立模型,对系统未来的发展进行预测与控制。而如果一个系统在时刻t的响应tX不仅与它以前时刻t-1,t-2,……的响应1tX,2tX,……有直接关系,而且还与以前时刻t-1,t-2……进入系统的扰动1t,2t……存在一定的相关关系,那么此类系统为滑动自回归(ARMA)模型。数学模型如下:3tsXEtsEVarEXXXststttqpqtqttptptt,0)(,0)(,)(,0)(0,0211110其中:tX--随机过程t--白噪声过程特别的,当00时,称为中心化ARMA(p,q)模型,引进延迟算子,则可记为:ttBXB)()(其中,ppBBBB2211)(为p阶自回归系数多项式qqBBBB2211)(为q阶滑动平均系数多项式因此,在平稳时间序列建立模型时,可先拟合一个ARMA(p,q)模型,然后根据其参数值p,,21和q,,21是否显著为0这一信息来寻找较为合理的模型,再拟合相应模型检验其适应性]7[。根据ARMA模型的性质,给出ARMA模型定阶的流程图,如图1:4图1:ARMA模型定阶流程图YNNYNNYNYY时间序列数据白噪声检验判断趋势性剔除趋势项判断周期性剔除周期项得到随机项平稳性检验利用AIC准则对ARMA模来定阶、同时求出残差给出时间序列差分残差进行白噪声检验建模结束模型重选52.2预处理及分析在ARMA模型是定阶以及实现过程前,需对海表温度时间序列数据集进行处理。我们知道,时间序列具有加法模型]8[:ttttYSMX其中,tX:原始数据项;tM:趋势项;tS:周期项(季节项);tY:随机项。因此,在进行ARMA模型定阶预测前,我们需对时间序列进行趋势项检验剔除以及周期项检验剔除。这里,对海表温度数据集趋势项、周期项的检验与剔除不一一详述。2.3白噪声检验2.3.1白噪声定义时间序列tX,如果是由一组不相关的随机变量序列构成,及对于所有s不等于t的随机变量tX与sX的协方差为0,则为随机过程。对于纯随机过程,若期望和方差均为常数,则称之为白噪声过程。数学模型如下:如果序列tX满足:tXE,2tXVar,0,stXXCov,st则称tX为白噪声序列,记为2,~WNXt因此,白噪声序列是一组完全无关的时间序列集。在对一组时间序列数据集进行白噪声检验通过时,说明这组序列没有规律,不需要建立任何模型。同时,值得注意,在对ARMA模型残差序列进行白噪声检验时,需通过白噪声检验,上文中ARMA模型定义中可以看出残差序列是白噪声过程。2.3.2Ljung-Box白噪声检验白噪声是纯随机性序列,它具有性质kk,0。因此可以通过检验下列假设来检验序列是否是白噪声:0,:0:k1210使得mkHHm记:mkknttkntkttk,2,1,ˆ121其中,t为残差,m为t自相关函数的拖尾数。则统计量为LB(Ljung-Box)统计量6mkkknnnLB12ˆ)2(在原假设成立的条件下,LB近似服从自由度为m-r的卡方分布)(2rm,其中r是估计的模型参数个数,因此rmLB2时拒绝原假设。2.3平稳性检验2.3.1平稳性定义这里的平稳指宽平稳。即如果序列tX满足下列条件,则称为是平稳的:1.tXEt,2.tXVart,23.ktsXXCovXXCovksktst,,,,,2.3.1平稳性检验平稳性检验的方法很多,本文给出四种平稳性检验的方法,并使用Daniel检验法通过软件MATLAB来实现。方法一:观察时序图根据平稳性的定义,平稳序列具有常数均值和常数方差的性质,因此其时序图应该在一个常数值附近波动,且波动的范围有界;具有明显趋势性和周期性的序列通常不是平稳序列。方法二:自相关图检验平稳序列通常只具有短期的自相关,即自相关函数(ACF)往往很快的衰减到零。因此衰减很慢的序列很可能是非平稳的。方法三:单位根检验(ADF检验)ADF检验,在一定的显著性水平下。接受存在一个单位根的原假设,则说明序列是非平稳的。对于AR(p)过程,如果其特征方程的所有特征根都在单位圆内,则序列tx平稳,如果有一个特征根存在且为1,则序列非平稳,且自回归系数之和恰好等于1。证明如下:1010211111pppppLLL因此,对于AR(p)过程我们可以通过检验自回归系数之和是否等于1来检验序列的平稳性。作如下假设检验:1-0:0:2110pHHL7ADF检验统计量:ˆSˆ,其中ˆS为参数的样本标准差。ADF检验有三种类型,分别为:无常数均值、无趋势的p阶自回归过程:tptpttxxx11有常数均值、无趋势的p阶自回归过程:tptpttxxx11有常数均值、有线性趋势的p阶自回归过程:tptpttxxtx11方法四:Daniel检验这里着重强调Daniel检验法。Daniel检验法建立在Spearman相关系数的基础上。Spearman相关系数是一种秩相关系数。样本秩的概念如下:设nxxx21,是从一元总体抽取的容量为n的样本,其顺序统计量)()2()1(,nxxx。若)()(kixx,则称k是)(ix在样本中的秩,记为iR,对每一个i=1,2,……,n。称iR是第i个秩统计量。nRRR,,21总称为秩统计量。例如,对样本数据-0.8,-3.1,1.1,-5.2,4.2顺序统计量-5.2,-3.1,-0.8,1.1,4.2则秩统计量3,2,4,1,5对时间序列的样本nXXX21,,记tX的秩为)(ttXRR,考虑变量对),(tRt,t=1,2,…,n的Spearman的相关系数sq,有nitsRtnnq122)()1(61构造统计量212ssqnqT服从自由度n-2的t分布作如下假设检验0H:序列tX平稳,1H:序列tX非平稳8Daniel检验方法:对于显著水平,若)2(2ntT,则拒绝0H,认为序列非平稳。当0sq时,序列有上升趋势,而当0sq时,序列有下降趋势;)2(2ntT时,接受0H,认为序列平稳。2.4差分差分是通过逐项相减消除前后期数据相关性的方法,可继续剔除序列中的一些趋势性,是非平稳序列的均值平稳化处理常用方法。差分运算可用后移算法B或差分因子以及相应阶数d表示。1阶差分ttttXBXXX)1(12阶差分tttttXBXXXX2212)1(2……d阶差分tdtdXBX)1(其中,ddddddddBBBCBCB)1()1(1)1(11221为d阶差分算子。差分后序列可将非平稳序列转化为稳定在常数附近的平稳序列,对差分后的序列拟合ARMA模型进行分析与预测。本文对各个海域海表温度的数据测试时,剔除趋势项与周期项后的个别不平稳序列的
本文标题:时间序列ARMA模型在海表温度中的应用
链接地址:https://www.777doc.com/doc-2412704 .html