您好,欢迎访问三七文档
第十章现代时间序列模型时间序列分析是根据系统的有限长度的运行记录,建立能够比较精确反映时间序列中所包含的动态依存关系的数学模型。其主要分为确定性时间序列分析和随机性时间序列分析,本章主要讨论随机性时间序列分析。实验目的:掌握如何建立一个准确的时间序列模型。实验内容:一、时间序列数据的平稳性检验二、时间序列数据的平稳化处理三、时间序列数据模型的识别和定阶四、时间序列模型的参数估计五、时间序列模型的检验六、协整分析和误差修正模型知识准备:一、ARMA模型概述在现实中很多问题,如利率波动、收益率变化及汇率变化等通常是一个平稳时间序列或通过适当差分可以化成一个平稳序列。如果时间序列tx满足下列条件:axEt)(,a为与时间t无关的常数;2)(txVar,2为与时间t无关的常数;ssttxxCov),(,s为只与时间间隔s有关,与时间t无关的常数。则称该随机时间序列是平稳的,而该随机过程是一平稳随机过程。本节的讨论是在此平稳性假设成立下进行的。对于一个平稳时间序列通常用以下三个模型来刻划。1、自回归过程如果一个线性过程可表达为tptptttxXxx....2211(1)其中i,i=1,…p是自回归参数,t是是均值为零、方差为2的白噪声过程,则称tx为p阶自回归过程,用AR(p)表示。若用滞后算子(L)表示tttppxLxLLL)()...1(221(2)其中ppLLLL...1)(221称为特征多项式或自回归算子。与自回归模型常联系在一起的是平稳性问题。对于自回归过程AR(p),其平稳的充要条件是)(L的根全部落在单位圆之外。对于一般的自回归过程AR(p),其特征多项式可以分解为:)1)...(1)(1(...1)(21221LGLGLGLLLLppp(3)则tx可表达为:tppttLGkLGkLGkLx)1...11()(22111(4)其中pkkk,...,,21是待定系数。tx具有平稳性的条件是)(1L必须收敛,即应有1iG,i=1,2,…,p。而11211,...,,pGGG是特征方程0)(L的根,所以保证AR(p)具有平稳性的条件是特征方程的全部根必须在单位圆之外,即1/1iG。由上式可看出一个平稳的AR(p)过程可以转换成一个无限阶的移动平均过程(p个无穷级数之和)。保证AR(p)过程平稳的一个必要但不充分的条件是p个自回归系数之和要小于1,即11pii(5)AR(p)过程中最常用的是AR(1)、AR(2)过程,其各自的平稳性条件如下:AR(1)模型11(6)AR(2)模型12,112,112(7)2、移动平均过程如果一个线性随机过程可用下式表达qtqttttx...2211(8)其中1,2,…,q是回归参数,t为白噪声过程,则上式称为q阶移动平均过程,记为MA(q)。之所以称“移动平均”,是因为tx是由q+1个t和t滞后项的加权和构造而成。由定义知任何一个q阶移动平均过程都是由q+1个白噪声变量的加权和组成,所以任何一个移动平均过程都是平稳的。上式还可以用滞后算子(L)表示为:ttqqtLLLLx)()...1(221(9)其中qqLLLL...1)(221称为移动平均特征多项式或移到回归算子。与移动平均过程相联系的一个重要概念是可逆性。移动平均过程具有可逆性的条件是特征方程。qqLLLL...1)(221(10)的全部根的绝对值必须大于1。由(9)有ttxL)(1。由于)(L可表示为)1)...(1)(1()(21LHLHLHLq(11)所以有LHmLHmLHmLqq1...11)(22111(12)可见MA(q)具有可逆性的条件是)(1L收敛。对于1L,必须有1jH或11jH,j=1,2,…,q成立。而1jH是特征方程0)(L的根,所以MA(q)过程具有可逆性的条件是特征方程0)(L的根必须在单位圆之外。MA(q)过程中最常用的是MA(1)、MA(2)过程,其各自的可逆性条件如下:MA(1)模型11(13)MA(2)模型12,112,112(14)移动平均模型与自回归模型的关系如下:(1)一个平稳的AR(p)过程可以转换为一个无限阶的移动平均过程;(2)一个可逆的MA(p)过程可转换成一个无限阶的自回归过程;(3)对于AR(p)过程只需考虑平稳性问题,条件是L)=0的根(绝对值)必须大于1。不必考虑可逆性问题。(4)对于MA(q)过程,只需考虑可逆性问题,条件是L)=0的根(绝对值)必须大于1,不必考虑平稳性问题。3、自回归移动平均过程由自回归和移动平均两部分共同构成的随机过程称为自回归移动平均过程,记为ARMA(p,q),其中p,q分别表示自回归和移动平均部分的最大阶数。ARMA(p,q)的一般表达式如下:qtqtttptptttxxxx......22112211(15)即tqqtppLLLxLLL)...1()...1(221221(16)或ttLxL)()((17)其中)(L和)(L分别表示L的p,q阶特征多项式,分别称谓自回归算子和移动平均算子。ARMA(p,q)过程的平稳性只依赖于其自回归部分,即0)(L的全部根取值在单位圆之外(绝对值大于1)。其可逆性则只依赖于移动平均部分,即0)(L的根取值应在单位圆之外。二、平稳时间序列模型(一)模型识别以上介绍了随机过程的几种模型。实际中单凭对时间序列的观察很难确定其属于哪一种模型,而自相关函数和偏自相关函数是分析随机过程和识别模型的有力工具。1、自相关函数在给出自相关函数定义之前先介绍自协方差函数概念。对于一个均值为,方差为2的平稳随机过程,相隔k期的两个随机变量kttxx,的协方差即滞后k期的自协方差,定义为))((),(kttkttkxxExxCov(18)自相关系数定义)()(),(kttkttkxVarxVarxxCov(19)因为对于一个平稳过程有2)()(xkttxVarxVar所以(19)可以改写为02),(kxkttkxxCov(20)(1)自回归过程的自相关函数一阶自回归模型AR(1):tttxx11的k阶滞后自协方差为011111))((kkttktkxxE(21)因此,AR(1)模型的自相关函数为kkk10(22)由于AR(1)的稳定性知11,因此,当k时,其自相关函数呈指数衰减,直至零。这种现象称为拖尾。一般地,AR(p)过程滞后k期的自协方差函数为pkpkkk...2211(23)用0分别除(8)式的两端得pkpkkk...2211(24)可见,无论k有多大,k的计算均与其1到p阶滞后的自相关函数有关,因此,呈拖尾状。如果AR(p)是稳定的,则k递减且趋于零。(2)移动平均过程的自相关函数对MA(1)过程11tttx可以证明其自协方差函数为:(25)综合以上三种情形,MA(1)过程自相关函数为(26)可见,当k1时,0k,即kttxx,之间是不相关的,MA(1)自相关函数是截尾的。一般地,MA(q)过程的自相关函数为(27)当kq时,0k,说明k具有截尾特征。2、偏自相关函数偏自相关函数是描述随机过程结构特征的另一种方法。用kj表示k阶自回归式中第j个回归系数,则k阶自回归模型表示为tktkktktktxXxx....2211其中kk是最后一个回归系数。若把k=1,2…的一系列回归式kk看作是滞后期k的函数,则称kk为偏自相关函数。对于AR(p)过程,当kp时,0kk,当kp时,0kk。偏自相关函数在滞后期p以后有截尾特性,因此可用此特征识别AR(p)过程的阶数。因为任何一个可逆的MA(q)过程都可以转换成一个无限阶的系数按几何递减的AR过程,所以MA(q)过程的偏自相关函数呈缓慢衰减特征。qkqkkqkqiikikk,01,10,122112,01,0,)1(21221kkkk2,01,10,1211kkkkARMA(p,q)是自回归模型和移动平均模型的结合体,因此,其自相关函数和偏自相关函数都呈现出拖尾特征。由此得出随机序列识别原则的结论:(1)若序列tx的偏自相关函数在p以后截尾,即kq时,0kk,而它的自相关函数k是拖尾的,则该序列用自回归模型来拟合。(2)若序列tx的自相关函数在q以后截尾,即kq时,k=0,而它的偏自相关函数kk是拖尾的,则该序列用移动平均模型来拟合。(3)若序列tx的自相关函数k是拖尾巴的,并且它的偏自相关函数kk也是拖尾的,则该序列用自回归移动平均模型来拟合。(二)模型定阶模型的定阶方法主要有残差方差图定阶法、F检验定阶法、自相关函数和偏自相关函数定阶法及最佳准则函数定阶法。在这主要介绍利用样本的自相关函数和偏自相关函数,同时结合F检验来确定模型的阶数。1、自相关函数和偏自相关函数定阶法当然一个过程的自相关函数和偏自相关函数通常是未知的,用样本得到的只是估计的自相关函数和偏自相关函数。因此,在实际识别时,由于样本偏自相关函数的随机性,当kp时,kkˆ不会全为零,而是在零的附近波动。但可以证明,当kp时,kkˆ服从渐近正态分布)1,0(~ˆnNkk(28)式中n表示样本容量。因此,如果计算的kkˆ满足nkk2ˆ,我们有99.5%的把握判断该时间序列在kp之后截尾。同样可以证明,当kq时,kˆ也服从渐近正态分布)1,0(~ˆnNk(29)因此,如果计算的kˆ满足nk2ˆ,我们就有99.5%的把握判断该时间序列在kq之后截尾。2、F检验定阶法先对数据拟合ARMA(p,q)模型(假设不含常数项),设其残差平方和为Q0,再对数据拟合较低阶的模型ARMA(p-m,q-s),设其残差平方和为Q1。建立原假设H0:(30)在原假设成立的条件下有:(31)若FF.,则拒绝原假设,说明两模型差异是显著的,此时模型阶数存在升高的可能性。若FF.,此不能拒绝原假设,说明两模型差异不显著,此时模型阶数存在降低的可能性。(三)参数估计模型的参数估计方法有矩估计、最小二乘估计和最大似然估计。矩方法估计就是利用样本自协方差函数或样本自相关函数对模型参数进行估计,其估计精度较低。因此在模型估计过程中,常使用后两种。在此对这两种方法不在重述。(四)模型检验这一阶段主要检验拟合的模型是否合理。一是检验模型参数的估计值是否具有显著性;二是检验模型的残差序列是否为白噪声。参数估计值的显著性检验是通过t检验完成的,而模型的残差序列是否为白噪声的检验是用Box-Pierce(1970)提出的Q统计量完成的。Q检验的零假设是:(32)即模型的误差项是一个白噪声过程。Q统计量定义为(33)近似服从)(2ML分布,其中nL,n表示样本容量,m为模型中的参数00,000,02121qsqsqpmpmp))(,(~)()(001qppnsmFqppnQsmQQF0120,1mHm:)(~ˆ212mLnQLkk个数,k表示用残差序列计算的自相关系数值。Ljung和Box认为(33)式定义的Q统计量的分布与)(2ML分布存在差异(相应值偏小),于是
本文标题:现代时间序列模型
链接地址:https://www.777doc.com/doc-2224503 .html