您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > ARMA模型及SAS求解
age1of39第6讲时间序列分析教材:应用时间序列分析课件(中国人民大学王燕),SAS如何解及下载例程。时间序列分析(Timeseriesanalysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。时间序列是把反映现象发展水平的统计指标数值,按照时间先后顺序排列起来所形成的一组统计数字序列。时间序列又称动态数列或时间数列。时间序列分析就是利用这组数列,应用数理统计方法加以处理,以预测未来事物的发展。时间序列分析是定量预测方法之一,它的基本原理:一是承认事物发展的延续性。应用过去数据,就能推测事物的发展趋势。二是考虑到事物发展的随机性。任何事物发展都可能受偶然因素影响,为此要利用统计分析中加权平均法对历史数据进行处理。该方法简单易行,便于掌握,但准确性差,一般只适用于短期预测。时间序列预测一般反映三种实际变化规律:趋势变化、周期性变化、随机性变化。时间序列分析是根据系统观测得到的时间序列数据,通过曲线拟合和参数估计来建立数学模型的理论和方法。时间序列分析常用在国民经济宏观控制、区域综合发展规划、企业经营管理、市场潜量预测、气象预报、水文预报、地震前兆预报、农作物病虫灾害预报、环境污染控制、生态平衡、天文学和海洋学等方面。时间序列分析主要用途:①系统描述。根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述。②系统分析。当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理。③预测未来。一般用ARMA模型拟合时间序列,预测该时间序列未来值。④决策和控制。根据时间序列模型可调整输入变量使系统发展过程保持在目标值上,即预测到过程要偏离目标时便可进行必要的控制。基本步骤:①用观测、调查、统计、抽样等方法取得被观测系统时间序列动态数据。②根据动态数据作相关图,进行相关分析,求自相关函数。相关图能显示出变化的趋势和周期,并能发现跳点和拐点。跳点是指与其他数据不一致的观测值。如果跳点是正确的观测值,在建模时应考虑进去,如果是反常现象,则应把跳点调整到期望值。拐点则是指时间序列从上升趋势突然变为下降趋势的点。如果存在拐点,则在建模时必须用不同的模型去分段拟合该时间序列,例如采用门限回归模型。③辨识合适的随机模型,进行曲线拟合,即用通用随机模型去拟合时间序列的观测数据。对于短的或简单的时间序列,可用趋势模型和季节模型加上误差来进行拟合。对于平稳时间序列,可用通用ARMA模型(自回归滑动平均模型)及其特殊情况的自回归模型、滑动平均模型或组合ARMA模型等来进行拟合。当观测值多于50个时一般都采用ARMA模型。对于非平稳时间序列则要先将观测到的时间序列进行差分运算,化为平稳时间序列,再用适当模型去拟合这个差分序列。本章重点:1)建立p阶自回归)(pAR模型:tptptttxxxx221102)建立q阶移动平均)(qMA模型:qtqttttx22113)),(qpARMA模型:qtqtttptpttttxxxx221122110三个模型的拖尾、截尾性模型自相关系数k偏自相关系数kk)(pAR拖尾p阶截尾)(qMAq阶截尾拖尾age2of39),(qpARMA拖尾拖尾建模步骤:一.几个概念随机过程:{X(t);-t},其中X(t)是随机变量.随机序列:{Xk;k=…,-1,0,1,…},其中Xk是随机变量.特别当Xk=X(kh)时,序列{Xk}是过程{X(t)}的等间隔采样序列.根据随机变量X和它的样本的定义,我们有:样本序列:{…,x-1,x0,x1,…}是序列{xk}的一个样本序列,又称为一个实现,或一个观测序列等.请注意:随机变量X的一个样本,就是一个数;随机向量X的一个样本,就是一个向量数;随机序列{Xk}的一个样本,是一个无穷数列;在实际应用中,我们无法记录无穷数列,从而在讨论随机序列{Xk}的样本时,只能考虑一个样本的有限部分,比如{x1,x2,…,xn}是序列{Xk}的一段观测值序列.在理论讨论时,为了方便又不得不涉及无穷数列.这些都是学习和掌握时间序列分析时,首先要认清的起点.序列的分布:回忆随机变量X的定义便知,它的特征被它的概率分布所确定.同样,随机序列也被它的概率分布所确定.不过,随机序列的分布是无穷个随机变量的概率分布,其复杂性可以想像.这里为了避免涉及太深的概率论概念,我们仅考虑最简单的,即平稳非白噪声序列?计算ACF,PACFARMA模型识别估计模型中未知参数值模型优化模型预测模型检验即残差白噪声检验NY图6.0自回归滑动平均(ARMA)模型建模步骤Y平滑处理Nage3of39XkN(k,2k),它有密度fk(x)=(22k)-1/2exp{(x-k)2/22k}而且(Xk+1,Xk+2,…,Xk+m)有联合正态分布.于是有:期望(均值):EXk=xfk(x)dx=k,方差:Var(Xk)=E(Xk-k)2=(x-k)2fk(x)dx=2k.自协方差:kj=E[(Xk-k)(Xj-j)]=(x-k)(y-j)fkj(x,y)dxdy=E[(Xj-j)(Xk-k)]=jk.(注E[(X-EX)(Y-EY)]展开=E(XY)-E(X)E(Y)=cov(X,Y),协方差,不同事件之间的相关性度量)二.平稳性检验1.严平稳和宽平稳平稳时间序列有两种定义,根据限制条件的严格程度,分为:严平稳时间序列(strictlystationary)—指序列所有的统计性质都不会随着时间的推移而发生变化,即(Xk+1,Xk+2,…,Xk+m)的联合分布(实际很难求)与k无关。宽平稳时间序列(weekstationary)—指序列的统计性质只要保证序列的二阶矩平稳就能保证序列的主要性质近似稳定。如果在任取时间t、s和k时,时间序列tX满足如下三个条件:2tEX(6.1)tEX(6.2)))(())((tsktskkkssttXXEXXE(6.3)则称为宽平稳时间序列。也称为弱平稳或二阶平稳。对于正态随机序列而言,由于联合概率分布仅由均值向量和协方差阵决定,即只要二阶矩平稳,就等于分布平稳了。2.平稳时间序列的统计性质根据平稳时间序列的定义,可以推断出两个重要的统计性质:均值为常数。即式(6.2)的条件。自协方差只依赖于时间的平均长度(只与起点有关与跨度无关)。即式(6.3)的条件。如果定义自协方方差函数(autocovariancefunction)为:),())((),(tsXXEstsstt(6.4)age4of39那么它可由二维函数简化为一维函数)(ts,由此引出延迟k自协方差函数:)(),()(kkttk(6.5)容易推断出平稳时间序列一定具有常数方差:)0(),()(2ttXEDxttt(6.6)如果定义时间序列自相关函数(autocorrelationfunction),简记为ACF:stssttDXDXXXEst))((),((6.7)由延迟k自协方差函数的概念可以等价得到延迟k自相关函数的概念:)()0()()()0()()0()0()())(()(krkrkrkrkDXDXXXEkkttktkttt或直接定义:(6.8)容易验证自相关函数具有几个基本性质:1)0(;)()(kk;自相关阵为对称非负定阵;非惟一性。注意区分:协方差函数和相关函数——度量两个不同事件彼此之间的相互影响的程度。自协方差函数和自相关函数——度量同一事件在两个不同时期之间的相互影响的程度。3.样本的估计值在平稳序列场合,序列的均值等于常数意味着原本含有可列多个随机变量的均值序列变成了只含有一个变量的常数序列,所以常数均值的估计值为nxxntt1ˆ(6.9)同样可以根据平稳序列二阶矩平稳的性质,得到基于样本计算出来的各种估计值。延迟k自协方差函数的估计值:knxxxxkkntktt1))(()(ˆ(6.10)总体方差的估计值:age5of39knxxntt12)()0(ˆ(6.11)延迟k自相关函数的估计值:nttkntkttxxxxxxkk121)())(()0(ˆ)(ˆ)(ˆ(6.12)4.平稳性检验的方法对序列的平稳性检验有两种方法:一种是根据时序图和自相关图显示的特征做出判断的图检验方法;一是构造检验统计量进行假设检验的单位根检验(unitroottest)方法。是建模的前提,可借助SAS(见例程)、SPSS、Eviews等软件实现。时序图和自相关图检验单位根检验(unitroottest)所谓单位根检验就是通过检验时间序列自回归特征方程的特征根是在单位圆内还是在单位圆外(包括在单元圆上),来检验时间序列的平稳性。单位根检验统计量中最常用的是ADF检验统计量,又称增广DF检验(augmentedDickey-Fuller)。对任一p阶自回归AR(p)过程tptpttxxx11(6.13)它的特征方程为011ppp(6.14)如果该方程所有的特征根都在单位圆内,即pii,,2,1,1则序列tX平稳。如果至少存在一个特征根不在单位圆内,不妨设11,则序列tX非平稳,且自回归系数之和恰好等于1。即121p(6.15)因而,对于AR(p)过程可以通过检验自回归系数之和是否大于等于1来考察该序列的平稳性。设121p,那么原假设0H:0(序列tX非平稳),ADF检验统计量:)ˆ(ˆS(6.16)式中,)ˆ(S为参数的样本标准差。1979年,Dickey和Fuller使用蒙特卡洛模拟方法算出了检验统计量的临界值表。age6of39三.纯随机性检验如果序列值彼此之间没有任何相关性,那就意味着该序列是一个没有记忆的数据序列,即过去的行为对未来的发展没有丝毫影响,这种序列我们称之为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。因此,为了确保平稳序列还值不值得分析下去,需要对平稳序列进行纯随机性检验。5.纯随机序列(白噪声序列)如果在任取时间t和s时,时间序列tX满足如下三个条件:tEX(6.17)时当ststr2),((6.18)时当ststr0),((6.19)称此序列为纯随机序列,也称为白噪声(whitenoise)序列,简记为),(~2WNXt。之所以称之为白噪声序列是因为人们最初发现白光具有这种特性。比较平稳时间序列的定义,可看出白噪声序列一定是平稳序列,且是一种最简单的平稳序列。见图6.1所示是随机生成的1000个服从标准正态分布的白噪声序列观察值。标准正态分布白噪声序列Xt-4-3-2-10123401002003004005006007008009001000时间白噪声图6.1标准正态白噪声序列时序图根据白噪声序列的定义,白噪声序列具有三个重要的性质:常数均值(tEX);纯随机性(0),(str);方差齐性(2),(str,即序列中每个度量的方差相等)。age7of396.纯随机性检验即白噪声检验(通常对残差序列做)。Barlett证明,如果一个时间序列是纯随机的,得到一个观察期数为n的观察序列tX,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零、方差为序列观察数倒数的正态分布,即)1,0(~)(nNk(6.20)式中k为延迟期数,n为样本观察期数。根据Barlett定理,可以构造BPQ检验统计量和LBQ检验统计量来检验序列的纯随机性。原假设:延迟期数小于或等于m期的序列值之间相互独立,即)()
本文标题:ARMA模型及SAS求解
链接地址:https://www.777doc.com/doc-6857345 .html