您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 第四章平稳时间序列模型的建立
第四章平稳时间序列模型的建立第一节时间序列的预处理第二节模型识别与定阶第三节模型参数估计第四节模型检验与优化第五节其它建模方法1、建模流程(有限长度)时序样本→模型识别与定阶→模型参数估计→模型适用性检验→模型优化2、基本前提⑴平稳序列{Xt}⑵零均值序列EXt=0建模步骤流程图平稳非白噪声序列计算样本相关系数模型识别参数估计模型检验模型优化序列预测YN一、平稳性检验二、纯随机性检验三、计算样本自相关函数四、关于非零均值的平稳序列第一节时间序列的预处理•本章所介绍的是对零均值平稳序列建立ARMA模型,因此,在对实际的序列进行模型识别之前,应首先检验序列是否平稳,若序列非平稳,应先通过适当变换将其化为平稳序列,然后再进行模型识别.•序列的非平稳包括均值非平稳和方差非平稳.•均值非平稳序列平稳化的方法:差分变换.•方差非平稳序列平稳化的方法:对数变换、平方根变换等.•序列平稳性的检验方法和手段主要有:序列趋势图、自相关图、单位根检验、非参数检验方法等等.一、平稳性检验—图检验方法(一)时序图检验–根据平稳时间序列均值、方差为常数的性质,平稳序列的时序图应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及周期特征.(二)自相关图检验–平稳序列通常具有短期相关性.该性质用自相关函数来描述就是随着延迟期数的增加,平稳序列的自相关函数会很快地衰减向零.例题•例1–检验1964年——1999年中国纱年产量序列的平稳性•例2–检验1962年1月——1975年12月平均每头奶牛月产奶量序列的平稳性•例3–检验1949年——1998年北京市每年最高气温序列的平稳性例1时序图例1自相关图例2时序图例2自相关图例3时序图例3自相关图(一)纯随机序列的定义•纯随机序列也称为白噪声序列,它满足如下两条性质二、纯随机性检验TststststTtEXt,,,0,),()2(,)1(2(二)纯随机性检验检验原理假设条件检验统计量判别原则应用举例Barlett定理•如果一个时间序列是纯随机的,得到一个观察期数为的观察序列,那么该序列的延迟非零期的样本自相关系数将近似服从均值为零,方差为序列观察期数倒数的正态分布0,)1,0(~ˆknNkn1、检验原理2、假设条件•原假设:延迟期数小于或等于期的序列值之间相互独立•备择假设:延迟期数小于或等于期的序列值之间有相关性1,0210mHm:mkmHk,:至少存在某个1,01mm3、检验统计量•Q统计量•LB统计量)(~ˆ212mnQmkk)(~)ˆ()2(212mknnnLBmkk4、判别原则•拒绝原假设–当检验统计量大于分位点,或该统计量的P值小于时,则可以以的置信水平拒绝原假设,认为该序列为非白噪声序列•接受原假设–当检验统计量小于分位点,或该统计量的P值大于时,则认为在的置信水平下无法拒绝原假设,即不能显著拒绝序列为纯随机序列的假定21()m121()m1例4、标准正态白噪声序列纯随机性检验样本自相关图5、应用举例检验结果LBQLBQ延迟统计量检验统计量值P值延迟6期2.360.8838延迟12期5.350.9454由于P值显著大于显著性水平,所以该序列不能拒绝纯随机的原假设.例5、对1950年—1998年北京市城乡居民定期储蓄所占比例序列的平稳性与纯随机性进行检验自相关图白噪声检验结果延迟阶数LB统计量检验LB检验统计量的值P值675.460.00011282.570.0001三、计算样本相关函数•样本自相关函数•样本偏自相关函数nttkntkttkxxxxxx121)())((ˆDDkkkˆˆˆ四、关于非零均值的平稳序列非零均值的平稳序列有两种处理方法:设xt为一非零均值的平稳序列,且有E(xt)=μ•方法一:用样本均值作为序列均值μ的估计,建模前先对序列作如下处理:令然后对零均值平稳序列wt建模.xxxwtt•方法二在模型识别阶段对序列均值是否为零不予考虑,而在参数估计阶段,将序列均值作为一个参数加以估计.以一般的ARMA(p,q)为例说明如下:qtqtttptptttaaaaxxxqpARMAx221111)()()(:),,(,即其适应性模型为的均值为设平稳序列将上式展开得:qtqtttptpttaaaaxxx2211011此时,所要估计的未知参数有p+q+1个.第二节模型识别与定阶一、模型识别二、模型定阶一、模型识别•基本原则选择模型拖尾P阶截尾AR(P)q阶截尾拖尾MA(q)拖尾拖尾ARMA(p,q)kkˆˆk•零均值平稳序列模型识别的主要根据是序列的自相关函数(ACF)和偏自相关函数(PACF)的特征.•若序列xt的偏自相关函数在kp以后截尾,即kp时,,而且它的自相关函数拖尾,则可判断此序列是AR(p)序列.kk0kkk•若序列xt的自相关函数在kq以后截尾,即kq时,,而且它的偏自相关函数拖尾,则可判断此序列是MA(q)序列.•若序列xt的自相关函数、偏相关函数都呈拖尾形态,则可断言此序列是ARMA序列.•若序列的自相关函数和偏自相关函数不但都不截尾,而且至少有一个下降趋势势缓慢或呈周期性衰减,则可认为它也不是拖尾的,此时序列是非平稳序列,应先将其转化为平稳序列后再进行模型识别.k0kkk模型定阶的困难•因为由于样本的随机性,样本的相关系数不会呈现出理论截尾的完美情况,本应截尾的或仍会呈现出小值振荡的情况•由于平稳时间序列通常都具有短期相关性,随着延迟阶数,与都会衰减至零值附近作小值波动?当或在延迟若干阶之后衰减为小值波动时,什么情况下该看作为相关系数截尾,什么情况下该看作为相关系数在延迟若干阶之后正常衰减到零值附近作拖尾波动呢?kkˆkkˆkˆkkˆkˆkkˆ二、模型定阶样本相关系数的近似分布•Barlett•QuenouillennNk,)1,0(~ˆnnNkk,)1,0(~ˆ1、经验定阶方法95%的置信区间22ˆPr0.9522ˆPr0.95kkknnnn模型定阶的经验方法–如果样本(偏)自相关系数在最初的p阶明显大于两倍标准差范围,而后几乎95%的自相关系数都落在2倍标准差的范围以内,而且通常由非零自相关系数衰减为小值波动的过程非常突然.这时,通常视为(偏)自相关系数截尾.截尾阶数为p.例1⑴上海延中实业股票数据识别(一阶差分后)⑵平均每日生产汽车废品数据的识别(n=45)⑶美国女性失业月数据识别(差分后)上海延中实业股份有限公司是上海首家向社会公开发行股票的企业.1985年1月底发行股票500万元,其中由上海延中复印工业公司出资30万元.上海延中实业股票收盘价基本反映了沪市股票的大致走向.总观测期n=619,先作出原序列的样本自相关函数和样本偏相关函数,其结果见表1和图1.⑴上海延中实业股票数据识别(一阶差分后)表1延中股票的样本自相关和样本偏自相关函数值美国1961年1月至1985年12月间女性失业月人数时间序列⑵美国女性失业月数据识别(差分后)⑶⑷⑸2、残差方差图定阶法(1)基本思想•如果拟合的模型阶数与真正阶数不符合,则模型的残差平方和SSE必然偏大,残差方差将比真正模型的残差方差大。•如果是不足拟合,那么逐渐增加模型阶数,模型的残差方差会渐减少,直到残差方差达到最小。•如果是过度拟合,此时逐渐少模型阶数,模型残差方差分逐渐下降,直到残差方差达到最小。(2)残差方差的估计公式模型的参数个数实际观察值的个数模型的剩余平方和2ˆa注:式中“实际观察值个数”是指拟合模型时实际使用的观察值项数,即经过平稳化后的有效样本容量。设原序列有n个样本,若建立的模型中有含有自回归AR部分,且阶数为p,则实际观察值个数为n-p个。若没有AR部分,则实际观察值个数即为n个。模型的参数个数指模型中所含的参数个数,如:若是不带常数项的ARMA(p,q)模型,参数个数为p+q个,若带有常数项,则参数个数为p+q+1个。•用Eviews建立ARMA模型后,可直接得到剩余平方和SSE(Sumsquaredresid)•输出结果中也可直接得到残差标准差:S.E.ofregression,此项的平方即为残差方差。因此,对不同的模型残差方差进行比较,直接比较此项既可。例:以磨轮剖面数据为例,分别建立适应性模型,输出结果见图示,从中选择最佳模型。乘余平方和1473.7261539.4681522.27原序列长度250250250p201参数个数222自由度246248247残差方差5.9907566.2075326.1630364残差标准差2.452.492.48三个模型残差方差比较3、F检验定阶法基本思想(以一般情形和ARMA(p,q)模型为例)•先对数据拟合ARMA(p,q)模型(假设不含常数项),设其残差平方和为Q0,再对数据拟合较低阶的模型ARMA(p-m,q-s),设其残差平方和为Q1。•建立原假:00,000,02121qsqsqpmpmp))(,(~)()(001qppnsmFqppnQsmQQF在原假设成立的条件下有:于是计算统计量F,在给定的显著性水平下α。若FFα,则拒绝原假设,说明两模型差异是显著的,此时模型阶数存在升高的可能性。若FFα,此不能拒绝原假设,说明两模型差异不显著,此时模型阶数存在降低的可能性。注:F检验定阶法的应用条件:两模型中有一个为合适模型。4、最佳准则函数定阶法•最佳准则函数法,即确定出一个准则函数,该函数既要考虑某一模型拟合时对原始数据的接近程度,同时又要考虑模型中所含待定参数的个数。•建模时,使准则函数达到极小的是最佳模型。4.1赤池的AIC准则和BIC准则4.1.1AIC准则(Akaikeiformationcriterion)AIC准则是1973年由赤池(Akaike)提出,此准则是对FPE准则(用来判别AR模型的阶数是否合适)的推广,用来识别ARMA模型的阶数。•AIC准则函数为:)2ln1(2ˆln2ln2)ln(2)(2nnLMMAICa极大似然函数式中,M为模型中参数的个数。AIC的简化式为:MnMAICa2ˆln)(2式中:是残差方差的极大似然估计值。2ˆa2a•Eviews输出的Akaikeinfocriterion与上述形式略有差别(参见Eviewshelp),其定义为:nMnMAIC2)ln(2)(极大似然函数其中:n是实际观察值的个数。4.1.2BIC准则•柴田(Shibata)1976年证明AIC有过分估计自回归参数的倾向,于是Akaike又提出了AIC方法的贝叶斯扩展,即BIC。•BIC准则函数为:)(lnˆln)(2nnMCnMBICa式中:C为常数。余同前。4.2施瓦茨(Schwarz)的SC准则•此准则1978年由Schwarz提出,被称为SBC(Schwartz’sBayesiancriterion)。•准则函数:nMMSBCln)ln(2)(极大似然函数简化式为:nMnMSBCalnˆln)(2•同样Eviews输出的结果与上形式略有差别,其定义为:nnMnMSBCln)ln(2)(极大似然函数准则函数使用注意1、当样本量趋于无穷时,用AIC准则挑选的最佳模型的阶数往往比真实模型阶数高,而用SBC准则确定的最佳模型的阶数往往与真实模型的阶数相一致。2、样本量不是很大时,SBC准则的定阶效果不及AIC。一、矩估计二、极大似然估计三、最小二乘估计第三节模型参数估计一、矩估计•原理–样本自相关系数估计总体自相关系数–样本一阶均值估计总体均值,样本方差估计总体方差111111ˆ(,,,,,)ˆ(,,,,,)pqpqpqpq
本文标题:第四章平稳时间序列模型的建立
链接地址:https://www.777doc.com/doc-736671 .html