您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 第八章 时间序列分析
第八章时间序列分析随机过程平稳时间序列及其遍历性平稳时间序列预报第八章1随机过程随机时间序列与随机过程由一串不同时刻的随机变量x1,x2,…,所构成的序列称为随机时间序列,用xt(t=1,2,…)来表示。当随机时间序列中的时间t是连续变化时,就称为随机过程,记为X(t),是时间t的函数。自然界的变化过程可分为两大类:确定过程和随机过程。如果每次试验所得到观测过程都相同,且都是时间t的一个确定的函数,具有确定的变化规律,这种过程就称为“确定过程”。如果每次实验所得到的观测的过程都不同,是时间t的不同的函数,实验前无法预知这次实验会随时间呈现怎样的过程,这种过程就称为:“随机过程”。即:“随机时间序列”是“随机过程”的离散形式。月年一二三四五六七八九十十一十二1951-2.2-0.54.39.716.020.723.625.421.917.78.44.519520.4-1.43.710.416.220.524.224.121.415.68.8-0.41953-2.30.04.710.716.120.624.725.822.418.58.42.519540.30.53.69.714.619.022.024.621.315.111.1-1…………………………………例表8.1:青岛市逐年年各月平均气温表格中的任一行表示气温在一年中的变化,可认为是在相同条件下所做的一次独立实验。气温随时间的演变过程是连续的,虽存在春夏秋冬的周期性规律,但是每年的过程都不完全相同。每次实验结果都是t的不同的函数,具有随机性,所以气温的变化过程就是一种“随机过程”。固定表中的某一列(同一个月份),可以视为是在一定条件下的随机变量序列,称为“静态时间序列”(具有相同的期望,冬天低,夏天高)。JanFebMarAprMayJunJulAugSepOctNovDec-100102030T(oC)Mean截口而对于某一时刻tj来说,随机过程就表现为一个随机变量,记为X(tj),称为随机过程的一个“截口”。名词:现实:针对随机过程X(t)的某一次观测过程,称为随机过程X(t)中的一个观测“现实”(realization),或称“样本函数”,用小写字母表示,记为x(t)。月年一二三四五六七八九十十一十二1951-2.2-0.54.39.716.020.723.625.421.917.78.44.519520.4-1.43.710.416.220.524.224.121.415.68.8-0.41953-2.30.04.710.716.120.624.725.822.418.58.42.519540.30.53.69.714.619.022.024.621.315.111.1-1…………………………………JanFebMarAprMayJunJulAugSepOctNovDec-100102030T(oC)Mean随机时间序列的统计特征1均值函数随机时间序列X在任一指定时刻t表现为一个随机变量,它的期望记为:E(X(t)),该随机变量可以随机地取任意值,设它的各种取值的概率密度函数为:f(x,t),则有:(())(,)()EXtxfxtdxt各个观测现实(样本函数)都围绕着均值函数摆动;均值函数反映了各个时刻X(t)的摆动中心,它是X(t)的所有现实在t时刻的总平均。因此,μ(t)是个确定性的t函数。对表8.1来说,对每列求平均就得到了μ(t)的估计。μ(t)称为随机过程X(t)的数学期望。由于μ(t)是t的函数,因此被称为“期望函数”或“均值函数”。2方差函数随机过程的某一个截口处,为一个随机变量X(t),该随机变量取值的变化程度,可用方差来衡量,这就是随机过程的方差函数。222(())[()()][()](,)DXtEXttxtfxtdx方差函数也是时间t的确定性的函数,反映了每个截口处取值的变动情况,即相对于均值函数的离散程度。注意:即使两个随机过程的均值函数和方差函数都完全一样,那么他们仍可能具有完全不同的特点,如下图A与B中两个随机过程(每条曲线为一个现实)。(A)(B)A与B具有几乎相同的均值和方差函数,但内部结构却是完全不同的。A中每个现实的变化较为缓慢,在t1和t2时刻具有相关性;B则是无规则的大幅波动。这种内部结构的描述可通过协方差(或相关)函数来实现。3.协方差函数和相关函数随机过程在任两个时刻(截口)t1和t2表现为两个随机变量,这两个随机变量可以存在相关性,即存在协方差和相关系数。112122(()(((,)[()])()))XtttKttXEtK(t1,t2)称为自协方差函数,简称为协方差函数。当t1=t2=t时,自协方差函数就是随机过程在第t时刻的方差。t1和t2时刻的相关系数为:121212(,)(,)()()Kttttttρ(t1,t2)称为自相关函数,简称为相关函数,表示随机过程X(t)在不同时刻t1和t2之间线性相关的程度。122112(,)(,)(,)1|(,)|1tttttttt自相关函数存在三条性质;它们的协方差为:22()[(()())]()KttEXttt,第八章2平稳时间序列及其遍历性平稳随机过程如果随机过程的统计特性不随时间的推移而变化,即其均函数是与t无关的常数:[()]EXt并且,协方差函数仅仅与时间间隔τ有关,而与t的起始点位置无关,即:(,)[(())(())]()KttEXtXtK这种随机过程称为:“广义平稳随机过程”或“宽平稳随机过程”。相应的时间序列资料称为:“宽平稳时间序列”。有“广义平稳”或“宽平稳”序列,相应地也就有“狭义平稳”或“严平稳”序列。严平稳序列的“严格之处”是指:它要求随机过程的全部概率特性(包括概率密度f(x,t))在任意t时刻都要相同。对气象要素的变化过程而言,严平稳过程的条件难以满足。从实际意义的角度来说,我们并不需要考虑全部概率特性的平稳,只要求宽平稳就足够了。以后谈到“平稳时间序列”时,主要是指“宽平稳时间序列”而言。平稳随机过程中有一个较广的应用——白噪声过程对于一个零均值的随机过程a,若其方差满足:2(0)(,)0(0)aaKtt则称此随机过程为:白噪声过程。白噪声表示不含有任何规律性波动的纯随机过程,可认为白噪声没有“记忆”。常用白噪声过程来表示“随机误差”。当资料为离散的时间序列资料时,称为“白噪声序列”。“白噪声”名字的来源:类似物理上的白色光,白色光是由强度相同的各种波长的颜色谐波共同组成;白噪声就是由强度相同的各种频率的振动共同组成的随机序列。平稳随机过程的基本统计特征不随时间改变,如何来估计这些统计特征?根据定义,若对随机过程进行观测,获得了n个观测现实,以xj(ti)表示第j个观测现实在ti截口的取值,则可对随机过程的统计特征作出如下估计:µ11()()nijijtxtn¶µ2211()[()()]1nijiijtxttnµµµ11(,)[()()][()()]1nikjiijkkjKttxttxttnµµµµ(,)(,)()/()ikikikKtttttt以上统计量的计算要依赖于n个现实,但在很多实际问题中,我们能观测到的只有一个现实,于是产生一个想法:能否用一个现实来代替多个现实,以估计随机过程的统计特征?注意此处的n代表现实的个数;要想用一个现实来估计随机过程的统计特征,该现实需要满足条件:——该现实要能经历(遍历)随机过程各种可能的状态。图A图B比较图A与图B所示的两种平稳随机过程。图中每条曲线代表一个现实。平稳随机过程A:每个现实都围绕着随机过程的均值波动,且他们的平均振幅都差不多,该随机过程的一个现实就可以近似代表整个随机过程的属性。平稳随机过程B:每个现实都围绕不同的数学期望波动,且振幅也不一致,仅仅靠一个现实无法代表整个随机过程的特性。类似平稳随机过程A这样,对于任意一个现实,只要观测时间足够长,就可把该现实的时间平均作为整个随机过程总体均值的近似值,具有这种性质的平稳随机过程就称其具有“各态历经性”(或“各态遍历性”)。对于具有各态遍历性的平稳过程,用“一个现实”来确定其统计特征时,求平均的时间区间取得越长,其估计误差就越小。因此,对气象问题来说,凡是具备各态历经性的平稳过程,就可以用一个充分长的现实来代替多个现实。由这一个现实的时间平均来代替多个现实的总平均来估算期望函数或协方差函数等统计特征。设某具有各态遍历性的平稳时间序列,若有一个充分长的观测现实,x1,x2,…,xn,则其均值函数的估计值为:µ11=nttxxn对“各态历经性(遍历性)”的理解各态历经性是建立在平稳随机过程的每一个现实几乎可以代表所有可能现实的基础上的,或者说,一个充分长的现实能近似代替短时间内各现实的总体。各态遍历性的应用µ11()=[()()]ntttKxxxxn时滞为τ的自协方差函数的估计值为:自相关函数的估计值为:µµ12211[()()]()()=()==1()ntttnttxxxxKnrsxxn特别地,当τ=0时,协方差变为方差s2:µ2211(0)=()nttKxxsnµµ21()1()=()==[()()]ntttxxxxKrsnss自相关函数还可写为标准化数据的自协方差函数:要验证某随机过程是否为“各态历经性”,比较困难;通常假设所研究的平稳过程具有各态历经性,然后从这个假设出发,计算时间序列的各种统计特征。注意此处的n代表一个现实(时间序列)的长度,而非现实的个数;第8章3平稳时间序列预报如何对平稳时间序列做预报?时间序列某个时刻的取值,可能与前一时刻的取值有关,于是可建立回归模型,寻找变量在不同时刻的联系,因此这种回归模型称为自回归模型(Autoregressive(AR)Model)。一阶自回归模型表示要素在某一时刻与前一时刻之间的线性回归模型,称为一阶自回归模型,记为AR(1)。对随机时间序列xt(设已中心化),有:11tttxxa1ttatx式中,为回归系数,为白噪音,表示时刻的随机因素对的贡献。用前一时刻的xt-1乘以上式两边,然后取数学期望,得:11111()()()ttttttExxExxExa将上式两侧同时除以时间序列的方差,Xt-1只与前一时刻的白噪音有关,而与后面(t)时刻的白噪音无关。11(1),因此回归系数即为落后间隔(或称“时滞”)为1的自相关函数记为:1(1)0得:于是,一阶自回归模型可写为:11tttxxa由以上递推公式知,第t-1时刻可写为:-1121tttxxa将xt-1的表达式代入xt的表达式:21121121121211()()(=)ttttttttttttxxaaxaaxaaaa%%其中,依此类推,第t时刻的xt与第t-τ时刻的xt-τ的关系可表示为:1tttxxa%211121=...)tttttaaaaa%(其中,1ttttxxax%对两边同乘以然后取期望,可得:11=ttttExxExx()()1=即:这表征了落后τ时刻与落后1时刻的自相关函数的关系。1112111111211lim00+...tttttttttxxxaaaaa%由于1,因此随着的增大,,于是,取为最大值-1时,可近似写为:这表明:某时刻的气象要素还可看成是前期无穷多白噪声共同影响的结果。符合一阶自回归模型的随机过程,被称为:红噪声过程(又称为“马尔可夫过程”),第t时刻的xt仅与前一时刻的xt-1有关。红噪声就是指:过程在tt0时刻所处的状态与过程在t0之前(tt0)所处的状态无关,只与第t0时刻的状态有关。通俗地说,在已经
本文标题:第八章 时间序列分析
链接地址:https://www.777doc.com/doc-6427696 .html