您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > SPSS的时间序列分析
第十章SPSS的时间序列分析11.1时间序列分析概述•11.1.1时间序列的相关概念通常研究时间序列问题时会涉及到以下记号和概念:1.指标集T指标集T可理解为时间t的取值范围。2.采样间隔△t采样间隔△t可理解为时间序列中相邻两个数的时间间隔。3.平稳随机过程和平稳时间序列时间序列的平稳性是指时间序列的统计规律不会随着时间的推移而发生变化。直观上,一个平稳的时间序列可以看作是一条围绕其均值上下波动的曲线。从理论上,有两种意义的平稳性,一个是严平稳或完全平稳,一个是宽平稳或广义平稳。严平稳:如果对t1,t2,…,tn,h∈T和任意整数n,都使(yt1,yt2…,ytn)与(yt1+h,yt2+h,…,ytn+h)同分布,则概率空间(W,F,P)上随机过程{y(t),t∈T}称为平稳过程。具有时间上的平稳不变性。实践当中是非常困难甚至是不可能的。宽平稳:宽平稳是指随机过程的均值函数、方差函数均为常数,自协方差函数仅是时间间隔的函数。如二阶宽平稳随机过程定义为:E(yt)=E(yt+h)为常数,且对t,t+h∈T都使协方差E[yt-E(yt)]E[yt+h-E(yt+h)]存在且与t无关(只依赖于h)。4.白噪声序列白噪声序列是一种特殊的平稳序列。它定义为若随机序列{yt}由互不相关的随机变量构成,即对所有s≠t,Cov(ys,yt)=0,则称其为白噪声序列。白噪声序列是一种平稳序列,在不同时点上的随机变量的协方差为0。该特性通常被称为“无记忆性”,意味着人们无法根据其过去的特点推测其未来的走向,其变化没有规律可循。当模型的残差序列成为白噪声序列时,可认为模型达到了较好的效果,剩余残差中已经没有可以识别的信息。因此,白噪声序列对模型检验也是很有用处的。5.时点序列和时期序列•11.1.2时间序列分析的一般步骤数据的准备阶段;数据的观察及检验阶段:总体把握时间序列发展变化的特征,以便选择恰当的模型进行分析,包括图形方法和统计检验方法;数据的预处理阶段:一方面能够使序列的特征体现得更加明显,利于分析模型的选择;另一方面使数据满足于模型的要求;数据分析和建模阶段:根据时间序列的特征和分析的要求,选择恰当的模型进行数据建模和分析;模型的评价阶段:与模型分析的目标相结合评价是否达到了分析的目的以及效果如何;模型的实施阶段。•11.1.3SPSS时间序列分析的特点SPSS的时间序列分析没有自成一体的单独模块,而是分散在Data、Transform、Analyze、Graph四个功能菜单当中。在Data和Transform中实现对时间序列数据的定义和必要处理,以适应各种分析方法的要求;在Analyze的TimeSeries中主要提供了四种时间序列的分析方法,包括指数平滑法、自回归法、ARIMA模型和季节调整方法;在Graph中提供了时间序列分析的图形工具,包括序列图(Sequence)、自相关函数和偏自相关函数图等。另外,也可利用SPSS的谱分析图等模块进行简单的谱分析。11.2数据准备SPSS的数据准备包括数据文件的建立、时间定义和数据期间的指定。其中数据文件的建立与一般SPSS数据文件的建立方法相同,每一个变量将对应一个时间序列数据,且不必建立标志时间的变量。具体操作这里不再赘述,仅重点讨论时间定义的操作步骤。SPSS的时间定义功能用来将数据编辑窗口中的一个或多个变量指定为时间序列变量,并给它们赋予相应的时间标志,具体操作步骤是:(1)选择菜单:Date→DefineDates,出现窗口:(2)CasesAre框提供了多种时间形式,可根据数据的实际情况选择与其匹配的时间格式和参数。至此,完成了SPSS的时间定义操作。SPSS将在当前数据编辑窗口中自动生成标志时间的变量。同时,在输出窗口中将输出一个简要的日志,说明时间标志变量及其格式和包含的周期等。数据期间的选取可通过SPSS的样本选取(SelectCases)功能实现。11.3时间序列的图形化观察及检验•11.3.1时间序列的图形化及检验目的通过图形化观察和检验能够把握时间序列的诸多特征,如时间序列的发展趋势是上升还是下降,还是没有规律的上下波动;时间序列的变化的周期性特点;时间序列波动幅度的变化规律;时间序列中是否存在异常点,时间序列不同时间点上数据的关系等。•11.3.2时间序列的图形化观察工具·序列图(Sequence)一个平稳的时间序列在水平方向平稳发展,在垂直方向的波动性保持稳定,非平稳性的表现形式多种多样,主要特征有:趋势性、异方差性、波动性、周期性、季节性、以及这些特征的交错混杂等。序列图还可用于对序列异常值的探索,以及体现序列的“簇集性”,异常值是那些由于外界因素的干扰而导致的与序列的正常数值范围偏差巨大的数据点。“簇集性”是指数据在一段时间内具有相似的水平。在不同的水平间跳跃性变化,而非平缓性变化。·直方图(Histogram)直方图是体现序列数据分布特征的一种图形,通过直方图可以了解序列的平稳性、正态性等特征。·自相关函数图和偏自相关函数图(ACF&PACF)所谓自相关是指序列与其自身经过某些阶数滞后形成的序列之间存在某种程度的相关性。对自相关的测度往往采用自协方差函数和自相关函数。偏自相关函数是在其他序列给定情况下的两序列条件相关性的度量函数。自相关函数图和偏自相关函数图将时间序列各阶滞后的自相关和偏自相关函数值以及在一定置信水平下的置信区间直观的展现出来。各种时间序列的自相关函数图和偏自相关函数图通常有一定的特征和规律:1、白噪声序列的各阶自相关函数和偏自相关函数值在理论上均为0。但实际当中序列多少会有一些相关性,但一般会落在置信区间内,同时没有明显的变化规律。2、具有趋势性的非平稳时间序列,序列的各阶自相关函数值显著不为零,同时随着阶数的增大,函数值呈缓慢下降的趋势;偏自相关函数值则呈明显的下降趋势,很快落入置信区间。3、异方差的非平稳时间序列,其各阶自相关函数显著不为零,且呈现出正负交错,缓慢下降的趋势;偏自相关函数值也呈正负交错的形式,且下降趋势明显。4、具有周期性的非平稳时间序列,其自相关函数呈明显的周期性波动,且以周期长度及其整数倍数为阶数的自相关和偏自相关函数值均显著不为零。5、非周期的波动性时间序列,自相关函数值会在一定的阶数之后较快的趋于零,而偏自相关函数则会很快的落入到置信区间内。·互相关图对两个互相对应的时间序列进行相关性分析的实用图形工具。互相关图是依据互相关函数绘制出来的。是不同时间序列间不同时期滞后序列的相关性。•11.3.3时间序列的检验方法参数检验法参数检验的基本思路是,将序列分成若干子序列,并分别计算子序列的均值、方差、相关函数。根据平稳性假设,当子序列中数据足够多时,各统计量在不同序列之间不应有显著差异。如果差值大于检验值,则认为序列具有非平稳性。•11.3.4时间序列的图形化观察和检验的基本操作11.3.4.1绘制序列图的基本操作(1)选择菜单Graph→Sequence。(2)将需绘图的序列变量选入Variables框中。(3)在TimeAxisLabels框中指定横轴(时间轴)标志变量。该标志变量默认的是日期型变量。(4)在Transform框中指定对变量进行怎样的变化处理。其中Naturallogtransform表示对数据取自然对数,Difference表示对数据进行n阶(默认1阶)差分,Seasonallydifference表示对数据进行季节差分。(5)单击TimeLines按钮定义序列图中需要特别标注的时间点,给出了无标注(NoreferenceLines)、在某变量变化时标注(Lineateachchangeof)、在某个日期标注(Lineatdate)三项供选择。(6)单击Format按钮定义图形的格式,可选择横向或纵向序列图;对于单变量序列图,可选择绘制线图或面积图,还可选择在图中绘制序列的均值线;对多变量的序列图,可选择将不同变量在同一时间点上的点用直线连接起来。11.3.4.2绘制自相关函数图和偏自相关函数图的基本操作(1)选择菜单Graph→TimeSeries→Autocorrelations。(2)将需绘制的序列变量选入Variables框。(3)在Display框选择绘制哪种图形,其中Autocorrelations表示绘制自相关函数图;Partialautocorrelations表示绘制偏自相关函数图。一般可同时绘制两种图形。(4)单击Options按钮定义相关参数,其中MaximumNumberofLags表示相关函数值包含的最大滞后期,即时间间隔h。一般情况下可选择两个最大周期以上的数据。在StandardErrorMethod框中指定计算相关系数标准差的方法,它将影响到相关函数图形中的置信区间。其中Independencemodel表示假设序列是白噪声的过程;Bartlett’sapproximation表示,根据Bartlett给出的估计自相关系数和偏自相关系数方差的近似式计算方差。该方法适合当序列是一个k-1阶的移动平均过程,且标准差随阶数的增大而增大的情况。(5)选中Displayautocorrelationatperiodiclags表示只显示时间序列周期整数倍处的相关函数值。一般如果只考虑序列中的周期因素可选中该项。否则该步可略去。11.3.4.3绘制互相关图的基本操作(1)选择菜单Graph→TimeSeries→Crosscorrelations。(2)把需绘图的序列变量选择到Variables框中。绘制互相关图时要求两个序列均具有平稳性。•11.3.5时间序列图形化观察应用举例1、利用模拟序列数据:(1)以趋势序列绘制序列图;(2)以各种序列绘制自相关函数图和偏自相关函数图。2、利用海关总出口额数据,绘制出口总额和外汇储备的一阶逐期差分后的序列互相关图。11.4时间序列的预处理•11.4.1时间序列预处理的目的和主要方法预处理的目的可大致归纳为两个方面:第一,使序列的特征体现得更加明显,利于分析模型的选择;第二,使数据满足于某些特定模型的要求。序列的预处理主要包括以下几个方面:·序列缺失数据的处理·序列数据的变换处理主要包括序列的平稳化处理和序列的平滑处理等。均值平稳化一般采用差分(Difference)处理,方差平稳化一般用Box-Cox变换处理。差分不一定是相邻项之间的运算,也可以在有一定跨度的时间点之间进行。季节差分(Seasonaldifference)就是一个典型的代表。对于既有趋势性又有季节性的序列,可同时进行差分和季节差分处理。时间序列的平滑处理目的是为了消除序列中随机波动性影响。平滑处理的方式很多,常用的有各种移动平均、移动中位数以及这些方法的各种组合等。·中心移动平均法(Centeredmovingaverage)计算以当前为中心的时间跨度k范围内数据的移动平均数。·向前移动平均法(Priormovingaverage)若指定时间跨度为k,则用当前值前面k个数据(注意:不包括当前值)的平均值代替当前值。·移动中位数(Runingmedians)它以当前时间点为中心,根据指定的时间跨度k计算中位数。•11.4.2时间序列预处理的基本操作11.4.2.1序列缺失数据处理的基本操作11.4.2.2序列数据变换的基本操作(1)选择菜单Transform→CreateTimeSeries(2)把待处理的变量选择到NewVariable(s)框。(3)在NameandFunction框中选择数据变换法。在Name后输入处理后新生成的变量名,在Function中选择处理方法,在Order后输入相应的阶数,并单击Change按钮。其中的方法除前面介绍的几种外,还包括:·Cumulativesum:累加求和,即对当前值和当前值之间的所有数据进行求和,生成原序列的累计值序列。·Lag:数据滞后,即对指定的阶数k,用从当前值向前数到第k个数值来代替当前值。这样形成的新序列将损失前k个数据。·Lead:数据前引。与数据滞后正好相反,即指定的阶
本文标题:SPSS的时间序列分析
链接地址:https://www.777doc.com/doc-723378 .html