您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > spss(时间序列分析)精讲
SPSS与时间序列分析本章基本内容包括1.时间序列简介2.时间序列趋势的分解3.指数平滑模型4.时间序列的一些基本概念和相关图5.ARIMA模型及性质6.ARIMA模型的拟合第一节简介一、横截面数据与时间序列数据•人们对统计数据往往可以根据其特点从两个方面来切入,以简化分析过程。一个是研究所谓横截面(crosssection)数据,也就是对大体上同时,或者和时间无关的不同对象的观测值组成的数据。•另一个称为时间序列(timeseries)数据,也就是由同一对象在不同时间的观测值形成的数据。如……•前面讨论的模型多是和横截面数据有关。本章将讨论时间序列数据的统计分析。•横截面数据也常称为变量的一个简单随机样本,也即假设每个数据都是来自于总体分布的一个取值,且它们之间是相互独立的(独立同分布)。•而时间序列的最大特点是观测值并不独立。时间序列的一个目的是用变量过去的观测值来预测同一变量的未来值。•下面看一个时间序列的数据例子。•例1.某企业从1990年1月到2002年12月的月销售数据(单位:百万元)储存于SPSS数据文件tssales.sav中。•在该数据文件中,除了销售额变量“sales”以外,还有三个时间变量“year”、“month”和“date”。事实上这三个变量是我们后期通过SPSS操作自动加上去的。•选择SPSS菜单中的“Data=DefineDates”选项,在弹出窗口的“CasesAre”下方选择“Years,months”,再在右侧“FirstCaseIs”下的空格输入起始时间,即可自动生成该例中的三个时间变量。•当然,根据数据记录的背景不同和不同的需要,我们也可以选择“Days”、“Weeks”等其他形式的时间变量。•作为时间序列数据的一个基本要求,其数据都是等间隔记录的,比如每天或每月记录一个数据。•在金融时间序列(比如股票价格),每周的记录时间只有5天(周一至周五),此时我们也把它当成是等间隔记录的,此时记录的时间间隔是“每个工作日”。•我们接下来看看例1的销售数据的时间序列图(TSplot)。YEAR20032002200120001999199819971996199519941993199219911990SALES12010080604020图1销售数据的时间序列图(返回27页)•从图1可以看出:该企业销售额总的趋势是增长的;但增长并不是单调上升的,有涨有落。•更进一步,这种升降不是杂乱无章的,和季节或月份的周期有关系。•当然,除了增长的趋势和季节影响之外,还有些无规律的随机因素的作用。•这些都说明了这个数据前后之间不是独立而是相关的。•上述图形是选择SPSS菜单中的“Graphs=Sequences”选项,在窗口中把“sales”作为画图变量“Variables”,而把“year”作为横坐标“TimeAxisLabels”而得到的。在成图后我们还把时间标值的间隔和格式做了修改。二、时间序列分析的目的•在例1中,我们希望能够从这些历史销售数据出发,找出其中的一些规律,并且建立可以对未来的销售额进行预测的时间序列模型,这一统计过程就是时间序列分析。•事实上,时间序列分析也是一种回归。•回归分析的目的是建立应变量和自变量之间关系的模型;并且可以用自变量来对应变量进行预测。•而在时间序列分析中,应变量为变量未来的可能值,而用来预测的自变量中就包含该变量的一系列历史观测值。•时间序列的自变量也可能包含随着时间度量的独立变量。三、指数平滑模型•时间序列分析的一个简单和常用的预测模型叫做指数平滑(exponentialsmoothing)模型。•指数平滑只能用于纯粹时间序列的情况,而不能用于含有独立变量时间序列的因果关系的研究。•指数平滑的原理为:利用过去观测值的加权平均来预测未来的观测值(这个过程称为平滑),且离现在越近的观测值要给以越重的权。•而“指数”意味着:按历史观测值记录时间离现在的距离远近,其上的权数按指数速度递减。•这一距离通常用数据间隔位置差,也称步数(lag)来表示。•若记时刻t的观测值为Xt•时刻t的指数平滑记为Yt。•指数平滑的数学模型为Yt=aXt+a(1-a)Xt-1+a(1-a)2Xt-2+…+a(1-a)t-1X1,(1)其中0a1为权重指数。a越大,表示在加权时给予当前观测值的权重越大,相应地,给予过去观测值的权重就越小。•模型(1)还可改写为Yt=aXt+(1-a)Yt-1,t=2,3,…(2)•容易看出,经过这样的改写,模型(2)不仅可以用来计算时间t≤N的指数平滑,还可对将来时刻进行预测,即用Yt预测Xt,其中tN。见图2,其中取a=0.4。YEAR2003200220012000199919981997199619951994199319921991199012010080604020SALESXSMOOTH图2销售数据的简单指数平滑•指数平滑的SPSS操作——选择菜单中的“Analyze=TimeSeries=ExponentialSmoothing”选项,在弹出的窗口中把变量“sales”选入“Variables”空格。•——点击右下方“Parameter”按钮,在新弹出窗口改变权重指数a的取值;点击“Continue”返回。•——点击“Save”按钮,在新窗口选择“Predictthrough”,并在下方“Year”后输入“2003”,表示将预测2003年的销售额;点击“Continue”返回一级窗口,点“OK”即可。•指数平滑的结果储存在原数据文件后新增的两个变量中,它们分别是指数平滑数据Yt以及Yt与Xt之间的误差。•图2即为Xt与Yt叠合在一起的共同的时间序列图。•从图2可以看出一下几点:1.指数平滑曲线比原有观测值曲线来得平整光滑些,其波动没有原来那么强了,这也是平滑一词的来意。2.不考虑最初几个指数平滑值,当tN时,指数平滑数据Yt与原有观测值Xt之间的误差较小;可见用指数平滑作为原有观测值的一种估计效果还是较好的。3.但是当tN时,指数平滑曲线很快得呈一条直线状,没有体现出原有观测值的上升趋势和周期性规律。可见用这一指数平滑作为原销售数据的预测效果不理想。•上述第三点的原因是我们在做指数平滑时没有考虑原数据的任何趋势或周期规律,我们在下一节再对此做弥补。第二节时间序列的分解一、成分的分离•从图1可以看出,该销售数据序列由三部分组成:指数向上的趋势(trend)、周期性变化的季节成分(seasonalcomponent)和无法用趋势和季节模式解释的随机干扰(disturbance)。•一般的时间序列还可能有循环或波动成分(Cyclic,orfluctuations)。•循环模式和有规律的季节模式不同,其周期长短不一定固定。比如经济危机周期,金融危机周期等等。•一般地来讲,一个时间序列可能有趋势、季节、循环这三个成分中的某些或全部再加上随机成分组成。•时间序列的分解就是要把一个时间序列中可能包含的各种成分分解开来,以便于有针对性的进一步分析讨论。•就例1中的时间序列的分解,通过SPSS软件,可以很轻而易举地得到该序列的趋势、季节和误差成分。•SPSS操作——选择菜单中的“Analyze=TimeSeries=SeasonalDecomposition”选项,把变量“sales”选入“Variables”空格,再在“Model”下选择“Additive”,点击“OK”即可得到分解结果。•上述SPSS对时间序列做分解的结果自动储存在原有数据文件中新增的几个变量中,它们分别是:1.err_1:误差(error)项,也即原序列的随机扰动成分,记为{ERt};2.sas_1:季节调整后的序列(seasonaladjustedseries),记为{SAt};3.saf_1:季节因素(seasonalfactor),记为{SFt};4.stc_1:去掉季节及随机扰动后的趋势及循环因素(trend-cycleseries),记为{TCt}。•这些分解出来的序列或成分与原有时间序列之间有如下的简单和差关系:Xt=SFt+SAt,(3)Xt=SFt+TCt+ERt.(4)YEAR2002200120001999199819971996199519941993199219911990120100806040200-20SeanaladjustedseriesSASeasfactorsSF图3销售数据的季节因素分离可以看出,这一销售数据序列大致上是以一年(12个月)为周期的。↙YEAR2002200120001999199819971996199519941993199219911990120100806040200-20Trend-cycleseriesTCErrorseriesER图4销售数据的趋势与扰动分离可以看出,逐月的销售额大致沿一个指数曲线呈增长趋势。↘YEAR2002200120001999199819971996199519941993199219911990ErrorfromSeasonaldecomposition3210-1-2-3-4图5分离季节和趋势后的扰动序列(返回27页)可以看到,扰动项不再带有明显的周期或趋势。二、带季节与趋势的指数平滑•如果我们不仅仅满足于分解现有的时间序列,而且想利用该分解对未来进行更好的预测,就可以建立带季节成分和趋势的指数平滑模型。•作这样的指数平滑,必须事先估计出季节成分和趋势,其估计结果就是这两条曲线的函数关系式(参数),也即时间指标t的两个确定的(非随机的)函数。•分别记季节因素和趋势(及循环)的估计为和,而剩余的扰动(自然也是估计)记为。•带季节和趋势的指数平滑就是先计算扰动序列的指数平滑,然后再加上估计(预测)的季节和趋势成分,作为最终的指数平滑数据。︿SFt︿TCt︿ERt•我们不介绍上述指数平滑背后的数学,而直接来看它的SPSS操作,该操作要分步来完成。1.选择菜单中的“Analyze=TimeSeries=ExponentialSmoothing”选项,在弹出的窗口中把变量“sales”选入“Variables”空格。2.在该窗口的“Model”下选择“Custom”,并点击其下的“Custom”按钮进入二级窗口(进行模型选择)。3.在“TrendComponent”下选择“Exponential”(因为本例中的趋势近似一条指数曲线),在“SeasonalComponent”下选择“Additive”,点击“Continue”返回一级窗口。4.点击“Parameters”来进行参数选择和估计。在弹出的二级窗口中的“General”、“Trend”和“Seasonal”下方都选择“GridSearch”,表示留给程序自己去搜索(估计),其下的搜索范围(“Start”和“Stop”)和搜索步长(“By”)可不作修改。这三个参数中的第一项,也即权重指数a,一般可作人为选择。选好参数后,点击“Continue”返回一级窗口。5.点击“Save”按钮作预测选择后,此操作同上一节的简单指数平滑。6.再在一级窗口点击“OK”,即可得到所需要的结果了。•我们来看看此时的指数平滑结果,见图6。YEAR2003200220012000199919981997199619951994199319921991199012010080604020SALESSMOOTH图6销售数据的带季节和趋势的指数平滑我们看到,此时的估计效果比上一节的简单指数平滑要好得多,当然其预测也更可信。第三节基本概念与相关图•如果要对比较复杂的纯粹时间序列(一般指已分离了确定性的季节成分和趋势后的扰动序列)进行细致的分析,指数平滑往往是无法满足要求的。•而若想对有独立变量的时间序列进行预测,指数平滑更是无能为力。•于是需要更加强有力的模型。•在介绍具体的模型之前,我们先介绍一下所要用到的时间序列的一些基本概念,以及相关图这一重要的工具。一、基本概念•接下来我们只考虑纯粹时间序列(puretimeseries),也即不
本文标题:spss(时间序列分析)精讲
链接地址:https://www.777doc.com/doc-4014450 .html