您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计分析与方法-第十一章时间数列分析
时间序列分析2时间序列分析一女孩失恋后伤心哭泣,家人急忙劝慰,老爸说:“吹了更好,那小子人品不好”。老妈说:“他收入太低”。姐姐说:“他长得不酷”。哥哥说“他不仗义”。女孩仍痛哭不止。于是统计学家出现了:“想哭就哭吧,过一段时间就会好的,因为时间可以医治心灵的创伤”。3时间序列分析果然,一个月后,女孩又交上了新的男友。看来有时寻找n个理由,构造n个变量,不如一个时间变量(t)解决问题。本章教学目的是让学生掌握如何分析随时间变化的对象:时间序列分析方法。4时间序列分析时间序列定义及分解时间序列模型软件实现5横截面数据CrossSection大体同时发生与时间无关的不同对象的观测值各个观测值独立如某一时刻收入与消费的关系时间序列数据Timeseries对象在不同时间的观测观测值之间并不独立如一个生产厂家连续若干年销售额6销售数据例题下面看一个时间序列的数据例子。这是某企业从1990年1月到2002年12月的销售数据(tssales.sav)。我们希望能够从这个数据找出一些规律,并且建立可以对未来的销售额进行预测的时间序列模型。7时间序列数据Timeseries8时间序列观测值的原始图SequencenumberSEP2002JAN2002MAY2001SEP2000JAN2000MAY1999SEP1998JAN1998MAY1997SEP1996JAN1996MAY1995SEP1994JAN1994MAY1993SEP1992JAN1992MAY1991SEP1990JAN1990SALES120100806040209销售数据例题从这个点图可以看出:总的趋势是增长的,但增长并不是单调上升的;有涨有落。大体上看,这种升降不是杂乱无章的,和季节或月份的周期有关系。当然,除了增长的趋势和季节影响之外,还有些无规律的随机因素的作用。10时间序列的组成部分从该例可以看出,该时间序列可以有三部分组成:趋势(trend)、季节(seasonal)成分和无法用趋势和季节模式解释的随机干扰(disturbance)。一般的时间序列还可能有循环或波动(Cyclic,orfluctuations)成分;循环模式和有规律的季节模式不同,周期长短不一定固定。比如经济危机周期,金融危机周期等等。11时间序列观测的分解长期趋势(Trend)季节变动(Seasonal)循环变动(Cyclic)随机波动(fluctuations)12长期趋势(T)指客观社会经济现象在一个相当长的时期内,受某种基本因素影响,所呈现出的一种基本趋势。13季节变动(S):指客观社会经济现象受季节更换等因素的影响,在一年或更短的时间内,随时间的变化而呈现的周期性波动。14循环变动(C)和不规则变动(I)循环变动(C):指客观社会经济现象若干年为周期的涨落起伏相同的波动。不规则变动(I):指客观社会经济现象由于突发事件或偶然因素引起的无周期性的变动。15SequencenumberSEP2002JAN2002MAY2001SEP2000JAN2000MAY1999SEP1998JAN1998MAY1997SEP1996JAN1996MAY1995SEP1994JAN1994MAY1993SEP1992JAN1992MAY1991SEP1990JAN1990120100806040200-20SALESErrorforSALESfromSEASON,MOD_1ADDSeasfactorsforSALESfromSEASON,MOD_Trend-cycleforSALESfromSEASON,MOD_1时间序列的分解图16时间数列的分解如果要想对一个时间序列本身进行较深入的研究,把序列的这些成分分解出来、或者把它们过虑掉则会有很大的帮助。如果要进行预测,则最好把模型中的与这些成分有关的参数估计出来。就例中的时间序列的分解,通过SPSS软件,可以很轻而易举地得到该序列的趋势、季节和误差成分。17SPSS的实现:时间序列数据的产生SPSS并不会自动把某些变量看成带有某些周期的时间序列;需要对该变量的观测值附加上时间因素。例数据tasales.sav原本只有一个变量sales。这样就需要附加带有周期信息的时间。18SPSS的实现:时间序列数据的产生方法是通过选项:Data-DefineDates然后在CasesAre选择:Years,months(年月)并指定第一个观测值(FirstCaseIs)是1990年1月19时间序列的分解实现过程对例tssales.sav数据进行分解利用SPSS的选项:Analyze-TimeSeries-SeasonalDecomposition然后在Variable(s)(变量)处选择sales在Model选择Additive(可加模型,也可以试可乘模型Multiplicative)20时间序列的分解实现过程21时间序列的分解实现过程最后得到四个附加变量,它们是:误差(err_1)季节调整后的序列(sas_1)季节因素(saf_1)去掉季节后的趋势循环因素(stc_1)22SPSS的实现:时间序列数据的点图对时间序列点图可以选择Graphs-Sequence对本例选择sales为变量,months为时间轴的标记即可。23SequencenumberSEP2002JAN2002MAY2001SEP2000JAN2000MAY1999SEP1998JAN1998MAY1997SEP1996JAN1996MAY1995SEP1994JAN1994MAY1993SEP1992JAN1992MAY1991SEP1990JAN1990SeasadjserforSALESfromSEASON,MOD_2ADDEQU1212010080604020季节调整后的序列图去除季节影响,只有趋势和误差成分的时间序列24纯趋势成分和纯季节成分SequencenumberSEP2002JAN2002MAY2001SEP2000JAN2000MAY1999SEP1998JAN1998MAY1997SEP1996JAN1996MAY1995SEP1994JAN1994MAY1993SEP1992JAN1992MAY1991SEP1990JAN1990120100806040200-20SeasfactorsforSALESfromSEASON,MOD_Trend-cycleforSALESfromSEASON,MOD_225纯趋势成分和纯误差成分SequencenumberSEP2002JAN2002MAY2001SEP2000JAN2000MAY1999SEP1998JAN1998MAY1997SEP1996JAN1996MAY1995SEP1994JAN1994MAY1993SEP1992JAN1992MAY1991SEP1990JAN1990120100806040200-20Trend-cycleforSALESfromSEASON,MOD_2ErrorforSALESfromSEASON,MOD_2ADD26时间序列模型指数平滑模型趋势方程法27指数平滑模型(exponentialsmoothing)应用范围:纯粹时间序列,不能用于含有独立变量时间序列的研究变量指数平滑的原理为:当利用过去观测值的加权平均来预测未来的观测值时(这个过程称为平滑),离得越近的观测值要给以更多的权。28指数平滑模型(exponentialsmoothing)以简单的没有趋势和没有季节成分的纯粹时间序列为例,指数平滑在数学上实际上是一个几何级数。这时,如果用Yt表示在t时间的平滑后的数据(或预测值),而用X1,X2,…,Xt表示原始的时间序列。那么指数平滑模型为:1011其中tttYXY29指数平滑模型或者,等价于ktkktXY01这里的系数为几何级数。因此称之为“几何平滑”比使人不解的“指数平滑”似乎更有道理。30指数平滑模型有关的教材中(如易丹辉编著的《统计预测—方法与应用》,中国统计出版社,2001)给出了各种实用的指数平滑模型的公式。这里就不再祥述31SPSS的实现:指数平滑以tssales.sav数据为例:选项Analyze-TimeSeries-ExponentialSmoothing,然后在Variable(s)(变量)处选择sales,在Model选择custom(自选模型),在TrendComponent选Exponential(这主要是因为看到序列原始点图趋势不象直线,其实选Linear也差不多)在SeasonalComponent选Additive(这是可加模型,也可以试选可乘模型:Multiplicative,细节可参看公式)32SPSS的实现:指数平滑点击Parameters来估计参数,在三个有关参数选项上:General(Alpha)、Trend(Gamma)和Seasonal(Delta)可均选GridSearch(搜寻,这是因为不知道参数是多少合适,参数意义参见后面公式)。最后如果要预测新观测值,在主对话框点击Save,在PredictCases中选择Predictthrough下面的截止年月(这里选了2003年12月)。33指数平滑法实现34选择指数平滑模型35参数的选择36指数平滑预测的实现37时间序列数据的指数平滑和对未来的预测SequencenumberJUL2003OCT2002JAN2002APR2001JUL2000OCT1999JAN1999APR1998JUL1997OCT1996JAN1996APR1995JUL1994OCT1993JAN1993APR1992JUL1991OCT1990JAN1990140120100806040200-20SALESFitforSALESfromEXSMOOTH,MOD_2EAAErrorforSALESfromEXSMOOTH,MOD_2EA38输出的结果结果中增加的变量有误差(err_1)和拟合(预测)值fit_1。这在前面图中绘出。在SPSS输出文件中还有那些估计的参数值(三个参数加上季节因子)。39方程法在前面的回归分析的讨论中,我们阐述了如何利用一个或多个自变量来预测单个因变量的值。因此,如果能够确定一系列相应的自变量和因变量的集合,就可以建立估计回归方程来预测时间序列。40方程法设:则回归方程为:的值时期变量的值时期变量的值时期变量时期时间序列值k2121txtxtxtYkttttktktttxbxbxbbY2211041方程法在上述方程中,可以将时间t作为自变量,则回归方程就变为:当方程中只有一个自变量t时,这时就是直线方程,否则就是曲线方程,具体选择何种方程还要根据实际情况确定。kkttbtbtbbY221042方程法例:已知1992年初至2002年底共11年我国激光唱机出口量月度数据,先对激光唱机出口量进行分析预测。数据文件:时间数列(激光唱机出口)43激光唱机出口趋势图时间127.00120.00113.00106.0099.0092.0085.0078.0071.0064.0057.0050.0043.0036.0029.0022.0015.008.001.00出口量8000000600000040000002000000044曲线回归由于该图中存在上升的趋势,所以我们先利用二次曲线进行拟合:可利用SPSS回归分析中的曲线回归方法进行拟合。2012tYbbtbt45出口量时间14012010080604020080000006000000400000020000000-2000000ObservedQuadratic46曲线回归由输出结果可知,该序列中存在着自相关,因此要利用自回归的方法。ModelSummaryb.925a.857
本文标题:统计分析与方法-第十一章时间数列分析
链接地址:https://www.777doc.com/doc-736953 .html