您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > SAS学习系列37时间序列分析Ⅰ—平稳性及纯随机性检验
37.时间序列分析Ⅰ—平稳性及纯随机性检验(一)基本概念一、什么是时间序列?为了研究某一事件的规律,依据时间发生的顺序将事件在多个时刻的数值记录下来,就构成了一个时间序列。对时间序列进行观察、研究,找寻它变化发展的规律,预测它将来的发展趋势就是时间序列分析。例如,国家或地区的年度财政收入,股票市场的每日波动,气象变化,工厂按小时观测的产量等等。注:随温度、高度等变化而变化的离散序列,也可以看作时间序列。二、时间序列的特点(1)顺序性;(2)随机性;(3)前后时刻(不一定相邻)的依存性;(4)整体呈趋势性和周期性。三、时间序列的分类按研究对象的数目:一元时间序列、多元时间序列;按序列统计特性:平稳时间序列、非平稳时间序列;按分布规律:高斯时间序列、非高斯时间序列。四、研究方法1.平稳时间序列分析;2.非平稳时间序列分析(确定性分析、随机性分析)。五、其它任何时间序列经过合理的函数变换后都可以被认为是由下列三部分叠加而成:(1)趋势项部分;(2)周期项部分;(3)随机项部分(随机信号、随机噪声)图1.四种趋势:线性、二次、指数增长、S型例如,手机销售的月记录按年增长(趋势项);按季节周期波动(周期项);随机信号和随机噪声。时间序列分析的主要任务就是:上面三部分分解出来,是研究平稳随机过程的变化规律,建立特定的ARIMA模型(要求大体平稳、可能含有周期但不能有规则性的线性指数等类型趋势项)。六、方法性工具1.差分运算(1)k步差分间隔k期的观察值之差:Δk=xt-xt-k(2)p阶差分Δxt=xt-xt-1称为一阶差分;1110(1)ppppiitttptpiixxxCx称为p阶差分;SAS函数实现:diffn(x)2.延迟算子延迟算子作用于时间序列,时间刻度减小1个单位(序列左移一位):Bxt=xt-1,……,Bpxt=xt-p.SAS函数实现:lagn(x)用延迟算子表示k步差分和p阶差分为:Δk=xt-xt-k=(1-Bk)xt0()(1)ppppitptiixIBCx(二)平稳时间序列一、概念平稳时间序列按限制条件的严格程度,分为严平稳时间序列:序列所有的统计性质都不会随着时间的推移而发生变化;宽平稳时间序列:序列的主要性质近似稳定,即统计性质只要保证序列的二阶矩平稳,即对任意的时间t,s,k,序列Xt满足:二、平稳时间序列的统计性质(1)均值为常数;(2)自协方差只依赖于时间跨度;若定义自协方差函数为γ(t,s)=E(Xt-μt)(Xs-μs)则可由二元函数简化为一元函数γ(t-s),得延迟k自协方差函数:γ(k)=γ(t,t+k)由此易知平稳时间序列必具有常数方差:D(Xt)=E(Xt-μt)2=γ(t,t)=γ(0)时间序列自相关函数:()()(,)ttsstsEXXtsDXDX延迟k自相关函数:()()()()()(0)(0)(0)tttktkttkEXXkkkDXDX基本性质:(1)ρ(0)=1;(2)ρ(-k)=ρ(k);(3)自相关阵为对称负定阵;(4)非唯一性。注意:协方差函数和相关函数——度量两个不同事件(Xt,Yt)彼此之间的相互影响的程度。自协方差函数和自相关函数——度量用一事件(Xt)在两个不同时期之间的相互影响的程度。三、样本估计值总体均值的估计值:延迟k自协方差函数的估计值:总体方差的估计值:延迟k自相关函数的估计值:四、平稳性检验(1)时序图检验若无明显的趋势性和周期性,则平稳;(2)自相关图检验零均值平稳序列的自相关函数要么截尾要么拖尾;若时间序列零均值化后出现缓慢衰减或周期性衰减,则说明存在趋势性和周期性(非平稳);(3)单位根检验就是通过检验时间序列自回归特征方程的特征根是在单位圆内(平稳)还是在单位圆及单位圆外(非平稳)。通常用ADF检验法。Dickey和Fuller(1979)利用如下的广义自回归模型其中,Δxj,t表示x的一阶差分;xj,t-1表示延迟一期;Δxj,t-k表示延迟k期再一阶差分;εk,t表示扰动项。上述回归模型生成的xj,t-1的t值正好对应ADF统计量,做假设检验:H0:非平稳;H1:平稳。t值在1%,5%,10%置信水平的临界值分别为:-3.524233,-2.902358,-2.588587.以此判断序列是否平稳。注:若Xt不平稳,可以依次对Xt做一阶、二阶…差分,直到序列平稳。例1.平稳性检验——ADF检验的SAS实现。代码:datasimulation;doi=1to100;x=rannor(1234);output;end;run;datatimeseries;setsimulation;x_1st_lag=lag1(x);x_1st_diff=dif1(x);x_1st_diff_1st_lag=dif1(lag1(x));x_1st_diff_2nd_lag=dif1(lag2(x));x_1st_diff_3rd_lag=dif1(lag3(x));x_1st_diff_4th_lag=dif1(lag4(x));x_1st_diff_5th_lag=dif1(lag5(x));run;procregdata=timeseries;modelx_1st_diff=x_1st_lagx_1st_diff_1st_lagx_1st_diff_2nd_lagx_1st_diff_3rd_lagx_1st_diff_4th_lagx_1st_diff_5th_lag;run;运行结果:REG过程模型:MODEL1因变量:x_1st_diff读取的观测数100使用的观测数94具有缺失值的观测数6方差分析源自由度平方和均方F值PrF模型6111.3808218.5634715.25.0001误差87105.884241.21706方差分析源自由度平方和均方F值PrF校正合计93217.26507均方根误差1.10320R方0.5126因变量均值0.02507调整R方0.4790变异系数4399.76165参数估计值变量自由度参数估计值标准误差t值Pr|t|Intercept1-0.016340.11418-0.140.8866x_1st_lag1-0.709750.20949-3.390.0011x_1st_diff_1st_lag1-0.262170.19212-1.360.1759x_1st_diff_2nd_lag1-0.157800.17907-0.880.3806x_1st_diff_3rd_lag1-0.019730.16308-0.120.9040x_1st_diff_4th_lag10.070670.139380.510.6134x_1st_diff_5th_lag10.003400.105910.030.9745x_1st_lag的t值=-3.39t0.05=-2.902358,(或从P值=0.00110.05判断)故拒绝原假设H0,即序列平稳。五、纯随机性检验若序列值彼此之间没有任何相关性,即过去的行为对未来的发展没有丝毫影响,此时称为纯随机序列。从统计分析的角度而言,纯随机序列是没有任何分析价值的序列。因此,为了确保平稳序列还值不值得分析,还需要对平稳序列进行纯随机性检验。1.纯随机序列(白噪声序列)若对任取的时间t和s,时间序列Xt满足:(1)E(Xt)=μ;(常数均值)(2)r(t,s)=σ2,若t=s;(方差齐性)(3)r(t,s)=0,若t≠s.(纯随机性)则称Xt为纯随机序列或白噪声序列(白光具有该特性),简记为Xt~WN(μ,σ2)。白噪声序列是最简单的平稳时间序列。随机生成的1000个服从标准正态分布的白噪声序列观察值:2.纯随机性检验Barlett证明:n个观察值的纯随机时间序列,延迟为k(≠0)的自相关函数ρ(k)近似服从正态分布N(0,1/n).由此可以构造QBP统计量(适合样本数n≥50)和QLB统计量(适合小样本)来检验序列的纯随机性:再做假设检验:H0:ρ(1)=ρ(2)=…=ρ(m),即延迟≤m的序列之间相互独立;H1:至少有一个ρ(k)≠0,即延迟≤m的序列之间有相关性。注:m一般取值为6、12。这是因为平稳序列通常具有短期相关性,只要序列时期足够长,自相关系数都会收敛于零。例2.数据如下表,时间间隔为天,起始时间自定义。1015101012107710148171418391110612141025293333121916191912341536292621171913202412614612911171281414125810316887126108105(1)判断该序列xt的平稳性及纯随机性;(2)判断xt的一阶差分yt的平稳性及纯随机性。代码:datadatas1;inputx_t@@;time=intnx('day','01jan2014'd,_n_-1);formattimemonyy.;cards;1015101012107710148171418391110612141025293333121916191912341536292621171913202412614612911171281414125810316887126108105;run;procgplotdata=datas1;plotx_t*time;symboli=joinv=starcv=redci=green;run;procarimadata=datas1;identifyvar=x_tnlag=24;run;datadatas2;setdatas1;y_t=dif1(x_t);run;procgplotdata=datas2;ploty_t*time;symboli=joinv=starcv=redci=green;run;procarimadata=datas2;identifyvar=y_tnlag=24;run;运行结果:从时序图看,Xt有明显的周期性和递增递减趋势,故不平稳。从ACF图看,Xt的自相关系数递减到零的速度相当缓慢,在很长的延迟时期里,自相关系数一直为正,而后又一直为负,故判断该序列非平稳。白噪声的自相关检查至滞后卡方自由度Pr卡方自相关664.026.00010.5060.5390.3740.2910.2580.1481288.9812.00010.2700.1860.1780.2580.2070.2261896.3218.00010.138-0.027-0.053-0.112-0.139-0.15524137.2624.0001-0.145-0.284-0.229-0.306-0.211-0.313延迟为6、12的检验P值均小于0.05,故拒绝原假设,认为Xt为非纯随机序列(非白噪声序列)。Yt的时序图波动范围有界且没有明显的周期性、递增(递减)趋势,故可以初步判断该序列平稳。从ACF自相关图看,延迟1阶后的样本自相关系数很快衰减到零附近,且1阶后的样本自相关系数均落在了两倍标准误的范围之内,且在零值附近波动,故可认为Yt平稳。白噪声的自相关检查至滞后卡方自由度Pr卡方自相关629.466.0001-0.5290.195-0.080-0.0590.092-0.2561235.94120.00030.216-0.075-0.0700.101-0.0480.1041838.61180.00320.075-0.1420.045-0.032-0.026-0.0222457.43240.00010.173-0.2140.129-0.1580.195-0.165延迟为6、12的检验P值均小于0.05,故拒绝原假设,认为Yt为非纯随机序列(非白噪声序列)。
本文标题:SAS学习系列37时间序列分析Ⅰ—平稳性及纯随机性检验
链接地址:https://www.777doc.com/doc-2857178 .html