您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 第六讲-时间序列的平稳性及其检验
时间序列的平稳性及其检验一、问题的引出:非平稳变量与经典回归模型时间序列数据是最常见,也是最常用到的数据经典回归分析暗含着一个重要假设:数据是平稳的数据非平稳,大样本下的统计推断基础——“一致性”要求——被破怀。nXXi/)(2QnXXPin)/)((2lim•经典回归分析的假设之一:解释变量X是非随机变量•放宽该假设:X是随机变量,则需进一步要求:•(1)X与随机扰动项不相关∶Cov(X,)=0•(2)依概率收敛:如果X是非平稳数据(如表现出向上的趋势),则(2)不成立,回归估计量不满足“一致性”,基于大样本的统计推断也就遇到麻烦。表现在:两个本来没有任何因果关系的变量,却有很高的相关性(有较高的R2)。例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。在现实经济生活中,实际的时间序列数据往往是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。数据非平稳的后果——导致出现“虚假回归”问题二、时间序列数据的平稳性定义:假定某个时间序列是由某一随机过程(stochasticprocess)生成的,如果满足下列条件:1)均值E(Xt)=是与时间t无关的常数;2)方差Var(Xt)=2是与时间t无关的常数;3)协方差Cov(Xt,Xt+k)=k是只与时期间隔k有关,与时间t无关的常数;则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationarystochasticprocess)。例1.一个最简单的随机时间序列是一具有零均值同方差的独立分布序列:Xt=t,t~N(0,2)该序列常被称为是一个白噪声(whitenoise)。由于Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的。例2.另一个简单的随机时间列序被称为随机游走(randomwalk),该序列由如下随机过程生成:Xt=Xt-1+t这里,t是一个白噪声。容易知道该序列有相同的均值:E(Xt)=E(Xt-1)为了检验该序列是否具有相同的方差,可假设Xt的初值为X0,则易知:X1=X0+1X2=X1+2=X0+1+2……Xt=X0+1+2+…+t由于X0为常数,t是一个白噪声,因此:Var(Xt)=t2即Xt的方差与时间t有关而非常数,它是一非平稳序列。•然而,对X取一阶差分(firstdifference):Xt=Xt-Xt-1=t由于t是一个白噪声,则序列{Xt}是平稳的。后面将会看到:如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。•事实上,随机游走过程是下面我们称之为1阶自回归AR(1)过程的特例:Xt=Xt-1+t不难验证:1)||1时,该随机过程生成的时间序列是发散的,表现为持续上升(1)或持续下降(-1),因此是非平稳的;2)=1时,是一个随机游走过程,也是非平稳的。事实上可以证明:只有当-11时,该随机过程才是平稳的•给出一个随机时间序列,首先可通过该序列的时间路径图来粗略地判断它是否是平稳的。•一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程。•而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。三、平稳性检验的图示判断tXtXtt(a)(b)图9.1平稳时间序列与非平稳时间序列图•进一步的判断:检验样本自相关函数及其图形定义随机时间序列的自相关函数(autocorrelationfunction,ACF)如下:k=k/0自相关函数是关于滞后期k的递减函数。实际上,对一个随机过程只有一个实现(样本),因此,只能计算样本自相关函数(Sampleautocorrelationfunction)。•一个时间序列的样本自相关函数定义为:nttkntkttkXXXXXXr121,3,2,1k随着k的增加,样本自相关函数下降且趋于零。但从下降速度来看,平稳序列要比非平稳序列快得多。krkr110k0k(a)(b)图9.1.2平稳时间序列与非平稳时间序列样本相关图可检验对所有k0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行:mkkLBknrnnQ12)2(该统计量近似地服从自由度为m的2分布(m为滞后长度)。因此:如果计算的Q值大于显著性水平为的临界值,则有1-的把握拒绝所有k(k0)同时为0的假设。例3:下表序列Random1是通过一随机过程(随机函数)生成的有19个样本的随机时间序列。表9.1.1一个纯随机序列与随机游走序列的检验序号Random1自相关系数kr(k=0,1,…17)LBQRandom2自相关系数kr(k=0,1,…17)LBQ1-0.031K=0,1.000-0.0311.00020.188K=1,-0.0510.0590.1570.4805.11630.108K=2,-0.3933.6790.2640.0185.1234-0.455K=3,-0.1474.216-0.191-0.0695.2415-0.426K=4,0.2806.300-0.6160.0285.26160.387K=5,0.1877.297-0.229-0.0165.2697-0.156K=6,-0.36311.332-0.385-0.2196.74580.204K=7,-0.14812.058-0.181-0.0636.8769-0.340K=8,0.31515.646-0.5210.1267.454100.157K=9,0.19417.153-0.3640.0247.477110.228K=10,-0.13918.010-0.136-0.24910.22912-0.315K=11,-0.29722.414-0.451-0.40418.38913-0.377K=12,0.03422.481-0.828-0.28422.99414-0.056K=13,0.16524.288-0.884-0.08823.514150.478K=14,-0.10525.162-0.406-0.06623.866160.244K=15,-0.09426.036-0.1620.03724.00417-0.215K=16,0.03926.240-0.3770.10525.483180.141K=17,0.02726.381-0.2360.09327.198190.2360.000•容易验证:该样本序列的均值为0,方差为0.0789。•从图形看:它在其样本均值0附近上下波动,且样本自相关系数迅速下降到0,随后在0附近波动且逐渐收敛于0。(a)(b)-0.6-0.4-0.20.00.20.40.624681012141618RANDOM1-0.8-0.40.00.40.81.224681012141618RANDOM1AC•从QLB统计量的计算值看,滞后17期的计算值为26.38,未超过5%显著性水平的临界值27.58,因此,可以接受所有的自相关系数k(k0)都为0的假设。•因此,该随机过程是一个平稳过程。•序列Random2是由一随机游走过程Xt=Xt-1+t生成的一随机游走时间序列样本。其中,t是由Random1表示的白噪声。(a)(b)-1.0-0.8-0.6-0.4-0.20.00.20.424681012141618RANDOM2-0.8-0.40.00.40.81.224681012141618RANDOM2AC图形表示出:该序列具有相同的均值,但从样本自相关图看,虽然自相关系数迅速下降到0,但随着时间的推移,则在0附近波动且呈发散趋势。从QLB统计量的计算值看,滞后1期的计算值为5.116,超过5%显著性水平的临界值3.84,因此,拒绝自相关系数k(k0)都为0的假设。该随机游走序列是非平稳的。例检验中国支出法GDP时间序列的平稳性。表1978~2000年中国支出法GDP(单位:亿元)年份GDP年份GDP年份GDP19783605.6198610132.8199446690.719794073.9198711784199558510.519804551.3198814704199668330.419814901.4198916466199774894.219825489.2199018319.5199879003.319836076.3199121280.4199982673.119847164.4199225863.6200089112.519858792.1199334500.6图9.1.51978~2000年中国GDP时间序列及其样本自相关图-0.4-0.20.00.20.40.60.81.01.2246810121416182022GDPACF020000400006000080000100000788082848688909294969800GDP•图形:表现出了一个持续上升的过程,可初步判断是非平稳的。•样本自相关系数:缓慢下降,再次表明它的非平稳性。•从滞后18期的QLB统计量看:•QLB(18)=57.1828.86=0.052•拒绝:该时间序列的自相关系数在滞后1期之后的值全部为0的假设。•结论:•1978~2000年间中国GDP时间序列是非平稳序列。1、DF检验•随机游走序列:Xt=Xt-1+t是非平稳的,其中t是白噪声。而该序列可看成是随机模型:Xt=Xt-1+t中参数=1时的情形。四、平稳性的单位根检验(unitroottest)(*)式可变形式成差分形式:Xt=(-1)Xt-1+t=Xt-1+t(**)检验(*)式是否存在单位根=1,也可通过(**)式判断是否有=0。对式:Xt=Xt-1+t(*)进行回归,如果确实发现=1,就说随机变量Xt有一个单位根。可证明,(*)式中的参数1或=1时,时间序列是非平稳的;对应于(**)式,则是0或=0。因此,针对式:Xt=+Xt-1+t我们关心的检验为:零假设H0:=0。备择假设H1:0•上述检验可通过OLS法下的t检验完成。•然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t检验无法使用。•Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为统计量),即DF分布(见表9.1.3)。•由于t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布。•因此,可通过OLS法估计:Xt=+Xt-1+t并计算t统计量的值,与DF分布表中给定显著性水平下的临界值比较:表9.1.3DF分布临界值表样本容量显著性水平2550100500∝t分布临界值(n=∝)0.01-3.75-3.58-3.51-3.44-3.43-2.330.05-3.00-2.93-2.89-2.87-2.86-1.650.10-2.63-2.60-2.58-2.57-2.57-1.28如果:t临界值,则拒绝零假设H0:=0,认为时间序列不存在单位根,是平稳的。•注意:在不同的教科书上有不同的描述,但是结果是相同的。例如:“如果计算得到的t统计量的绝对值大于临界值的绝对值,则拒绝ρ=0”的假设,原序列不存在单位根,为平稳序列。•问题的提出:在利用Xt=+Xt-1+t对时间序列进行平稳性检验中,实际上假定了时间序列是由具有白噪声随机误差项的一阶自回归过程AR(1)生成的。但在实际检验中,时间序列可能由更高阶的自回归过程生成的,或者随机误差项并非是白噪声,这样用OLS法进行估计均会表现出随机误差项出现自相关(autocorrelation),导致DF检验无效。2、ADF检验另外,如果时间序列包含有明显的随时间变化的某种趋势(如上升或下降),则也
本文标题:第六讲-时间序列的平稳性及其检验
链接地址:https://www.777doc.com/doc-3878042 .html