您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 2-纵向数据分析-ARIMA
第一部分:纵向数据(时间序列)分析(Time/PeriodData)自回归及相关模型西安交大管理学院2011-春2内容1序列自相关及检验(ARMA)2平稳时间序列模型3非平稳时间序列模型4协整和误差修正模型5条件异方差模型–自回归条件异方差模型(ARCH)–非对称ARCH–成分ARCH6向量自回归和误差修正模型–向量自回归VAR–误差修正模型VEC西安交大管理学院2011-春3时间序列定义随机过程:随时间由随机变量组成的一个有序序列称为随机过程。用{x,tT}表示。简记为{xt}或xt。随机过程也常简称为过程。时间序列:随机过程的一次观测结果称为时间序列。也用{xt,tT}表示,并简记为{xt}或xt。时间序列中的元素称为观测值。随机过程和时间序列一般分为两类。一类是离散型的,一类是连续型的。离散型随机过程和时间序列,即观测值是从相同时间间隔点上得到的。可通过两种方法获得:(1)抽样于连续变化的序列。比如某市每日中午12点观测到的气温值序列;工业流程控制过程中,对压力、液面、温度等监控指标定时刻采集的观测值序列。(2)计算一定时间间隔内的累积值。比如中国的年基本建设投资额序列、农作物年产量序列等。西安交大管理学院2011-春4时间序列模型的分类一般分为四种类型:•自回归过程(AR)、移动平均过程(MA)、•自回归移动平均过程(ARMA)/平稳的时间序列模型、•单整自回归移动平均过程(ARIMA,AutoregressiveIntegratedMovingAverage)、单方程•单位根检验、协整理论著名的Granger定理•自回归发布滞后模型(ADL)•误差修正模型(ECM)•自回归条件异方差ARCH、GARCH,GARCH-M多方程•向量自回归模型VAR•向量误差修正模型(VEC)西安交大管理学院2011-春5问题的引出:非平稳变量与经典回归模型经典回归分析暗含着一个重要假设:数据是平稳的。•数据非平稳,大样本下的统计推断基础——“一致性”要求——被破怀。•经典回归分析的假设之一:解释变量X是非随机变量•放宽该假设:X是随机变量,则需进一步要求:(1)X与随机扰动项不相关∶Cov(X,)=0(2)依概率收敛:第(1)条是OLS估计的需要第(2)条是为了满足统计推断中大样本下的“一致性”特性:)ˆ(limnPnXXi/)(2QnXXPin)/)((2lim西安交大管理学院2011-春6•注意:在双变量模型中:•因此•如果X是非平稳数据(如表现出向上的趋势),则(2)不成立,回归估计量不满足“一致性”,基于大样本的统计推断也就遇到麻烦。nxnuxxuxiiiiii//ˆ22QnxPnuxPPiiin0/lim/limˆlim2西安交大管理学院2011-春7数据非平稳,往往导致出现“虚假回归”问题表现在:两个本来没有任何因果关系的变量,却有很高的相关性(有较高的R2)。例如:如果有两列时间序列数据表现出一致的变化趋势(非平稳的),即使它们没有任何有意义的关系,但进行回归也可表现出较高的可决系数。在现实经济生活中,实际的时间序列数据往往是非平稳的,而且主要的经济变量如消费、收入、价格往往表现为一致的上升或下降。这样,仍然通过经典的因果关系模型进行分析,一般不会得到有意义的结果。时间序列分析模型方法就是在这样的情况下,以通过揭示时间序列自身的变化规律为主线而发展起来的全新的计量经济学方法论。已成现代计量经济学的重要内容,并广泛应用于经济分析与预测当中。西安交大管理学院2011-春8时间序列数据的平稳性定义:假定某个时间序列是由某一随机过程(stochasticprocess)生成的,即假定时间序列{Xt}(t=1,2,…)的每一个数值都是从一个概率分布中随机得到,如果满足下列条件:1)均值E(Xt)=是与时间t无关的常数;2)方差Var(Xt)=2是与时间t无关的常数;3)协方差Cov(Xt,Xt+k)=k是只与时期间隔k有关,与时间t无关的常数;则称该随机时间序列是平稳的(stationary),而该随机过程是一平稳随机过程(stationarystochasticprocess)。西安交大管理学院2011-春9例1.一个昀简单的随机时间序列是一具有零均值同方差的独立分布序列:Xt=t,t~N(0,2)该序列常被称为是一个白噪声(whitenoise)。由于Xt具有相同的均值与方差,且协方差为零,由定义,一个白噪声序列是平稳的。例2.另一个简单的随机时间列序被称为随机游走(randomwalk),该序列由如下随机过程生成:Xt=Xt-1+t这里,t是一个白噪声。容易知道该序列有相同的均值:E(Xt)=E(Xt-1)为了检验该序列是否具有相同的方差,可假设Xt的初值为X0,则易知:X1=X0+1X2=X1+2=X0+1+2……Xt=X0+1+2+…+t由于X0为常数,t是一个白噪声,因此:Var(Xt)=t2即Xt的方差与时间t有关而非常数,它是一非平稳序列。西安交大管理学院2011-春10然而,对X取一阶差分(firstdifference):Xt=Xt-Xt-1=t由于t是一个白噪声,则序列{Xt}是平稳的。后面将会看到:如果一个时间序列是非平稳的,它常常可通过取差分的方法而形成平稳序列。事实上,随机游走过程被称之为1阶自回归AR(1)过程的特例:Xt=Xt-1+t不难验证:1)||1时,该随机过程生成的时间序列是发散的,表现为持续上升(1)或持续下降(-1),因此是非平稳的;2)=1时,是一个随机游走过程,也是非平稳的。§2中将证明:只有当-11时,该随机过程才是平稳的。1阶自回归过程AR(1)又是如下k阶自回归AR(K)过程的特例:Xt=1Xt-1+2Xt-2…+kXt-k该随机过程平稳性条件将后面介绍。西安交大管理学院2011-春11平稳性检验的图示判断•给出一个随机时间序列,首先可通过该序列的时间路径图来粗略地判断它是否是平稳的。•一个平稳的时间序列在图形上往往表现出一种围绕其均值不断波动的过程。•而非平稳序列则往往表现出在不同的时间段具有不同的均值(如持续上升或持续下降)。tXtXtt(a)(b)图9.1平稳时间序列与非平稳时间序列图西安交大管理学院2011-春12进一步的判断:检验样本自相关函数及其图形定义随机时间序列的自相关函数(autocorrelationfunction,ACF)如下:k=k/0自相关函数是关于滞后期k的递减函数(Why?)。实际上,对一个随机过程只有一个实现(样本),因此,只能计算样本自相关函数(Sampleautocorrelationfunction)。一个时间序列的样本自相关函数定义为:易知,随着k的增加,样本自相关函数下降且趋于零。但从下降速度来看,平稳序列要比非平稳序列快得多。nttkntkttkXXXXXXr121,3,2,1k西安交大管理学院2011-春13krkr110k0k(a)(b)图9.1.2平稳时间序列与非平稳时间序列样本相关图•注意:确定样本自相关函数rk某一数值是否足够接近于0是非常有用的,因为它可检验对应的自相关函数k的真值是否为0的假设。Bartlett曾证明:如果时间序列由白噪声过程生成,则对所有的k0,样本自相关系数近似地服从以0为均值,1/n为方差的正态分布,其中n为样本数。也可检验对所有k0,自相关系数都为0的联合假设,这可通过如下QLB统计量进行:该统计量近似地服从自由度为m的2分布(m为滞后长度)。因此:如果计算的Q值大于显著性水平为的临界值,则有1-的把握拒绝所有k(k0)同时为0的假设。mkkLBknrnnQ12)2(西安交大管理学院2011-春14例3检验中国支出法GDP时间序列的平稳性。1978~2000年中国支出法GDP(单位:亿元)年份GDP年份GDP年份GDP19783605.6198610132.8199446690.719794073.9198711784199558510.519804551.3198814704199668330.419814901.4198916466199774894.219825489.2199018319.5199879003.319836076.3199121280.4199982673.119847164.4199225863.6200089112.519858792.1199334500.6西安交大管理学院2011-春15图9.1.51978~2000年中国GDP时间序列及其样本自相关图-0.4-0.20.00.20.40.60.81.01.2246810121416182022GDPACF020000400006000080000100000788082848688909294969800GDP图形:表现出了一个持续上升的过程,可初步判断是非平稳的。样本自相关系数:缓慢下降,再次表明它的非平稳性。从滞后18期的QLB统计量看:QLB(18)=57.1828.86=20.05拒绝:该时间序列的自相关系数在滞后1期之后的值全部为0的假设。结论:1978—2000年间中国GDP时间序列是非平稳序列。就此来说,运用传统的回归方法建立它们的回归方程是无实际意义的。不过,§3中将看到,如果两个非平稳时间序列是协整的,则传统的回归结果却是有意义的,而这两时间序列恰是协整的西安交大管理学院2011-春16平稳性的单位根检验(unitroottest)11、、DFDF检验检验随机游走序列:Xt=Xt-1+t是非平稳的,其中t是白噪声。而该序列可看成是随机模型:Xt=Xt-1+t中参数=1时的情形。对式:Xt=Xt-1+t(*)进行回归,如果确实发现=1,就说随机变量Xt有一个单位根。(*)式可变形式成差分形式:Xt=(1-)Xt-1+t=Xt-1+t(**)检验(*)式是否存在单位根=1,也可通过(**)式判断是否有=0。西安交大管理学院2011-春17一般地:检验一个时间序列Xt的平稳性,可通过检验带有截距项的一阶自回归模型:Xt=+Xt-1+t(*)中的参数是否小于1。或者:检验其等价变形式:Xt=+Xt-1+t(**)中的参数是否小于0。(*)式中的参数1或=1时,时间序列是非平稳的;对应于(**)式,则是0或=0。因此,针对式:Xt=+Xt-1+t我们关心的检验为:零假设H0:=0备择假设H1:0检验可通过OLS法下的t检验完成。西安交大管理学院2011-春18然而,在零假设(序列非平稳)下,即使在大样本下t统计量也是有偏误的(向下偏倚),通常的t检验无法使用。Dicky和Fuller于1976年提出了这一情形下t统计量服从的分布(这时的t统计量称为统计量),即DF分布表9.1.3。由于t统计量的向下偏倚性,它呈现围绕小于零值的偏态分布。表9.1.3DF分布临界值表样本容量显著性水平2550100500∝t分布临界值(n=∝)0.01-3.75-3.58-3.51-3.44-3.43-2.330.05-3.00-2.93-2.89-2.87-2.86-1.650.10-2.63-2.60-2.58-2.57-2.57-1.28因此,可通过OLS法估计:Xt=+Xt-1+t并计算t统计量的值,与DF分布表中给定显著性水平下的临界值比较:如果:t临界值,则拒绝零假设H0:=0,认为时间序列不存在单位根,是平稳的。注意:在不同的教科书上有不同的描述,但是结果是相同的。例如:“如果计算得到的t统计量的绝对值大于临界值的绝对值,则拒绝ρ=0”的假设,原序列不存在单位根,为平稳序列。西安交大管理学院2011-春192、ADF检验问题的提出:在利用Xt=+Xt-1+t对时间序
本文标题:2-纵向数据分析-ARIMA
链接地址:https://www.777doc.com/doc-23374 .html