您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 旅游娱乐 > 关于入境旅游人数的时间序列分析
关于入境旅游人数的时间序列分析专业:统计学姓名:佟虹生指导老师:汪小英摘要大众旅游时代的到来,使旅游日益成为现代人类社会主要的生活方式和社会经济活动,旅游业以其强劲的势头成为全球经济产业中最具活力的“朝阳产业”。随着社会生产力不断发展,劳动生产率不断提高,以及人们生活水平的迅速提高和带薪假期的增加,旅游业将持续高速度发展,成为世界最重要的经济部门之一。中国同样如此,有数据统计2014年全国旅游及相关产业增加值占国内生产总值的比重为4.33%。众所周知旅游业是一个存在显著季节效应的行业,如果能对旅游业的客流量作出准确的预测,将会有利于商家更好的把握商机。本文选取入境旅游的客流量作为时间序列,将简单地分析该序列的季节效应,并对序列拟合ARIMA模型,并作出简单的预测。关键词:入境旅游;季节效应;时间序列;ARMIA;预测一、引言旅游是在人的基本生活需求得到适度满足后的一种新的消费行为,一种带有浓厚文化内涵的群体活动。人们离开常住地到异国他乡访问的旅行和暂时停留所引起的各种现象和关系的总和。我国拥有丰富的旅游资源,疆域辽阔,既有风景秀丽的江南水乡,也有粗犷豪迈的西北风情;我国拥有悠久的历史文化,目前已经公布了99个国家级历史文化古城,长城、故宫、颐和园等已经被列入世界文化遗产名录;我国还是一个拥有多个民族的国家,各个民族的习俗和风情很容易使人产生很强烈的向往之情。所有这些,都为我国旅游业的发展奠定了一个良好的基础,使得我国吸引了大量的入境游客。入境旅游是指他国居民前来我国的旅游活动,或者是指他国居民进入本国国境以内的旅游活动,入境旅游属于国际旅游。目前入境旅游已成为构成我国旅游业的重要组成部分。时间序列分析(Timeseriesanalysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题。因此本文将通过时间序列分析的方法来研究分析中国的入境旅游人数。二、研究方法差分运算具有强大的确定性信息提取能力,许多非平稳序列差分后会显示出平稳序列的性质,这是我们成这个非平稳序列为差分平稳序列。对差分平稳序列可以使用ARIMA模型进行拟合。具有如下结构的模型称为求和自回归移动平均(autoregressiveintegratedmovingaverage),简记为ARIMA(p,d,q)模型:{Φ(𝐵)∇𝑑𝑥𝑡=Θ(𝐵)𝜀𝑡Ε(𝜀𝑡)=0,𝑉𝑎𝑟(𝜀𝑡)=𝜎𝜀2,Ε(𝜀𝑡𝜀𝑠)=0,𝑠≠𝑡Ε𝑥𝑠𝜀𝑡=0,∀𝑠𝑡式中,∇𝑑=(1−𝐵)𝑑;Φ(𝐵)=1−𝜙1𝐵−⋯−𝜙𝑝𝐵𝑝,为平稳可逆ARMA(p,q)模型的自回归系数多项式;Θ(B)=1−𝜃1𝐵−⋯−𝜃𝑞𝐵𝑞,为可逆ARMA(p,q)模型的移动平滑系数多项式。ARIMA(p,d,q)模型是指d阶差分后自相关最高阶数为p,移动平均最高阶数为q的模型,通常它包含了p+q个独立的未知系数:𝜙1,⋯,𝜙𝑝,𝜃1,⋯,𝜃𝑞。如果该模型中有部分自相关系数𝜙𝑗(1≤𝑗𝑝)或部分移动平滑系数𝜃𝑘(1≤𝑘𝑞)为零,即原ARIMA(p,d,q)模型中有部分系数省缺了,那么该模型称为疏系数模型。疏系数模型一般形式为ARIMA((𝑝1,⋯,𝑝𝑚),d,(𝑞1,⋯,𝑞𝑛))式中,𝑝1,⋯,𝑝𝑚为非零自相关系数的阶数,𝑞1,⋯,𝑞𝑛为非零移动平滑系数的阶数。在实际操作中,疏系数模型时有应用。ARIMA模型可以对具有季节效应的序列建模。根据季节效应提取的难易程度,可以分为简单季节模型和乘积季节模型。简单季节模型是指序列中的季节效应和其他效应之间是加法关系,即𝑥𝑡=𝑆𝑡+𝑇𝑡+𝐼𝑡式中,𝑇𝑡代表序列的长期趋势波动;𝑆𝑡代表序列的季节性(周期性)变化;𝐼𝑡代表随机波动。这时,各种效应信息的提取都非常容易。通常简单的周期步长差分即可将序列中的季节信息提取充分,简单的低阶差分即可将趋势信息提取充分,提取完季节信息和趋势信息之后的序列就是一个平稳序列,可以用ARMA模型拟合。所以简单季节模型实际上就是通过趋势差分、季节差分将序列转换为平稳序列,再对其进行拟合。它的模型结构通常如下:∇𝐷∇𝑑𝑥𝑡=Θ(𝐵)Φ(𝐵)𝜀𝑡式中,(1)D为周期步长,d为提取趋势信息所用的差分阶数。(2){𝜀𝑡}为白噪声序列,且Ε(𝜀𝑡)=0,𝑉𝑎𝑟(𝜀𝑡)=𝜎𝜀2。(3)Θ(B)=1−𝜃1𝐵−⋯−𝜃𝑞𝐵𝑞,为q阶移动平均系数多项式。(4)Φ(𝐵)=1−𝜙1𝐵−⋯−𝜙𝑝𝐵𝑝,为p阶自回归系数多项式。但更为常见的情况是,序列的季节效应、长期趋势和随机波动之间有着复杂德尔交互影响关系,简单的ARIMA模型并不足以提取其中的相关关系,这时通常需要采用乘积季节模型。乘积模型的构造原理如下:当序列具有短期相关性时,通常可以使用低阶ARMA(p,q)模型提取。当序列具有季节效应,季节效应本身还具有相关性时,季节相关性可以使用以周期为步长单位的ARMA(P,Q)模型提取。由于短期相关性和季节效应之间具有乘积关系,所以拟合模型实质为ARMA(p,q)和ARMA(P,Q)的乘积。综合前面的d阶趋势差分和D阶以周期S为步长的季节差分运算,对原观察值序列拟合的乘积模型完整的结构如下:∇𝑑∇𝑆𝐷𝑥𝑡=Θ(𝐵)Θ𝑆(𝐵)Φ(𝐵)Φ𝑆(𝐵)𝜀𝑡式中,Φ(𝐵)=1−𝜙1𝐵−⋯−𝜙𝑝𝐵𝑝Θ(B)=1−𝜃1𝐵−⋯−𝜃𝑞𝐵𝑞Φ𝑆(𝐵)=1−𝜙1𝐵𝑆−⋯−𝜙𝑃𝐵𝑃𝑆Θ𝑆(𝐵)=1−𝜃1𝐵𝑆−⋯−𝜃𝑄𝐵𝑄𝑆该乘积模型简记为ARIMA(p,d,q)×(P,D,Q)𝑆。三、对中国入境旅游人数的实证研究本文实证研究所选取的数据是中国入境旅游人数,数据频率为月度,客流量单位为万人,时间跨度从2001年1月至2015年12月,共计180个数据,来源于中经网统计数据库。number5006007008009001000110012001300date01JAN200001JAN200201JAN200401JAN200601JAN200801JAN201001JAN201201JAN201401JAN20163.1原序列以及差分序列的相关检验3.1.1原序列的平稳检验首先画出原始序列的的时序图,进行观察,并结合单位根检验判断它的平稳性,图3.1为原始序列的时序图,表3.1为原始序列的3阶单位根检验结果。增广Dickey-Fuller单位根检验类型滞后RhoPrRhoTauPrTauFPrF零均值0-0.12370.6538-0.120.642110.17170.72230.220.750520.30170.75480.630.852030.31730.75870.780.8810单均值0-28.44290.0013-4.020.00178.170.00101-19.91340.0102-3.440.01096.170.00882-8.68380.1794-2.310.16843.130.27273-6.78220.2846-2.080.25372.730.3758趋势0-63.34600.0005-6.19.000119.160.00101-49.06450.0005-5.060.000312.960.00102-21.01210.0498-3.200.08745.260.1262图3.1原始序列时序图表3.1原始序列3阶单位根检验结果增广Dickey-Fuller单位根检验类型滞后RhoPrRhoTauPrTauFPrF3-16.19230.1367-2.770.21173.980.3823从时序图中可以观察到这是一个典型的有着上升趋势的非平稳序列,同时单位根检验也印证了我们的判断,从2阶开始p值大于0.05说明原始序列非平稳。同时从时序图中,我们还可以观察到原始序列在上升趋势的同时,还具备明显的周期性,周期长度为12,与常识的认知相符合。所以接下来要考虑对原始序列进行1阶12步差分处理,1阶差分去除原始序列的趋势,1阶差分后的序列进行12步差分提取差分后序列的季节信息即周期性。3.1.2差分序列的相关检验我们对1阶12步差分以后的序列进行平稳性和白噪声检验,图3.2为差分后序列的时序图,表3.2为差分后序列的3阶单位根检验结果,表3.3为差分后序列的白噪声检验结果。x_1_12-200-1000100200300400date01JAN200001JAN200201JAN200401JAN200601JAN200801JAN201001JAN201201JAN201401JAN2016图3.2差分后序列的时序图增广Dickey-Fuller单位根检验类型滞后RhoPrRhoTauPrTauFPrF零均值0-212.7480.0001-17.23.00011-209.2930.0001-10.18.00012-337.9990.0001-9.06.00013-697.2170.0001-8.03.0001单均值0-212.7430.0001-17.18.0001147.630.00101-209.2950.0001-10.15.000151.510.00102-338.0060.0001-9.03.000140.780.00103-697.5660.0001-8.01.000132.070.0010趋势0-212.7520.0001-17.13.0001146.760.00101-209.3970.0001-10.12.000151.220.00102-338.1520.0001-9.00.000140.530.00103-700.5710.0001-7.99.000131.890.0010白噪声的自相关检查至滞后卡方自由度Pr卡方自相关620.1560.0026-0.2810.085-0.1550.001-0.0730.0531267.6012.0001-0.0380.0220.053-0.0170.155-0.4811892.4418.00010.193-0.1910.177-0.0660.117-0.1042498.5024.00010.083-0.0410.047-0.1150.079-0.032从1阶12步差分后的序列时序图中不难看出,已经充分地提取了原始序列的趋势,同时差分后的序列也没有明显的周期性,当然差分后序列的3阶单位根检验也印证了我们的判断。再观察差分后序列的白噪声检验结果,发现无论是6阶、12阶、18阶或是24阶,p值都小于0.05,说明差分后的序列为一个非白噪表3.2差分后序列的3阶单位根检验结果表3.3差分后序列的白噪声检验结果声序列,所以综上,我们可以判断原始序列经过1阶12步差分以后得到一个非白噪声的平稳序列,有分析的价值,考虑到季节效应,可以尝试对差分以后的序列拟合ARIMA模型。3.2拟合ARIMA模型3.2.1考虑简单季节模型观察1阶12步差分后序列的自相关系数和偏自相关系数图,图3.3为差分后序列的自相关系数,图3.4为差分后序列的偏自相关系数。图3.3差分后序列的自相关系数自相关图显示延迟12阶自相关系数显著大于2倍标准差范围,这说明差分后序列中仍然蕴含着非常显著的季节效应。延迟1阶、2阶的自相关系数也大于2倍标准差,这说明差分后的序列还具有短期相关性。观察偏自相关图,得到结论基本一致。根据自相关系数和偏自相关系数的性质,可以尝试拟合疏系数模型AR(1,12)、MA(1,2,12)、ARMA((1,12),(1,2,12)),表3.4、表3.5、表3.6分别为3种模型的残差白噪声检验结果。图3.4差分后序列的偏自相关系数残差的自相关检查至滞后卡方自由度Pr卡方自相关65.3440.0017-0.016
本文标题:关于入境旅游人数的时间序列分析
链接地址:https://www.777doc.com/doc-5355767 .html