您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 数学建模中时间序列详细说明
基于Excel的时间序列预测与分析1时序分析方法简介1.1时间序列相关概念1.1.1时间序列的内涵以及组成因素所谓时间序列就是将某一指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化情况等,社会领域中某一地区的人口数、医院患者人数、铁路客流量等,自然领域的太阳黑子数、月降水量、河流流量等等,都形成了一个时间序列。人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多的从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。时间序列的变化受许多因素的影响,有些起着长期的、决定性的作用,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。在分析时间序列的变动规律时,事实上不可能对每个影响因素都一一划分开来,分别去作精确分析。但我们能将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。影响时间序列的构成因素可归纳为以下四种:(1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进地上升、下降或平稳的变化或移动。这一变化通常是许多长期因素的结果。(2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列并持续一年以上的有规则变动。这种因素是因经济多年的周期性变动产生的。比如,高速通货膨胀时期后面紧接的温和通货膨胀时期将会使许多时间序列表现为交替地出现于一条总体递增地趋势线上下方。(3)季节性变化(Seasonalvariation),指现象受季节性影响,按一固定周期呈现出的周期波动变化。尽管我们通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。(4)不规则变化(Irregularmovement),指现象受偶然因素的影响而呈现出的不规则波动。这种因素包括实际时间序列值与考虑了趋势性、周期性、季节性变动的估计值之间的偏差,它用于解释时间序列的随机变动。不规则因素是由短期的未被预测到的以及不重复发现的那些影响时间序列的因素引起的。时间序列一般是以上几种变化形式的叠加或组合出现的(如图1.4)。图1.1平稳序列图1.2趋势序列图1.3季节型序列图1.4含有季节与趋势因素的序列1.1.2时间序列的分类根据其所研究的依据不同,可有不同的分类:(1)按所研究的对象的多少来分,有一元时间序列和多元时间序列。如某种商品的销售量数列,即为一元时间序列;如果所研究对象不仅仅是这一数列,而是多个变量,如按年、月顺序排序的气温、气压、雨量数据等,每个时刻对应着多个变量,则这种序列为多元时间序列。(2)按时间的连续性可将时间序列分为离散时间序列和连续时间序列两种。如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列;如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。(3)按序列的统计特性分,有平稳时间序列和非平稳时间序列两类。所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。平稳序列的时序图直观上应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征;从理论上讲,分为严平稳与宽平稳两种。相对的,时间序列的非平稳性,是指时间序列的统计规律随着时间的推移而发生变化。(4)按序列的分布规律来分,有高斯型(Guassian)和非高斯型时间序列(non-Guassian)1.2时间序列分析概述时间序列分析是一种广泛应用的数据分析方法,它研究的是代表某一现象的一串随时间变化而又相关联的数字系列(动态数据),从而描述和探索该现象随时间发展变化的规律性。时间序列的分析利用的手段可以通过直观简便的数据图法、指标法、模型法等来分析,而模型法应用更确切和适用也比较前两种方法复杂,能更本质地了解数据的内在结构和复杂特征,以达到控制与预测的目的。时间序列分析方法包括:(1)确定性时序分析:它是暂时过滤掉随机性因素(如季节因素、趋势变动)进行确定性分析方法,其基本思想是用一个确定的时间函数tfy来拟合时间序列,不同的变化采取不同的函数形式来描述,不同变化的叠加采用不同的函数叠加来描述。具体可分为趋势预测法(最小二乘)、平滑预测法、分解分析法等;(2)随机性时序分析:其基本思想是通过分析不同时刻变量的相关关系,揭示其相关结构,利用这种相关结构建立自回归、滑动平均、自回归滑动平均混合模型来来对时间序列进行预测。为了对时间序列分析方法有一个比较全面的了解,现将时间序列分析方法归纳如下:平均模型等采用自回归模型、滑动贝叶斯分析马尔可夫分析不可控时序分析可控多元时序分析一元随机性时序分析平滑法等采用移动平均法、指数趋势加周期波动分析周期波动分析趋势变动分析发展水平分析确定性时序分析时间序列分析//1.3确定性时间序列分析由1.1的介绍,我们知道时间序列的变动是长期趋势变动、季节变动、循环变动、不规则变动的耦合或叠加。在确定性时间序列分析中通过移动平均、指数平滑、最小二乘法等方法来体现出社会经济现象的长期趋势及带季节因子的长期趋势,预测未来的发展趋势。1.3.1移动平均法通过对时间序列逐期递移求得平均数作为预测值的一种方法叫移动平均法,它是对时间序列进行修匀,边移动边平均以排除偶然因素对原序列的影响,进而测定长期趋势的方法。其简单的计算公式为:预测值=最后n个值的平均其中:n=被认为是与预测下一个时期相关的最近的时期数采用Excel进行移动平均时,在【数据分析】选项中选择【移动平均】,并在对话框中输入数据区域和移动见间隔即可。说明:n的选择:采用移动平均法进行预测,用来求平均数的时期数n的选择非常重要,这也是移动平均的难点。因为n取值的大小对对所计算的平均数的影响较大。当1n时,移动平均预测值为原数据的序列值。当n=全部数据的个数时,移动平均值等于且为全部数据的算术平均值。显然,n值越小,表明对近期观测值预测的作用越重视,预测值对数据变化的反应速度也越快,但预测的修匀程度较低,估计值的精度也可能降低。反之,n值越大,预测值的修匀程度越高,但对数据变化的反映程度较慢。不存在一个确定时期n值的规则。一般n在3~200之间,视序列长度和预测目标情况而定。一般对水平型数据,n值的选取较为随意;一般情况下,如果考虑到历史上序列中含有大量随机成分,或者序列的基本发展趋势变化不大,则n应取大一点。对于具有趋势性或阶跃性特点的数据,为提高预测值对数据变化的反应速度,减少预测误差,n值取较小一些,以使移动平均值更能反映目前的发展变化趋势。一般n的取值为3~15。具体取值要看实际情况,可由均方差MSE来评价(MSE的概念在第3节“预测方法的评估”中介绍)。1.3.2指数平滑法指数平滑法是对过去的观测值加权平均进行预测,使第1t期的预测值等于t期的实际观测值与第t期指数平滑值的加权平均值,即预测值=(上期值)+)1((上次预测值)一次指数平滑法预测模型为:tttMyM11(1-1)其中:tM——第t期预测值;ty——第t期的实际观测值;——平滑系数,且10。将2211tttMyM3221tttMyM代入(1-1)式中,可得:tiitityM01(1-2)公式(1-2)中各项系数和为:tttt111111111当t时,01t,系数和1。所以,可以说tM是t期以及以前各期观察值的指数加权平均值,观察值的权数按递推周期以几何级数递减,各期的数据离第t期越远,它的系数愈小,因此它对预测值的影响也越小。公式(1-1)稍作变换可得:ttttMyMM1(1-3)可见,1tM是t期的预测值tM加上用调整的t期的预测误差ttMy。因此,简单指数平滑法用于预测实际上是根据本期预测误差对本期预测值作出一定的调整后得到的下一个预测值,即:新的预测值=老的预测值+老预测值的误差对老预测值所作的调整的幅度视的大小而定。说明:平滑系数的选择:的取值对平滑效果影响很大,越小平滑效果越显著.取值的大小决定了在平滑值中起作用的的观察值的项数的多少,当取值较大时,各观察值权数的递减速度快,因此在平滑值中起作用的观察值的项数就较少;而当取值较小时,各观察值权数的递减速度很慢,因此在平滑值中起作用的观察值的项数就较多。如果用移动平均数与指数平滑法相比,要使两者具有相同的灵敏程度,移动平均数n的取值与指数平滑法中的取值有如下关系:121n当取值0.05~0.3之间时,如果要使移动平均具有相应的灵敏程度,则N的取值为:0.050.10.20.3n391995.66≈6当取值较小时,指数平滑法的平滑能力较强,而取值较大时,模型对现象变化的反应速度较快。一般来说取值的大小应当视所预测对象的特点及预测期的长短而定。一般情况下,观测值呈较稳定的水平发展,值取0.1~0.3之间;观测值波动较大时,值取0.3~0.5之间;观测值呈波动很大时,值取0.5~0.8之间。采用Excel进行指数平滑预测步骤如下:1、选择在【数据分析】选项中选择【指数平滑】;2、在【输入区域】中输入数据区域;3、在【阻尼系数】输入1的值(注:阻尼系数=1);4、在【输出区域】中选择预测结果输出位置;单击【确定】即可。1.3.3趋势预测(1)线性趋势预测模型:btayt用最小二乘法求待定参数a、b决定于标准方程组:2tbttytbaytbyattnyttynb][)(22趋势预测的误差可用线性回归中的估计标准误差来衡量。公式为:2ˆ12nyysniiiy(2)二次曲线趋势预测模型:2ˆctbtayt根据最小二乘法推导待定参数a、b、c的标准方程组:.,,4322322tctbtayttctbtatytctbnay(3)指数曲线趋势预测模型:ttabyˆ,其中a、b为未知数。在这里必须要把指数先通过变量代换转化为直线趋势才能用最小二乘法来求参数,即:两边取对数btaytlnlnˆln,再根据直线形式的常数确定方法,可求得aln、bln,最后取反对数得到a、b的值。从总体上来说,确定性时序分析刻画了序列的主要趋势是直观简单、便于计算,但是比较粗略的,不能严格反映实际的变化规律,为了严格反映时序的变化必须结合随机时序分析法进一步完善对社会经济现象的分析以便进行决策。1.4随机性时间序列分析1.4.1平稳随机时间序列分析在随机性时间序列分析中,分为(宽)平稳时序分析和非平稳时序分析。平稳随机过程其统计特性(均值、方差)不随时间的平移而变化,在实际中若前后的环境和主要条件都不随时间变化就可以认为是平稳过程(宽平稳过程),具有(宽)平稳特性的时序称平稳时序。平稳时序分析主要通过建立自回归模型(AR,AutoregressiveModels)、滑动平均模型(MA,MovingAverageModels)和自回归滑动平均模型(ARMA,AutoregressiveMovingAverageModels)分析平稳的时间序列的规律,一般的分析程序可用下面框图表示:(1)自回归模型pAR如果时间序列,2,1tXt是平稳的且数据之间前后有一定的依存关系,即tX
本文标题:数学建模中时间序列详细说明
链接地址:https://www.777doc.com/doc-730929 .html