您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > 〓基于ARIMA模型的福州市雷暴日分布趋势分析
1基于ARIMA模型的福州市雷暴日趋势预测分析刘隽1张烨方1黄岩彬1(福建省气象局福建福州350001)摘要:雷暴日是反应一个地区雷电活动规律的重要气象参数,是目前进行建筑物防雷类别及防雷装置设计的重要数据,对雷暴日进行预测是气象长期预报的一项重要内容,一般而言,雷暴日的年分布没有非常明显的趋势和规律,目前对雷暴日的预测、预报也还停留在研究和探索阶段。本文通过对建立ARIMA模型,采用将雷暴日的历史数据与雷暴日预测的残差相结合的方式,进行短期的雷暴日趋势预测,并以福州市1961-2005年的雷暴数据为样本做了实例计算,以建立的模型计算出2006年的雷暴预测数据,结果表明,ARIMA模型在短期预测方面有着较好的结果,可以应用在实际的雷暴日预测预报中。关键词:雷暴日自回归模型滑动平均模型预测中图分类号:X43文献标识码:A1概述在常见的数学预测模型中,时间序列是应用于具有时间性分布数据分布预测的常见手段,对于一些零散、无明显分布规律的数据而言,时间序列分析可以很好的利用本身数学模型的优点拟合出合适的结论进行预测,而这一特点正好适合来预测、预报像雷暴日这样分布无明显规律,具有时间序列的数据,论文采用了ARIMA模型进行了预测,其原理可概述如下:我们定义tY为一个时间序列,即tY中的数据是按照一定的时间段顺序排列的,以雷暴日为例,该时间序列时间段为年。进行ARIMA分析的数据必须满足两个条件,一是数据是平稳性的数据,二是数据本身的随机过程是一个白噪声过程,即当tY的数学期望为一固定值,或者说系统受扰动后经过足够长的时间后可以趋于平稳的序列可认为是平稳序列;而在满足平稳序列的前提下,如果还满足)(0)(2ststXEXst,则称序列tY为白噪声。利用tY的前p个数据进行回归计算来预测tY,即ptptttYYYY2211,称之为p阶AR自回归模型,可记为AR(p);利用tY的前q个预测残差值进行回归来计算tY,即qtqtttY2211,称之为q阶MA滑动平均模型,可记为MA(q);如果将AR(p)、MA(q)的预测方法相结合(即ARMA),就可以对数据进行更加完整的预测,由于很多数据本身并不是平稳的白噪声序列,因此需要对数据进行一定的处理才能使之成为可以进行ARMA分析的序列,常用的处理方法是对非平稳序列进行差分计算,即按照差分算子1tttYYY做数据的d阶差分,这样组合起来的模型即称之为ARIMA(p,d,q)。我们引入一个后移算子B,使之满足kttkXXB,并令1ppBBBB2211)(ppBBBB2211)(则可将ARIMA模型算式表达为:ttBYB)()(,再通过一定的参数估计方法将表达式收稿日期:2011-×-×基金项目:福州市科技计划项目(2008-S-87)资助作者简介:刘隽(1978-),男,工程师.通讯作者:liujun_fjlight@126.com2中的未知参数求解出来,形成完整的计算式用于具体的预测计算。2_ARIMA建模与预测2.1平稳性检验与差分处理我们将福州市年均雷暴日看成是一个随机性的时间序列进行分析,由于随机过程的均值和自协方差要求都不依赖于序列时间点的取值,即随机过程是一个平稳过程,因此在进行ARIMA建模前需要对福州市雷暴日的数据平稳性进行检验和处理,以保证用于建模的数据的稳定性。这里采用自相关系数和偏自相关系数来判断时间序列的平稳性,定义自相关系数为:)()(),(jttjttYVarYVarYYCov其中,)(Cov是协方差计算,)(Var是方差计算。定义偏自相关系数为:对于时间序列tY,k阶偏自相关系数kk,用时间序列的条件密度期望及相应方差的比值来表示:),,|(),,|(],,|))([(121121121,ktttktkttttktttktktttkkYYYYVarYYYYVarYYYYYYYE我们对福州市1961-2005年的年均雷暴日按上述算式进行自相关系数和偏自相关系数计算并绘制自相关系数和偏自相关系数图(如图1-a),从图中可看出福州市雷暴日的基本符合稳定性数据的要求,但整体的截尾和拖尾特征不明显,不利于我们进行ARIMA建模取值,于是对样本数据进行差分处理,即用差分算子1tttYYY进行数据差分,并引入后移算子B,则可推导得ddB)1(。按照上式对福州市1961-2005年的年均雷暴日做二阶差分处理并计算自相关系数和偏自相关系数及绘图,如图1-b所示,可发现二阶差分后的时间序列截尾和拖尾性质很明显,可以进行ARIMA的建模。a)0阶自相关、偏自相关图b)2阶自相关、偏自相关图a)0stepforACF、PACFb)2stepforACF、PACF图1福州市1961-2005年均雷暴日自相关、偏自相关分析图Draw1ACF、PACFDrawingofFuzhou1961to2005annualthunderstormdays2.2_ARIMA建模ARIMA建模的关键在于确定一个最优的自回归p、滑动平均指数q及相应的差分阶数d,在确认了ARIMA的三个参数后,采用极大似然函数进行ARIMA模型参数的参数估计。即建立如下命题:对于平稳序列的ARIMA模型:qtqtttptptttYYYY22112211估计参数],,[21p、],,[21q及t,需要建立1qp个方程,我们先认为t是一个白噪声,认为其服从正态分布,则有似然函数:3)2exp()21(),,;,,(),,(2122212nkknnfL对上式取对数可得21222ln)2ln(2)],,([nkknnLLn对上式进行偏导计算即可得相应参数的极大似让估计表达式。而在确定了各个参数的估计量后,由于我们在进行计算时认为序列的随机误差t是一个白噪声,可以通过对t构造一定的统计量来进行结论的假设检验,以保证参数估计结果的准确性,这里借鉴Box-Pierce提出的Q统计量mktkmktkqpmNNNNQ12221)(~),()],([进行参数估计结果的假设检验。为了保证所建立的ARIMA模型的最优性,还需要对我们所选择的(p,d,q)进行最佳准则定阶,参考AIC准则函数(Akaike于1973年提出的判别准则):)(2),(ln),(2jkjknjkAIC取通过Q检验量假设检验的,且AIC值最小的那对自回归p、滑动平均指数q阶数即为最优解。基于上述方法,我们通过对比发现ARIMA(2,2,0)为最优化结果(其余参数的计算、对比过程略),按照ARIMA(2,2,0)模型进行计算(如图2)图2_ARIMA(2,2,0)参数估计与检验、判定结果Draw2ParameterEstimationandHypothesisTestResultforARIMA(2,2,0)2.3_ARIMA预测与结果分析通过计算得ARIMA(2,2,0)的两个参数AR1=-0.11,AR(2)=-0.422,将参数代入ARIMA一般式:ttdBYBB)()1)((整理得:12349.0777.0236.0423.0tttttYYYYY按照上式计算福州市1961-2005年的年均雷暴日拟合值,推算福州市2006年雷暴日预测值并绘制预测值与实际值的对比曲线(如图3)。4图3福州市1961-2005年的年均雷暴日预测值与实际值折线对比图Draw3PredictedComparedWithActualValueof1961-2005FuzhouAnnualThunderstormDays通过图3我们可以发现,按照ARIMA(2,2,0)拟合的福州市年均雷暴日分布函数能够比较好的符合福州市近几十年来的雷暴分布趋势,而在预测值的能力上,通过该函数计算的2006年福州市的年均雷暴日为55.066天,实际的2006年福州市雷暴日为59天,基本持平在同一个层次及误差可接受的范围内,体现出ARIMA模型在短期预测方面的优越性;然而该模型在长期数据预测能力上还不够完善,仅能比较准确的预测出时间序列数据后1-3个时间段的数值,后期的预测数据呈现出离散放大的趋势,不利于长期预测。3结论论文在分析ARIMA(p,d,q)预测模型的基础上,以福州市1961-2005年的雷暴日为时间序列基础,通过对该序列进行平稳性分析、差分处理、自相关、偏自相关系数计算与绘图、ARIMA建模、参数估计、假设检验及模型预测,将ARIMA模型很好的运用在了雷暴日的预测、预报上。结果显示,ARIMA在短期预测、预报方面能很好的拟合计算出未来短时段内的数据,但在长期预报上的精确度不高,为了提高ARIMA模型在雷暴日预测分析中的应用,我们提出如下的几种意见:首先是数据的积累,由于截止目前为止可利用的雷暴日观测数据仅有四十几年,ARIMA预测是通过对过去数据的规律分析及判断来确定参数的,因此样本量的多少对预测结果有很大的影响;其次,可以将年雷暴日预测转换为月雷暴日预测,由于雷暴活动呈现出很强的季节性规律,如果采用月雷暴日进行数据排序,那么ARIMA模型中的季节因子可以得到很好的体现;第三,采用一定的科学方法来确定ARIMA中的p、d、q值,在目前对ARIMA建模过程中p、d、q的确定方法还是主要通过人为的判断自相关、偏相关图进行确定,再通过一定的假设检验进行确认,这样子就使得所建立的ARIMA模型存在很大的主观成分,当然我们可以通过逐个p、d、q取值进行结果对比,但这样的处理方式计算量非常庞大,且某个p、d、q可能适用于后几个数据的预测,对于总体而言可能有其他的p、d、q更加符合要求,因此,如何通过一种科学的算法来确定p、d、q是提高ARIMA预测精确度的重要研究内容。总体而言,论文认为ARIMA模型可以应用于雷暴日的短期预测、预报。参考文献[1]郑小平、高金吉、刘梦婷,事故预测理论与方法,清华大学出版社,北京,2009年6月第一版;[2]贾俊平,统计学,中国人民大学出版社,北京,2003年6月第一版;[3]庄楚强、吴亚森,应用数理统计基础,华南理工大学出版社,广州,2004年8月第二版。FuzhouThunderstormDaysTrendForecastBytheARIMAModelLiujunZhangyefangHuangyanbin(FujianLightningProtectionCenter,FujianFuzhou,350001)Abstract:Thunderstormday(Td)isanactivitiesparameterinresponsingthelawofaregion’s5meteorological,isalsoanimportantdevicedataforthedesignofstructure’slightningprotectionlevel.Tdforecastisanimportantpartofthelong-termmeteorologicalforecast,generallyspeaking,theseisnotanveryclearlytrendsinthedistributionofTd.ThestudyofTd’strendisstillinresearchandexplorationphase.PaperisbasedontheestablishmentofARIMAmodel,usesthehistoricaldataofTdandTdpredicteddatatoforecasttheshort-termtrendofTd.Atlast,paperusesFuzhouasanexampletocalculatthemodelan
本文标题:〓基于ARIMA模型的福州市雷暴日分布趋势分析
链接地址:https://www.777doc.com/doc-2823586 .html