您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 资本运营 > 基于人工神经网络的湘江最大洪水预报2
1基于人工神经网络的湘江最大洪峰流量中长期预报宋荷花1,胡国华1,李正最2(1.长沙理工大学河海工程学院,长沙410076;2.湖南省水文水资源勘测局.湖南长沙410007)摘要:本文将统计相关性分析与模糊方法相结合,识别出影响湘江湘潭站年最大洪峰流量的前期流域降水、大气环流形势等预报因子,通过比较几种改进的BP网络的优缺点,探讨了BP网络建模过程中存在的几个问题,建立了LMBP算法和自适应BP算法相耦合的神经网络中长期水文预报模型。预报结果表明,预报效果好,精度高,具有较高的推广和应用价值。关键词:LMBP算法;自适应BP算法;湘江;年最大洪峰;中长期预报Abstract:Inthispaper,anartificialneuralnetworkmediumandlong-termhydrologicalforecastingmodelcombiningwithLMalgorithmandself-adaptivealgorithmwasestablishedincombiningstatisticalanalysiswhitfuzzyanalysis,choosingpredictorssuchasrainfallandatmosphericcirculationinearlierstagewhichaffecttheannualmaximumpeakdischargeattheXiangtanStationofXiangJiangRiver,consideringofcomparingtheadvantageanddisadvantageofseveralmodifiedBPalgorithms,discussingseveralproblemsinthemodelingprocess.Theresultofcalculationshowsthatmodelishighlyeffectiveandisworthpopularizationandapplication.KeyWords:LMalgorithm;Self-adaptivealgorithm;XiangJiangRiver;Annualmaximumpeakdischarge;Medium-longtermhydrologicalforecast1.引言湘江是洞庭湖水系的最大河流。湘江流域和洞庭湖区洪水与干旱灾害频繁发生。选择湘江流域主要控制站湘潭站的年最大洪峰流量进行中长期水文预报对于流域的防洪抗旱和水库优化调度具有重要的指导意义。年最大洪峰流量的分析和预报是中长期水文预报中的重点和难点之一,它涉及时、空尺度大,影响因素众多复杂,具有很大的不确定性,难以用常规统计方法作出准确预报,而人工神经网络能有效地处理问题的非线性、模糊性和不确定性关系,水文预报实践证明其具有较高的精度,因此将人工神经网络引入年最大洪峰流量的预报有望取得较好的效果。人工神经网络在水文预报中的应用方面,国内外学者做了大量的工作[3~5]。以往的研究表明:BP网络是最有效、最活跃的。但标准BP网络存在学习收敛速度较慢,稳定性差,易陷入局部极小等缺点,实际应用中一般须加以改进。本文将统计相关性分析与模糊方法相结合,识别出影响湘江湘潭站年最大洪峰流量的前期流域降水、大气环流形势等预报因子,通过比较几种改进的BP网络的优缺点,从函数算法选取方面寻找一个最优的BP网络,建立LMBP算法和自适应BP算法相耦合的神经网络中长期水文预报模型,进行湘江湘潭站年最大洪峰流量中长期预报。2.预报因子选择根据统计相关性分析,可以初步选择出与预报对象具有相关性的影响因子。由于水文现象的影响因素错综复杂,具有很大的不确定性,同时不少影响因子的物理意义尚不十分明确,2如何从与预报对象相关性差异不大的众多影响因子中遴选出与水文现象最为密切的预报因子是值得深入探讨的一个问题。本文从模糊水文学的角度出发,运用模糊识别方法识别预报因子。根据模糊模式识别预报模型[6],r越大,模拟精度就越高,相应地预报精度也较高。一般来说,对预报对象影响比较显著的影响因子,其样本特征值与类别特征值相关密切性r也比较大。因此可以从单个影响因子出发,以r增大为目标函数,采用影响因子综合作用的方法来进行预报因子的模糊识别。其基本步骤如下:(1)分别计算每个影响因子作用下的r值,同时为了检验r的稳定性,防止假相关,可以计算多个年份的r值,其绝对值平均设为ar。如果r值波动很大,甚至出现正负值变化,则认为此影响因子与预报对象之间无显著相关性,可视为无效因子首先予以剔除。将剩余影响因子按ar从大到小排序,分别设为ix,r值分别设为ir,1,,2,1mi。(2)将1x暂定为有效因子,并与影响因子2x综合作用,代入模糊模式识别预报模型中,得到样本特征值与类别特征值相关密切性12r,如果112rr,则视2x为有效因子,否则视为无效因子。(3)若2x为有效因子,将1x、2x、3x综合作用,得到123r,如果12123rr,则视3x为有效因子;若2x为无效因子,则将1x与3x综合作用,得到13r,如果113rr,则视3x为有效因子。(4)重复步骤(3),可得到多个有效因子,设其综合作用下的样本特征值与类别特征值相关密切性为r。为了取得较好的预报效果,一般要求8.0r,如果达不到要求,则将1x视为无效因子,另分别将ix(1,,2mi)定为有效因子,重复上述相关步骤,直至8.0r或达到最大的r值为止。上述方法是基于模糊模式识别理论,根据多个影响因子综合作用下的样本特征值与类别特征值最优相关密切性选择预报因子的,不妨称这种方法为成因预报因子选择的模糊识别方法。根据有关方面要求,次年年最大洪峰流量预报时间定在当年年末,因此预报因子选择限于当年相关水文气象资料。根据统计分析、成因分析和模糊分析,以74项环流特征量,关键区海温指数,流域站点降雨资料、历年月、年流量资料特征值等水文气象资料为基础,识别出影响湘潭站年最大洪峰流量的4个前期预报因子,分别为前一年5月北半球极涡强度指数、前一年8月北美副高强度指数、前一年5月北美副高面积指数、前一年3月编号台风。3.BP网络中长期水文预报模型的建立3.1BP神经网络基本原理BP神经网络通过误差函数最小化完成输入到输出的映射,包括信息正向传播和误差反向传播两个反复交替的过程。信息正向传播过程是将输入信息从输入层经隐含层逐层处理后传向输出层的过程,期间经过激励函数的处理,隐含层和输出层的计算公式分别为),('10jniiijjxwfx1,1,01nj(1)3),'''(101knjjjkkxwfy1,1,0mk(2)误差反向传播学习过程是误差从输出层到输入层向后传播并修正权值向量的过程,学习的目标是使网络的训练误差小于某一允许值。假设神经元的当前权值和阈值分别为)(0nw、)(0n,根据梯度下降法,下一时刻的权值和阈值修正公式为wEnwnwA)()1(00(3)AEnn)()1(00(4))1,0(表示比例系数,在训练中反映了学习速率(或步长)。3.2样本的预处理激励函数采用Sigmoid函数,其值域为(0,1),同时考虑到样本向量的各个指标不相同,为了计算处理方便,避免输入向量物理意义和单位的不同对BP网络模型的影响,因此学习前需将学习样本归一化,使各输入样本元素转化为(0,1)区间。本文采用以下的归一化公式:min,max,,)(iipipixxxx(5)minmax)(ddddpp(6)式(5)中,pix,表示第p个实际样本的第i个输入值,max,ix、min,ix分别表示实际样本中第i个输入的最大和最小值,)(pix表示归一化后的第p个样本的第i个输入值。式(6)中,pd表示第p个实际样本中的期望输出值,maxd、mind分别表示所有实际样本期望输出的最大值和最小值,)(pd表示归一化后的第p个样本的期望输出值。3.3BP算法的改进及比较研究虽然BP网络具有较高的预测精度,但是标准的BP算法不可避免的存在局部极小问题,以及学习算法的收敛速度慢,通常需要上千次或更多。以上原因大大限制了BP网络的推广应用。在一系列的改进算法中,由于各种算法各有优缺点,对一个给定问题来说,很难说那一个算法是最合适的。它取决于多种因素,如问题的复杂度、训练的样本数、网络的权重和偏差数、误差目标等。本文将对LMBP算法(lm)、牛顿BP算法(bfg)、弹性BP算法(rp)、自适应BP算法(gdx)、变步长BP算法(gda)、加动量BP算法(gdm)等几类改进的BP算法[7-8]进行试验。通过一组试验,本文对上述改进算法的性能作了比较研究。给定训练精度003.0,设定最大训练次数为50000次,隐含层节点数为6个,以湘江湘潭站1971-1995年实测年最大洪峰流量及其对应的4个前期预报因子特征值资料作为建模,预报1996年年最大洪峰流量。因为BP神经网络的初始权值是随机赋予的,所以每次训练和预报的结果不同,为了降低预报风险,减少偶然误差,在预报实践中一般取多次训练的平均值作为最后结果。在本组试验中,对各种算法各试验10次,结果见表1。表1多种算法训练结果比较4lmbfgrpgdxgdagdmAVE训练次数AVE模拟误差%AVE预报误差%MSEMAPE89.5-8.20.00700.0828310.3-3.90.00490.06814510.1-7.00.00680.078158810.3-5.70.00400.058897510.5-6.50.00500.065—————注:-表示最大训练次数内未收敛至给定训练精度;MSE表示相对误差均方差;MAPE表示平均绝对相对误差。可用均方差和平均绝对相对误差评价各种算法的预报性能:均方差NeMSEi2)((3)平均绝对相对误差NeMAPEi(4)式(3)、式(4)中,ie为预报的相对误差,N为试验次数。从网络收敛的速度、性能、网络模拟训练结果与实测结果的平均相对误差比较可知,在进行网络学习训练逼近实际洪峰流量时,几种改进算法在网络训练时的性能尚有差异。在给定训练次数情况下,gdm网络不收敛。从训练速度看,lm算法是最快的;从模型模拟误差来看,lm是最优的;从预报性能来看,gdx算法最好,Lm算法虽然不是最优,但是也能满足水文预报精度的要求。根据试验结果,本文认为中长期水文预报BP网络模型中,训练最好选用Levenberg-Marquardt(Lm)算法。本文中采用lmbp算法进行训练,以确定网络结构,选用自适应BP算法算法进行预报。3.4网络结构的确定3.4.1收敛准则的选择BP网络常选择均方误差作为网络训练的收敛准则,即要求全部训练样本实际输出的均方误差小于一个足够小的数,称为训练精度。一般来说,越小拟合精度越高,相应地预报精度也越高;但是,如果太小,不但增加训练时间,而且会出现过拟合现象,从而使预报精度降低。根据水文预报实际,拟合的平均绝对相对误差小于10%时便可以满足绝大多数的预报要求。本文经大量试验验证,当003.0时能取得令人满意的效果,对应拟合的平均绝对相对误差为10%左右。3.4.2隐含层神经元数的确定采用三层结构的BP网络模型进行预报。输入层和输出层的单元数可由研究问题的要求所决定,对于水文预报,输入层神经元数等于前期预报因子的个数;输出层神经元数即为待预报水文要素的个数,一般为1个。因此隐含层神经元数的确定是建立BP模型的关键之一。采用“试错法”[9]确定隐含层神经元数。首先给定较小初始隐含层神经元数,构成一个结构较小的BP网络,进行训练。如果训练次数很多或者在规定的训练次数内没有满足收敛条件,停止训练,逐渐增加隐含层神经元数形成新的网络重新训练。研究表明[10],对于给定的训练样本数,存在一个最佳BP结构,即最少隐含层单元数,使网络的训练次数最少且具有最强的泛化能力。自适应BP算法收敛所需训练次数多波动大,要确定最少隐含层神经元数势必需要大量次数的试验,而LMB
本文标题:基于人工神经网络的湘江最大洪水预报2
链接地址:https://www.777doc.com/doc-2573264 .html