您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业文化 > 短期观测资料的海洋极值环境要素概率模型估计
第26卷第3期Vol.26No.3工程力学2009年3月Mar.2009ENGINEERINGMECHANICS176————————————————收稿日期:2007-11-14;修改日期:2008-11-06基金项目:国家自然科学基金项目(50609003)作者简介:*周道成(1976-),男,贵州玉屏人,讲师,博士,从事海洋平台结构安全评定(E-mail:daocheng_z@hit.edu.cn);段忠东(1968-),男,湖南衡阳人,教授,博士,从事结构可靠度、海洋工程结构、结构健康监测研究(E-mail:duanzd@hit.edu.cn);欧进萍(1959-),男,湖南宁远人,教授,博士,从事结构安全评定、结构智能控制与性态设计、结构健康监测等研究(E-mail:oujinping@hit.edu.cn).文章编号:1000-4750(2009)03-0176-06短期观测资料的海洋极值环境要素概率模型估计*周道成,段忠东,欧进萍(哈尔滨工业大学土木工程学院,哈尔滨,黑龙江150090)摘要:首先将昀大熵分布应用于极值环境要素;其次根据其参数估计的特点,利用LS-SVM良好的泛化能力和小样本学习能力,采用Bootstrap方法得到的“理想”极值数据样本对LS-SVM函数进行估计,建立根据现场短期观测资料估计其极值环境要素矩的方法;结合昀大熵分布的参数估计,建立了由现场短期观测资料估计其极值概率模型的新方法;昀后通过模拟试验和实际数据验证了该方法的有效性和合理性。关键词:短期观测资料;LS-SVM;Bootstrap;昀大熵分布;环境要素中图分类号:P722.4;P722.7文献标识码:AEXTREMEVALUEDISTRIBUTIONOFOFFSHOREENVIRONMENTALFACTORBASEDONSHORT-TERMOBSERVATIONDATA*ZHOUDao-cheng,DUANZhong-dong,OUJin-ping(SchoolofCivilEngineering,HarbinInstituteofTechnology,Harbin,Heilongjiang150090,China)Abstract:Theprobabilisticpropertiesoftheextremevalueofenvironmentalfactoraredescribedbythemaximumentropydistributionforitsexcellentadaptability.BecauseLS-SVMhassomeimportantpropertiessuchasgoodgeneralizationandexcellentlearning,itisemployedtocalculatethemomentoftheenvironmentalfactoraccordingtoshort-termobservationdataandbasedontheextremevaluesamplesobtainedbyBootstrapmethod.Theparametersofmaximumentropydistributioncanbecalculatedbythemoments,soanewmethodforthedistributionoftheenvironmentalfactorbasedonshort-termobservationdataisobtained.Themethodisverifiedbysimulationexperimentandactualdata.Keywords:short-teamobservationdata;leastsquares-supportvectormachine(LS-SVM);Bootstrap;maximumentropy;environmentalfactor建立正确反映海洋工程结构物所在区域极端环境要素随机性的概率模型是合理确定海洋工程结构物荷载条件、进行设计结构可靠度分析和在役结构物安全评定的关键环节之一。根据海洋工程结构所在区域海洋环境要素长期观测资料估计其极值环境要素概率模型,是确定荷载条件的有效途径。我国海洋环境要素长期观测资料主要来源于环海沿岸海洋台站和数值模拟[1]。在应用沿岸环境条件推算海上环境条件时,由于推算方法的合理性、模型参数估计误差等因素影响,推算的环境条件不能真实的反映海上环境条件;同时数值模拟资料受多种因素的影响,其结果也不能完全反映海上环境条件。我国80年代中期以来才大规模的进行海洋油气资源开发,由于海上环境要素观测费用昂贵,工程力学177海上海洋环境要素观测资料都是根据不同的目的进行短期观测,目前海上海洋环境要素观测资料基本都是短期的。因此如何根据短期观测资料估计其极值概率模型具有重要的意义。国外对如何利用短期观测资料估计其概率特性的问题很重视,对其进行了较系统的研究,根据短期风速资料,利用观测的小时、天、周及月昀大风速估计出设计基准期的参考风速[2-5];Simiud[6]等研究了基于跨阈法(POT)取样的广义Parato模型(GPD),由于POT法取用跨越某一阈值的子样个体,因此,可获得多余观测年限的更多极值样本点。文献[7],利用月昀大风速对重庆地区基于短期风速资料的极值风速确定进行了较系统的研究。这些方法实质上扩大统计样本,获得多余观测年限的更多极值样本点。然后仍然按照常规统计假设推断的方法进行分析。高文达[8]提出了一种频率线定线方法确定设计波高,它的实质是根据短期观测资料建立常遇波高与其频率的直线关系,采用外推的方法获得设计波高。董安正等[9]根据利用人工神经网络弥补信息不全的特性,建立了基于人工神经网络的短期资料的设计风速估计方法。这些研究主要是集中于扩大统计样本来研究其概率模型,或是采用人工智能方法估计其设计环境要素,没有综合利用它们的优点。本文将针对短期观测资料海洋环境要素样本数目不足的缺陷,首先利用LS-SVM良好的泛化能力和小样本学习能力,结合现场短期观测资料与其附近海洋台站观测资料之间的关系,获得现场较长极值样本,在此基础上采用由Bootstrap方法得到的“理想”大子样极值样本对SVM进行训练,建立基于LS-SVM的短期观测资料极值环境要素高阶矩估计方法;然后根据昀大熵概率模型具有适用范围广和其模型参数估计的特点[10―11],将其引入描述极值环境要素概率特性,从而建立基于短期观测资料的海洋环境要素极值概率模型的估计方法。1极值环境要素最大熵概率密度函数昀大熵概率密度为[10]:01()expniiifxx1,2,,n…,i(1)式中0,1,…,n为拉格朗日系数,可求解下列i()的方程组获得:1,2,i,…n01expd1nbiiaixx(2a)01expdnbjiijaixxxm,(2b)1,2,,jn式中jm是随机变量的j阶原点矩。则有昀大熵的分布函数:01()()dexpdnxxiiaaiFxfxxxxn,1,2,,i…(3)利用非线性规划法[12]或非线性方程组解法[13]求解式(2)得到待定因子i()。文献[12―13]表明,昀大熵利用所能得到的信息能对概率密度作出昀佳估计。对于大多数分布形态的概率密度函数,仅需前四阶矩就能获得较好效果[13]。因此,本文将随机变量前四阶矩确定的昀大熵密度函数和分布函数应用于描述海洋极值环境要素的概率特性。1,2,,i…n2基于LS-SVM的极值环境要素最大熵概率密度函数估计根据随机变量原点矩、LS-SVM方法、昀大熵概率密度函数估计和短期数据等特点,拟定了基于LS-SVM的环境要素概率密度估计方法,主要过程如下:1)建立输入变量和输出变量;2)对原始数据进行预处理,在此基础上应用Bootstrap方法建立LS-SVM的学习样本数据;3)应用学习样本数据对LS-SVM函数进行参数求解,建立LS-SVM估计模型;4)应用LS-SVM模型计算环境要素原点矩;5)极值环境要素昀大熵概率密度函数估计。从其计算过程可知,输入变量和输出变量、基于Bootstrap方法建立学习样本、LS-SVM函数估计和极值环境要素概率密度函数估计是四个主要方面,下面分别介绍。2.1输入变量和输出变量本文是利用LS-SVM良好的泛化能力、弥补信息不全的能力、计算过程简单和计算速度快等特点,特别是良好的小样本学习能力,采用Bootstrap方法得到的“理想”极值数据样本对SVM进行训练,然后由短期观测资料获得的小样本年极值子样估计环境要素原点矩。因此输入变量是小样本年极值子样,输出变量是环境要素原点矩。随机变量阶原点矩的估计公式:k178工程力学11nkXimnkix(4)2.2基于Bootstrap法建立学习样本建立学习样本是本文方法的一个重要基础。本文拟用现场短期观测资料和附近海洋台站长期观测资料,建立现场资料与附近海洋台站资料之间的关系,从而获得由附近海洋台站资料推算的长期资料,并获得其年极值样本。尽管这是目前现场缺乏长期资料情况下的一种常用方法[7,14],但由于历史、技术等原因,我国沿岸海洋台站海洋环境要素观测的历史也只有35年左右,对于估计100重现期的极值环境要素这样的子样数也是不理想的。因此本文利用一种新的增广样本统计方法——Bootstrap方法来获得“理想”的样本,用于估计LS-SVM函数。2.2.1Bootstrap法Bootstrap方法由美国Stanford大学Efron教授于1979提出,它很好地解决了试验样本量的小子样试验评估问题[15]。Bootstrap方法与传统的统计理论方法相比,去除了大样本的限制,找到了一个模拟的样本参量来代替未知的样本参量,目的是用现有的资料去模仿未知量的分布,它处理的是实际中可能发生但需要大量样本来计算统计量的问题。10nBootstrap方法的数学描述:设随机样本X12[,,,]nxxx…来自未知的总体分布F,(,)RXF为某个预先选定的随机变量,是X和F的函数。需要根据观测样本12[,,,]nXxx…x估计(,)RXF的分布特征。例如,设()F是总体分布F的某个参数,nF是观测样本X的经验分布函数,ˆˆ()F是的估计,记估计误差为:ˆ(,)()()nnRXFFFT(5)需要由观测样本12[,,,]nXxxx…估计(,)RXF的分布特征。因此Bootstrap方法的实质是一个再抽样过程,可以有放回的抽取任意大样本容量的子样来获得精确的分布特征估计。2.2.2基于Bootstrap法建立学习样本本文利用现场短期观测资料和附近海洋台站长期观测资料,结合Bootstrap方法的特点,拟定了基于Bootstrap方法建立的学习样本的基本过程,以风速为例其计算步骤如下。1)根据现场短期风速观测资料和附近海洋台站长期风速观测资料,可计算现场风速与附近海洋台站风速之间的关系,一般为线性关系[14]:yabx(6)2)根据附近海洋台站长期风速观测资料建立其年极值风速样本,通过式(6)可计算获得现场年极值风速样本。3)根据现场年极值风速样本,利用Bootstrap方法产生样本数为N(根据Bootstrap方法的基本要求,这里取20N0)的“理想”年极值风速样本。4)根据上述“理想”年极值风速样本,结合式(5)可估计极值环境要素k阶原点矩。5)重复步骤3)―步骤4)M次(M为用于LS-SVM函数的样本组数,本文取为10),每次都任意取连续的(取值与短期年极值风速样本数相等)个年极值风速得到KKM组短期年极值风速样本,每次可计算得到一组极值环境要素阶原点矩而得到kM组对应的极值环境要素阶原点矩。k2.3LS-SVM函数估计[16]2.3.1LS-SVM函数估计原理给定训练样本集{(ix,);},iy1,2,,in…nixR,iyR,首先用一非线性映射()把
本文标题:短期观测资料的海洋极值环境要素概率模型估计
链接地址:https://www.777doc.com/doc-920828 .html