您好,欢迎访问三七文档
第四章水文统计研究对象:随机变量研究内容:随机变量的概率分布。(频率计算)随机变量间的相关关系。(相关分析)第一节概述1水文现象水文现象是一种自然现象,它具有必然性的一面,也具有偶然性的一面。必然现象是指事物在发展、变化中必然会出现的现象;水文学中称水文现象的这种必然性为确定性。偶然现象是指事物在发展、变化中可能出现也可能不出现的现象,偶然现象也称随机现象;偶然现象仍然是有规律的,一般称为统计规律。2水文统计数学中研究随机现象统计规律的学科称为概率论。由随机现象的一部分试验资料去研究总体现象的数字特征和规律的学科称为数理统计学。概率论与数理统计学应用到水文分析与计算上,称为水文统计。3水文统计的任务水文统计的任务就是研究和分析水文随机现象的统计变化特性,并以此为基础对水文现象未来可能的长期变化作出在概率意义下的定量预估,以满足工程规划、设计、施工以及运营期间的需要。水文统计的基本方法和内容具体有以下三点:1、根据已有的资料(样本),进行频率计算,推求指定频率的水文特征值;2、研究水文现象之间的统计关系,应用这种关系延长、插补水文特征值和作水文预报。第二节事件、概率、随机变量事件随机试验的结果。概率在同等可能的条件下,随机事件在试验的结果中可能出现也可能不出现,其出现或不出现的可能性大小称为概率。频率随机事件A在重复n次试验中出现了m次,则称为事件A在n次试验中出现的频率。当试验次数n无限增大时,随机事件的频率稳定在某一个数附近,此时频率趋于概率。可以频率作为概率的近似值。()mPAn随机变量表示随机试验结果的数量。随机变量的概率分布水文学习惯研究事件的概率及其分布。称为随机变量的分布函数,代表随机变量大于等于某一取值的概率。其几何图形称为随机变量的概率分布曲线,在水文学上通常称为随机变量的累积频率曲线,简称频率曲线。Xx()()FxPXx概率密度函数(密度曲线)随机变量落入区间的概率与区间长度之比值。xx()fx()FxpxP()()dFxfxdx()fx()Fx()()()xFxPXxfxdx第三节经验频率曲线1、经验频率曲线的绘制设某一随机变量实测系列,则其经验频率曲线绘制步骤如下:(1)根据实测水文资料,按从大到小的顺序排列;(2)用经验频率公式计算系列中各项的频率,称为经验频率;(3)以水文变量X为纵坐标,以经验频率P为横坐标,点绘经验频率点据;(4)根据点群趋势绘出一条平滑的曲线,称为经验频率曲线。有了经验频率曲线,即可在曲线上求得指定频率P的水文变量值。12:,,,nXxxx对经验频率的计算,目前我国水文计算上广泛采用的是数学期望公式:式中p-等于和大于Xm的经验频率;m–Xm的序号,即等于和大于Xm的项数;n-系列的总项数。2、经验频率曲线存在的问题经验频率曲线计算工作量小,绘制简单,查用方便,但受实测资料所限,往往难以满足设计上的需要。为此,提出用理论频率曲线来配合经验点据,这就是水文频率计算适线(配线)法。100%1mpn3频率与重现期的关系频率曲线绘制后,就可在频率曲线上求出指定频率p的设计值xp。由于“频率”较为抽象,水文上常用“重现期”来代替“频率”。所谓重现期是指某随机变量的取值在长时期内平均多少年出现一次,又称多少年一遇。频率P与重现期T的关系有两种表示方法:(1)当为了防洪研究暴雨洪水问题时,一般设计频率P<50%,则:(2)当考虑水库兴利调节研究枯水问题时,设计频率P>50%,则1TP11TP第四节水文频率曲线线型1正态分布正态分布具有如下形式的概率密度函数:(-∞﹤x﹤+∞)频率格纸正态频率曲线在普通格纸上是一条规则的S形曲线,它在P=50%前后的曲线方向虽然相反,但形状完全一样。水文计算中常用的一种“频率格纸”,其横坐标的分划就是按把标准正态频率曲线拉成一条直线的原理计算出来的。2皮尔逊Ⅲ(P-Ⅲ)型曲线皮尔逊Ⅲ型曲线是一条一端有限一端无限的不对称单峰、正偏曲线,数学上常称伽玛分布。P-Ⅲ概率密度函数为:式中:Γ(α)―α的伽玛函数;α、β、a0―分别为皮尔逊Ⅲ型分布的形状尺度和位置未知参数,α﹥0,β﹥0。三个参数与总体三个参数x、Cv、CS具有如下关系:皮尔逊Ⅲ型频率曲线及其绘制水文计算中,一般需要求出指定频率P所相应的随机变量取值Xp,也就是通过对密度曲线进行积分,即:求出等于及大于Xp的累积频率P值。直接由上式计算P值非常麻烦,实际做法是通过变量转换,根据拟定的Cs值进行积分,并将成果制成专用表格,从而使计算工作大大简化。0()10()()()pxapxxPPXxxaed令则有Ф是标准化变量,称为离均系数,其均值为0,标准差为1。经标准化变换后:()(,)pPsPfCdvxxxC(1)vxxCvdxxCd式中被积函数只含有一个待定参数CS,其它两个参数x、Cv都包含在经验频率曲线Ф中。因此,只需要假定一个CS值,便可通过积分求出p与Ф之间的关系。对于若干个给定的CS值,p与Ф的对应数值表,已先后由美国福斯特和前苏联雷布京制作出来——“皮尔逊Ⅲ型频率曲线的离均系数Ф值表”。给定参数后,由Ф就可以求出相应频率p的x值:(1)ppxxCv皮尔逊Ⅲ型频率曲线绘制步骤在统计参数已知情况下,可按以下步骤绘制皮尔逊Ⅲ型频率曲线:(1)从值表中选取若干个频率;(2)由Cs值,查值表得出不同的值;(3)利用值,通过式求出于各种相应的值。以为纵坐标,为横坐标,从而可绘出理论频率曲线。,,vsxCCpP,vxC(1)ppxxCvpxPPxP皮尔逊Ⅲ型频率曲线计算表(实例)频率12.751.83121951.801.541025101.331.40933200.801.2482650-0.100.9764675-0.720.7852090-1.200.6442695-1.450.5637399-1.880.44293ppKpx(%)P666.4x0.30vC2svCC以频率为横坐标,为纵坐标,点绘理论频率曲线。下图为其示意图。px(%)P(%)Px666.4,0.30,2vsvxCCC第五节频率曲线参数估计方法在概率分布函数中都含有一些表示分布特征的参数,例如皮尔逊III型分布曲线中就包含有平均数、离差系数(Cv)和偏差系数(Cs)三个参数。水文频率曲线线型选定之后,为了具体确定出概率分布函数,就得估计出这些参数。目前,由样本估计总体参数的方法主要有矩法、三点法、权函数法、适线法等。一、随机变量的统计参数1、位置特征参数平均数、中位数、众数平均数:反映随机变量的分布中心,代表随机变量的整体水平。2、离散特征参数均方差、离差系数、偏差系数均方差:离差平方的平均数的开方。离差系数:均方差与平均数的比值。偏差系数:衡量随机变量的取值对分布中心的对称程度。(离差立方的平均数与均方差立方的比值)二、随机变量统计参数的估计由样本统计参数来估计总体统计参数。(一)矩法矩法是用样本矩估计总体矩,并通过矩和参数之间的关系,来估计频率曲线参数的一种方法。一阶原点矩的计算式就是均值,均方差σ的计算式为二阶中心矩开方,偏态系数Cs计算式中的分子则为三阶中心矩。由此,得到计算参数的公式。它们与相应的总体同名参数不一定相等。设随机变量样本系列为:12:,,nXxxx样本统计参数计算式(无偏估计量)均值:均方差:离差系数:偏差系数11niixxn21()1niixxn21(1)1niivKCnx313(1)(3)niisvKCnC(Cs抽样误差太大)水文计算上习惯称上述公式为无偏估值公式,并用它们估算总体参数,作为配线法的参考数值(配线法将在下面介绍)。(二)权函数法当样本容量较小时,用矩法估计参数,产生一定的计算误差,其中尤以Cs的计算误差较大。为提高Cs计算精度,近年来提出了不少方法,其中以权函数法比较有效。(马秀峰于1984年提出)(三)适线法第六节内容第六节水文频率计算适线法适线法(或称配线法)是以经验频率点据为基础,在一定的适线准则下,求解与经验点据拟合最优的频率曲线参数,是我国估计水文频率曲线统计参数的主要方法。适线法主要有两大类,即目估适线法和优化适线法。一、目估适线法1、目估适线法的步骤目估适线法是以经验频率点据为基础,给它们选配一条配合较好的理论频率曲线,并以此来估计随机变量总体的统计规律。具体步骤如下:(1)将实测资料由大到小排列,计算各项的经验频率,在频率格纸上点绘经验点据(纵坐标为变量的取值,横坐标为对应的经验频率)(2)选定水文频率分布线型(一般选用皮尔逊Ⅲ型)。(3)先采用矩法或其它方法估计出频率曲线参数的初估值、Cv,而Cs凭经验初选为Cv的倍数。(4)根据拟定的、Cv和Cs,查附表1或附表2,计算值。以X为纵坐标,P为横坐标,即可得到频率曲线。将此线画在绘有经验点据的图上,看与经验点据配合的情况。若不理想,可通过调整x、cv和cs点绘频率曲线。(5)最后根据频率曲线与经验点据的配合情况,从中选出一条与经验点据配合较好的曲线作为采用曲线,相应于该曲线的参数便看作是总体参数的估值。(6)求指定频率的水文变量设计值。2.统计参数对频率曲线的影响为了避免配线时调整参数的盲目性,必须了解皮尔逊Ⅲ型分布的统计参数对频率曲线的影响。固定皮尔逊Ⅲ型频率曲线的两个参数,改变第三个统计参数,可以使频率曲线发生很大的变化。(1)均值对频率曲线的影响xPxPKvCKPsC统计参数对皮尔逊型曲线的影响III(2)变差系数Cv对频率曲线的影响为了消除均值的影响,我们以模比系数K为变量绘制频率曲线。Cs=1.0。Cv=0时,随机变量的取值都等于均值,此时频率曲线即为k=1的一条水平线,随着Cv的增大,频率曲线的偏离程度也随之增大,曲线显得越来越陡。(3)偏态系数Cs对频率曲线的影响正偏情况下,Cs愈大,均值对应的频率愈小,频率曲线的中部愈向左偏,且上段愈陡,下段愈平缓。二、优化适线法优化适线法是在一定的适线准则(即目标函数)下,求解与经验点据拟合最优的频率曲线的统计参数的方法。优化适线法按不同的适线准则分为三种,即离差平方和最小准则(OLS)离差绝对值和最小准则(ABS)其中以离差平方和最小准则(OLS)最为常用。解释离差含义离差平方和准则的适线法又称最小二乘估计法。频率曲线统计参数的最小二乘估计是使经验点据和同频率的频率曲线纵坐标之差的平方和达到极小。对于皮尔逊III型曲线,使下列目标函数取极小值,即式中Q——参数()——频率曲线的纵坐标。21()(,)niiiSQxfPQ()min()SQSQ,,vsxCC(,)ifPQ说明:1.以离差平方和准则的优化适线法估计所得的参数,和目估适线法的结果比较接近。因此在以优化适线估计参数时,最好用离差平方和准则。2.对适线法而言,影响参数估计精度的关键是样本各项的经验频率估计,特别是序号为1,2,3等项的经验频率估计尤为重要。以期望公式估计的经验频率是基于样本处于平均情况的考虑,其抽样误差较大。但随着样本容量的增大,误差较小。3.减小抽样误差最有效的途径是增大样本容量。第五节相关分析一、相关关系的概念1.相关的意义与应用按数理统计法建立两个或多个随机变量之间的联系,称之为相关关系。把对这种关系的分析和建立称为相关分析。相关分析可以用来延长和插补短系列。2.相关的种类根据变量之间相互关系的密切程度,变量之间的关系有三种情况:即完全相关、零相关、统计相关。(简相关、复相关)3.相关分析的内容相关分析(或回归分析)的内容一般包括三个方面:(1)判定变量间是否存在相关关系,若存在,计算其相关系数,以判断相关的密切程度;(2)确定变量间的数量关系—回归方程或相关线;(3)根据自变量的值,预报或延长、插补倚变量的值。二、简直线相关1.相关图解法设xi和yi代表两系列的观测值共有n对:把对应值点绘于方格纸上,
本文标题:水文频率相关内容
链接地址:https://www.777doc.com/doc-4809994 .html