您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 第四章-水文统计基本知识..
第四章水文统计基本知识内容:4.1概率的基本概念4.2随机变量及其分布参数4.3水文统计中常用的几种概率分布4.4分布参数的估算4.5现行水文频率计算方法4.6相关分析重点:P-Ⅲ型分布分布参数的估算;现行水文频率计算方法难点:P-Ⅲ型分布及其应用适线法水文现象的统计规律水文现象是一种自然现象,它具有必然性,也具有偶然性。其中偶然现象(随机现象)所遵循的规律称为统计规律水文统计及其任务研究随机现象统计规律的学科称为概率论,而由随机现象的一部分试验资料去研究总体现象的数字特征和规律的学科称为数理统计学。概率论与数理统计学应用到水文分析与计算上则称为水文统计水文统计的任务就是研究和分析水文随机现象的统计变化特性,并对水文现象未来可能的长期变化作出定量预估,以满足工程规划、设计、施工以及运营期间的需要§4.1概率的基本概念一事件事件是指随机试验的结果。分为三类:必然事件:试验结果中必然会发生的事件不可能事件:试验之前就可以断定不会发生的事件随机事件:在试验结果中可能发生也可能不发生的事件,也称为偶然事件二概率随机事件A出现的可能性大小,称为事件A发生的概率,计算式为:P(A)=m/n式中,P(A)为事件A的概率;m为事件A出现的次数;n为所有试验次数此式为古典概率公式,只适用于古典概率事件,即试验的所有可能结果的可能性相同,且试验可能结果的总数是有限的三频率水文事件不属古典概率事件,其试验结果可能的总数未知,试验结果是否等可能也未知,因而不能预先推知某事件的概率。为此引入“频率”概念来计算随机水文事件的概率频率:设随机事件A在重复试验n次中出现f次,则f与n的比值称为事件A的频率,即W(A)=f/n这里的n不是所有可能的结果总数,仅是随机试验的次数频率和概率的区别和联系区别:概率是抽象数.是个理论值;频率是具体数,是通过若干次试验求得的经验值联系:当试验次数n愈大,即当n趋于无穷大时,理论上,n变成试验中所有可能的结果总数,则频率愈接近概率因此水文上将计算的频率作为概率的近似值四累积频率与重现期1累积频率水文分析计算中,常采用随机变量χ≥χi的频率,即等量或超量值累积出现的次数m与总观测次数n的比值P(χ≥χi)=m/n(1)年频率:每年取一个代表值组成随机样本系列,样本的容量n为年数,由此类样本所得的累积频率,称为年频率(以P67表4-3为例,频数分别代表年和次)如P=3/100表示等量或超量值平均100年出现3次(2)次频率:每年取多个代表值组成随机样本系列时,样本的容量S为次数,由此类样本所得的累积频率,称为次频率如P′=3/100表示等量或超量值平均在100次中出现3次2重现期(以P66图4-1为例)重现期指某一水文事件长时期内平均多少年出现一次,又称多少年一遇,用T表示。与频率P的关系:(1)研究暴雨洪水问题时,一般设计频率P小于50%,则T=1/P【例1】:当设计洪水的频率采用P=1%时,代入上式得T=100年,称为百年一遇洪水【例2】:某室外雨水管设计暴雨的频率为P=50%,则T=2年,称为两年一遇的暴雨,即大于或等于该设计的暴雨平均两年发生一次(2)研究枯水问题时,为了保证取水、灌溉及发电等用水需要,或为了向河流中排放污水而研究枯水时,设计频率P常常大于50%,则T=1/(1-P)【例3】:当某取水工程的枯水期流量设计频率P=90%时,代入上式得T=10年,称十年一遇枯水,即平均10年有9年的枯水期流量等于或大于此设计枯水流量,说明该取水工程有90%的可靠程度能取到足够的水量,因此这一设计频率也常称设计保证率对某防汛抗洪工程来说,其能承受的最大暴雨量(径流量)都有一个临界值,当大于等于这个值时,工程即遭到破坏,因此为保证工程较长时期内安全运转,在进行工程设计时要让这个临界值尽可能高一些,即大于等于这个值的暴雨出现的几率尽可能低些;对河道上的取水工程来说,为保证工程在较长时期内都能取到水,设计的临界水位(径流量)值要尽量低些,这样才能保证在径流量比较小的时候仍能够取到水,即大于等于临界水位的径流出现的几率要尽量高00.20.40.60.81.0)xX(P)x(F2001000年降雨量(mm)某站年雨量概率分布曲线P(Xx)某工程在暴雨量达1000mm时将遭到破坏,如图对应的累积频率越低工程相对越安全对取水工程来说,降雨量低于200mm时河道内将取不到水,即其对应的累积频率越高取水越能得到保证()PXx()PXx(3)年重现期与次重现期水文计算中为延长实测样本系列的容量,常在一年中取多个样本系列,所得重现期为次重现期排水工程的设计标准常遇T1年,因而需一年多次取样设平均每年所取样本为α个,n年所得样本容量S=nα,由年频率P(χ≥χi)=m/n次频率Pˊ(χ≥χi)=m/S=P/α又年重现期T=1/P;次重现期Tˊ=1/Pˊ=α/P=αT;则T=nTˊ/S3保证率:n年内工程均能保证安全的几率,以符号Pk表示。累积频率只能表示工程运转的安全率或破坏率,而不是保证率若P(χ≥χi)为破坏率,则安全率为1-P【例4】:当P为破坏率且=1%时,若n=30年,则保证率=(1-1%)30=74%;若n=5年时,保证率=(1-1%)5=95.1%,可见保证率与要求保证安全的期限有关,期限越长,保证率越小【例5】(见P66)§4.2随机变量及其分布参数一概念1随机变量:表示随机试验结果的变量,事先不能确定,是随机的,所以称随机变量水文现象中的随机变量,一般指某个水文特征值(如年径流量、年降雨量、水位、洪峰流量等),分离散型和连续型两类连续型随机变量:在取值区间内可以取得任意值如河流某断面的流量、水位、含沙量等等离散型随机变量:在取值区间内只能取得某些间断的孤立值如暴雨、洪水发生的次数等2总体:随机变量所有取值的全体3样本:从总体中不带主观成分任意抽取的一部分4样本容量:样本所包含的项数二随机变量的分布随机变量的可能性与其所对应的概率之间的关系,称为随机变量的分布1离散型随机变量的概率分布通常表示为:P(X=xi)=pi(i=1,2,…,n)其概率分布满足:0≤pi≤1,且pi=12连续型随机变量的概率分布:用X大于等于某值x的概率表示,即F(X)=P(X≥x)其几何图形称为随机变量的概率分布曲线,在水文学上通常称为累积频率曲线,简称频率曲线由图,X=1000时相应的P(Xx)=0.1,说明大于等于1000mm降雨的可能性为10%;00.20.40.60.81.0)xX(P)x(F2001000年降雨量(mm)某站年雨量概率分布曲线P(Xx)同理,大于等于200mm的降雨概率为80%对于连续型随机变量:变量的取值充满整个数值区间,无法一一列出其每一个可能值,只能以区间的概率分析其分布规律连续系列按由大到小顺序排列,分成N组,组距值△x=xi+1-xi,任一组内概率为△p,则区间平均概率为f(x)=△p/△x,此值称为△x区间对应的概率密度区间足够小时,xx()fx这里的f(x)就是概率密度函数3密度函数:随机变量落入区间(x,△x)的概率与区间长度△x的比值,记为f(x),表示分布的密度性质xx()fx()FxpxP()()dFxfxdx()fx()Fx()()()xFxPXxfxdx概率密度函数概率分布函数F(x)分布函数,反映随机变量X大于等于某个值x的概率f(x)密度函数,反映随机变量X落入dx区间的平均概率;可见,随机变量的两个函数的物理意义:三随机变量的分布参数随机变量的概率分布能完整地描述其统计变化规律,实际上,有时知道它的统计参数(数字特征)就足够了统计参数分为总体统计参数和样本统计参数,因水文随机变量的总体始终是未知的,所以只能用样本统计参数来估计总体的统计参数常用的统计参数包括位置特征参数(平均数、众数、中位数)、离散特征参数(均方差、离差系数)和对称特征参数(偏差系数)(一)位置特征参数:描述随机变量在数轴上的位置1均值:随机变量的平均数对于离散型随机变量,当变量值的概率相同时,有:当变量值的概率不同时,有:连续型随机变量的均值为:11niixXn-()xxfxdx1niiixxp均值表示系列的平均情况,即总体水平的高低2众数:概率密度分布的峰点值3中位数:位置居中的数字(二)离散特征参数:反映随机变量分布的离散程度1均方差(标准差):由离均差平方的平均数开方得到当离散型随机变量值的概率相同时,有:当变量值的概率不同时,有:连续型随机变量的均方差为:211()niixxn21()niiixxp122()()xxfxdx均方差表示分布函数的绝对离散程度;均方差越大,分布函数越分散,其值变化幅度也越大,反之亦然f(x)x标准差对频率曲线的影响1212【例】比较两系列的离散程度:甲---5,10,15;乙---1,10,19222510(1010)(1510)4.083甲(-)222110(1010)(1910)7.353乙(-)表明:乙系列的离散程度大于甲系列均值相同时,均方差可以反映其离散程度;但均值不同时,却无法比较。因此引入离差系数(变差系数)10xx乙甲2离差系数(变差系数、离势系数):均方差和平均数的比值,表征随机变量分布的相对离散度当离散型随机变量值的概率相同时,有:其中,称为模比系数或变率Cvx211(1)niiCvKn/iiKxxCV值愈大,分布愈分散;CV值愈小,分布愈集中(书P71错)CV1CV2CV2CV1f(x)x变差系数对密度曲线形状的影响【例】比较两系列的离散程度:甲---5,10,15;乙---995,1000,1005104.08x甲甲10004.08x乙乙表明:甲系列的离散程度大于乙系列4.080.408104.080.00481000vvcxcx甲甲甲乙乙乙【例】甲地多年平均降雨量1200mm,标准差σ1=360mm;乙地多年平均降雨量800mm,标准差σ2=320mm。比较这两个分布的离散程度尽管σ1>σ2,但是乙地均值大于甲地,所以只能比较两个分布的相对离散程度,即比较其离势系数CV计算得两个地区年雨量的离差系数,CV1=0.30,CV2=0.40,因此甲地年降雨量离散程度小于乙地(三)反映对称特征的参数偏差系数(偏态系数):表征随机变量分布是否对中心(平均数)对称,即分布的相对偏倚度当离散型随机变量值的概率相同时,因,,则有:3333()(1)iiSVxxkCnnCVxCiixkx33()SMXxCCs=0时,分布函数对称,随机变量中大于均值的与小于均值的出现机会相等;Cs0时,分布函数正偏,大于均值的随机变量占优势;Cs0时,分布函数负偏vscc)4~2(一般有经验关系:f(x)x偏差系数对密度函数的影响Cs=0Cs0Cs0§4.3水文统计中常用的几个概率分布一正态分布1若随机变量X的概率密度为则称X服从正态分布。测量、射击、机械制造过程中的误差都遵循正态分布规律(8-9)xexfxx222)(21)(正态分布密度函数中只包含均值和均方差两个参数,因此只有求出这两个参数,分布便完全确定了x2正态分布密度曲线的特点:单峰;无偏,即Cs=0,随机变量的分布对称于均值;曲线两端趋于±∞,以x轴为渐进线;在处出现拐点,曲线与x轴围成的面积为68.3%;之间的曲线与x轴围成的面积为99.7%x3x二皮尔逊III型分布1英国生物学家皮尔逊研究各种非正态分布函数曲线时,提出了13种分布曲线类型,其中第III型在水文学中应用最广,其概率分布函数为0()10()()()xafxxae()式中,为的伽玛函数;、、a0分别为形状参数、尺度参数和位置参数2P-III型曲线的形状及其特点:一端有限,另一
本文标题:第四章-水文统计基本知识..
链接地址:https://www.777doc.com/doc-3989398 .html