您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 第4章 水文统计基本知识及方法
1/60《工程水文学》2/60第4章水文统计的基本知识及方法4.1概述4.2概率的基本概念4.3随机变量及其概率分布4.4统计参数估算4.5现行水文频率计算方法——适线法4.6相关分析3/60水文现象水文现象受多种因素影响,具有随机性,故为随机现象。譬如:•同一距离用同一皮尺测多次,所得的结果彼此有差异;•给定相同的降雨强度和降雨时间,在同一块场地上进行多次人工降雨实验,每次所得结果彼此不同;•某水文站年平均流量每年都不相同。上述例子说明,在基本条件保持不变的情况下,多次试验会获得不一致的结果。其原因是除主要条件外,还有许多次要因素作用。随机性规律需要用大量资料加以统计,以得到统计规律及相应的数字特征,常采用概率论和数理统计进行研究。4.1概述4/60水文统计将概率论和数理统计理论引入水文学,研究水文现象的统计变化规律和数字特征的学科被称为水文统计。基本任务——利用所获得的水文、气象资料,研究和分析随机水文现象(如河川径流)的统计变化规律,并以此为基础,对其未来的长期变化作出概率意义下的定量预估,为水利工程的规划、设计、施工和运行管理提供水文依据。譬如:•某流域修建一个水库,其规模取决于水库运行期间(未来100年)的径流和洪水的大小。但是,未来100年的径流和洪水有多大?必须做出估计。•南水北调工程西线方案中,调多少水量为最优?•某水电站装机容量和多年平均发电量是多少?等等5/604.2概率的基本概念事件:在一定的条件组合下,随机试验的结果。其结果分为三类:必然事件、不可能事件和随机事件。概率:随机事件A出现的可能性大小,称为事件A发生的概率,计算式为P(A)=m/n式中,P(A)为事件A的概率;m为事件A出现的次数;n为所有试验次数。上式为古典随机试验,满足“随机等可能,独立同分布”。6/60事实上,由于水文事件不具备这种性质。为此,要计算随机水文事件的概率,引出了“频率”的概念。频率:设随机事件A在重复试验n次中出现m次,则称为事件A的频率。即W(A)=m/n实践证明,当n→∞时,P(A)稳定并趋于概率值。水文上,将计算的频率作为概率的近似值。7/604.3.1随机变量概念:指随机试验结果发生变化的变量,分为离散型的和连续型的随机变量两类。水文统计研究的对象是水文随机变量。连续型随机变量自记水位过程——Z(t)~t自记雨量过程——P(t)~tACB4.3随机变量及其概率分布8/60离散型随机变量年降雨量X={x1},X={x2},…,X={xn-1},X={xn}年径流量W={W1},X={W2},…,X={Wn-1},X={Wn}年最大洪峰Qm={Qm1},X={Qm2},…,X={Qmn-1},X={Qmn}年最高水位Zm={Zm1},X={Zm2},…,X={Zmn-1},X={Zmn}9/604.3.2随机变量的概率分布离散型的——用随机变量的分布序列表示,即P(X=xi)=pi(i=1,2,…,n)其概率分布满足两个条件:0≤pi≤1,且pi=1连续型的——用随机变量X大于某值xp的概率p表示,即F(X)=P(X≤x)=∫x-∞f(x)dx或F(X)=P(X≥xp)=p密度函数:分布函数导数的负值,记为f(x),即f(x)=-F’(x)=-dF(x)/dx10/60如p.80所示,则有F(X)=P(X≥x)=∫xp∞f(x)dx其概率分布曲线如p.80所示,也称作水文频率曲线或累积频率曲线。图4-411/604.3.3随机变量的分布(统计)参数一方面,虽然随机变量的概率分布能完整地描述其统计变化规律,实际上,有时仅需要知道它的统计参数(数字特征)就足够了。另一方面,随机变量的统计参数分为总体统计参数和样本统计参数,而水文随机变量的总体始终是未知的,所以只能用样本统计参数来估计总体的统计参数。水文水利计算中常用的统计参数包括位置特征参数(平均数、众数、中位数)和离散特征参数(均值、均方差、变差系数、偏态系数等)。12/60位置特征参数描述随机变量在数轴上位置的特征数。平均数——随机分布的中心离散型平均数:E(X)=∑ni=1xipi连续型平均数:E(X)=∫abxf(x)dx众数——概率密度分布的峰点值p.81Fig.5-5中位数——位置居中的数字p.81Fig.5-6X1x2x3X1x2x3XXf(x)f(x)13/60均值或数学期望值——或E(x)离散型随机变量连续型随机变量设水文随机变量观测序列x1,x2,x3,…,xn,则其均值为:均值为分布的中心,表示系列的平均情况,即总体水平的高低,能反映出河流规模的大小。xn1iiixp)X(Exdx)x(xf)X(Exn1iin21xn1nxxxx14/60将上式两端同除以均值,则有式中,称为模比系数或变率。表明模比系数的均值等于1。利用Ki,能使随机变量数字特征的表达式中减少一个参数。1n1iikn1nnk2k1kk15/60标准差(均方差)——离散型随机变量连续型随机变量设有水文随机变量观测序列x1,x2,x3,…,xn,则均方差为:n1ii2ip))X(Ex()X(Ddx)x(f))X(Ex()X(D2n)xx(n1i2i离散特征参数刻划随机变量分布离散程度的指标。16/60均方差表示分布函数的绝对离散程度;均方差越大,分布函数越分散,其值变化幅度也越大,反之亦然。图4-717/60离势系数(离差系数或变差系数)——Cv离差系数表示分布函数的相对离散程度;Cv越大,分布函数越分散,反之亦然。x)X(ECv图4-818/60例1:若系列1为5,10,15和系列2为1,10,19;计算均方差并比较它们的离散程度。答案1:σ1=4.08和σ2=7.35例2:若序列1为5,10,15和序列2为995,1000,1005;计算变差系数并比较它们的离散程度。答案2:EX1=10,σ1=4.08,Cv1=0.408和EX2=1000,σ2=4.08,Cv2=0.00408问1:甲地区年降雨量的均值为1200mm,均方差为1=360mm;乙地区年降雨量的均值为800mm,均方差为1=320mm。试比较甲、乙两地区降水量的分散程度。问2:一条河流上、下游断面的年平均流量的Cv值哪个大?为什么?19/60偏态系数(偏差系数)——Cs或偏差系数表示分布函数的对称程度。Cs=0时,分布函数对称,随机变量大于均值与小于均值出现机会相等;Cs0时,分布函数正偏,随机变量大于均值比小于均值出现的机会小;Cs0时,分布函数负偏,随机变量大于均值比小于均值出现的机会大;3n1i3in)xx(Cs3vnCn1i3)1iK(Cs图5-920/60理论频率曲线:由实测的水文要素样本系列,通过理论频率分布方程式估算出相应的频率值,再用频率曲线拟合频率点据所得到的频率曲线。常用的理论频率分布从定义可知:若p已知,推求设计值Xp的关键在于确定随机变量X的概率密度函数f(x)。由于水文随机变量复杂多变,其概率分布的确定十分困难。目前,国内外水文计算中经常使用的概率分布曲线(或水文频率曲线),大致可分为正态分布和P-III型分布两种类型。pdxxfxXPpxp)()(4.3.4几种常用的概率分布曲线21/601)正态分布型:包括正态分布、对数正态分布、三参数对数正态分布、……正态分布——概率密度函数,X~N(u,2),其均值u和均方差完全确定了分布函数的形状。一般地,水文测量误差、抽样误差服从正态分布。密度曲线的特点:单峰;关于均值u对称,即Cs=0;曲线两端无限,且与x轴渐进;处出现拐点,曲线与x轴围成的面积为68.3%;3之间的曲线与x轴围成的面积为99.7%。222)Ux(e21)x(f图5-1022/602)皮尔逊(Pearson)分布型:包括P-III型分布、对数P-III型分布、……P-III型分布——英国生物学家皮尔逊研究各种非正态分布函数曲线时,提出了13种分布曲线类型,其中第III型被引入水文学中,其概率分布函数为式中,为的伽玛函数(gamma);、、a0分别为形状参数、尺度参数和位置参数。)ax(100e)ax()()x(f)(23/60P-III型曲线的形状及其特点:一端有限,另一端无限的曲线;单峰而倒置的铃形;不对称的正偏分布;其位置取决于参数a0,形状取决于,与Cs有关。、和a0三个参数一经确定,P-III型密度函数随之确定。P.84图5-11图5-1124/60可以证明,三参数与均值、Cv、Cs有如下关系:经过以往大量的研究表明,我国多数河流的水文变量近似服从P-III分布(参见SL44-93《水利水电工程设计洪水计算规范》)。)CsCv21(xaCvCsx2Cs402x25/60离均系数——Φ采用P-III型理论分布,对水文现象的长期变化规律作出概率意义下的定量预估,即给出指定频率p所对应的随机变量之取值xp。例如:已知p=1%(百年一遇)的设计洪峰流量,需要对密度曲线进行积分,求出等于和大于xp的累积频率p值。计算公式如下:上式直接积分是非常繁杂的。为便于在工作中运用,因此水文上制作专用的离均系数Φ值表,以供查算。pxaxpdxeaxxxpp)0(10)()()(26/60若令,则或式中,Φ是均值为零、方差1的标准化变量,称为离均系数。于是,对于频率p,则有:上式包含Cs、p与Φp的关系。根据不同的Cs值,通过积分求出p与Φp之间的关系,可制成专用的Φ值表,供查值计算之用,见p.293附表2所示。如:给定P和Cs值,从Ф值表查得ФP,再将已知的均值和Cv代入中,即可求出相应的xP值。类似地,取不同的p值,得到一系列的xp,便可绘制出理论频率曲线。VxCxx)vC1(xxdvCxdxpdCfpsp,)()1(Cvxxpp27/60例如:某站年平均径流深系列符合p-Ⅲ型分布,已知该系列的R=1000mm,σ=162.5mm,Cs=2Cv,计算设计保证率p=1%的设计年径流量。解:由Cv=σ/R=162.5/650=0.25,则Cs=2Cv=0.5,p=1%,查表得Ф=2.68代入进行计算,有R1%=100×(1+2.68×0.25)=1670mm另外,当Cs/Cv等于一定倍数时,可令模比系数KP=1+ΦPCv,则变为XP=KP,式中KP与p和Cs有关,可查p.295附表3。假如有了p和xp的一组对应值,即可绘制理论频率分布曲线。)1(Cvxxpp)1(Cvxxppx28/604.4统计参数估算上述各种频率曲线都含有未知的分布参数。要推求某一指定频率P的随机变量取值XP,就必须确定这些未知分布参数。同时,前面给出了随机变量X的总体统计参数估计方法。事实上,水文变量的总体是未知的,只知道一个观测样本系列x1,x2,…,xn(n为样本容量),又如何用有限的样本(时间序列)估计总体的分布参数呢?参数估计方法有很多,如矩法、三点法、权函数法、极大似然法、概率权重矩法等。29/604.4.1样本估计总体样本——随机水文系列样本容量——样本的项数,即水文系列长度总体——随机变量全体这里仅介绍用矩法进行P-III型分布的参数估计方法。矩法:设水文随机变量X的一个样本x1,x2,…,xn,把计算的统计参数加以修正后,可得到无偏估计值公式如下:均值——均方差的无偏估计量S——1n)xx(Sˆn1i2iniixnx1130/604.4.2无偏估计量若θ∧为未知参数θ的估计量,且满足E(θ∧)=θ,则称θ∧为θ的无偏估计量。由于矩法估计的统计参数(均值、Cv、Cs)具有抽样误差,不能直接作为总体的统计参数,需进行无偏修正。可以证明样本平均数是总体平均数的无偏估计量:E(x)=E(X)均方差的无偏估计量:1n)xx(Sˆn1i2i31/60C
本文标题:第4章 水文统计基本知识及方法
链接地址:https://www.777doc.com/doc-3515778 .html