您好,欢迎访问三七文档
随机现象所遵循的规律叫做统计规律。研究随机现象统计规律的学科称为概率论,而由随机现象的一部分试验资料去研究全体现象的数量特征和规律的学科称为数理统计学。由于水文现象具有一定的随机性,用数理统计方法来分析研究这些现象称为水文统计学。第七章水文统计第二节概率的基本概念一、事件事件是指随机试验的结果。必然事件:如果可以断定某一事件在试验中必然发生,称此事件必然事件。不可能事件:可以断定试验中不会发生的事件称为不可能事件。随机事件:某种事件在试验结果中可以发生也可以不发生,这样的事件就称为随机事件。第二节概率的基本概念二、概率随机事件在试验结果中可能出现也可能不出现,但其出现(或不出现)可能性的大小则有所不同。为了比较这种可能性的大小,必须赋于一种数量标准,这个数量标准就是事件的概率。第二节概率的基本概念三、频率水文事件不属古典概率事件,只能通过试验来估算概率。设事件在n次试验中出现了m次,则称为事件A的频率。第二节概率的基本概念掷币试验出现正面的频率表试验者掷币次数出现正面次数频率蒲丰404020400.5080皮尔逊1200060180.5016皮尔逊24000120140.5006在试验次数足够大的情况下,事件的频率和概率是十分接近的。第二节概率的基本概念P(A+B)=P(A)+P(B)-P(AB)式中,P(A+B)-事件A与B之和的概率;P(A)-事件A的概率;P(B)-事件B的概率。P(AB)-事件A和B共同发生的概率。四.概率加法定理和乘法定理1.概率加法定理2、概率乘法定理P(AB)=P(A)P(B/A)=P(B)P(A/B)式中,P(A/B)-事件A在事件B已发生情况下的概率,简称为A的条件概率。P(B/A)-事件B在事件A已发生情况下的概率,简称为B的条件概率。对于两个独立事件:P(AB)=P(A)P(B)第二节概率的基本概念第三节随机变量及其概率分布一、随机变量随机变量是表示随机试验结果的数量表示,随机变量可分为两大类型:离散型随机变量,连续型随机变量。AB互斥P(AB)=0P(A+B)=P(A)+P(B)AB相容P(AB)=P(A)P(B/A)=P(B)P(A/B)ABP(A)+P(B)=1P(A)=1-P(B)P(B)=1-P(A)对立AB独立P(AB)=P(A)P(B)P(A/B)=P(A)P(B/A)=P(B)例:某地区位于河流甲与乙的汇合点。当任一河流泛滥时,该地区即被淹没,设在某时期内河流甲泛的概率为0.1,河流乙泛滥的概率为0.2;又知当河流甲泛滥时,河流乙泛滥的概率为0.3。求在该时期内这个地区被淹没的概率。又当河流乙泛滥时河流甲泛滥的概率?解:记河流的甲泛滥为事件A,河流乙泛滥为事件B。这个地区被淹没的概率为:P(A+B)=P(A)+P(B)-P(AB)=P(A)+P(B)-P(B/A)P(A)=0.1+0.2-0.3×0.1=0.27由于P(A/B)P(B)=P(B/A)P(A)故当河流乙泛滥时,河流甲泛滥的概率为=0.3×0.1/0.2=0.15P(A/B)=P(B/A)P(A)/P(B)二、随机变量的概率分布随机变量的取值与其概率有一定的对应关系,称为随机变量的概率分布,数理统计学上记为F(x)=P(X≤x),称为随机变量的概率分布函数。水文统计中通常研究随机变量的取值大于某一个值的概率,F(x)=P(X>x)在水文统计学上也称此为随机变量的概率分布函数(或概率分布曲线)。某雨量站的年雨量分布曲线0.60.40.211001000900800700x0.81.0P(X>x)若x=800mm,由分布曲线知P(X>800)=0.6,表明年雨量超过800mm的概率等于60%。年雨量在800mm~900mm间的概率是多少呢?这就要讨论的随机变量落在某区间(x,x+Δx)内的概率,可用下式表示:P(x+Δx>X≥x)=F(x)-F(x+Δx)从图3—1得:F(800)=0.60;F(900)=0.21故:P(900>x≥800)=0.60-0.21=0.39年雨量落在800mm至900mm之间的可能性是39%。函数f(x)=-F’(x)为概率密度函数,简称为密度函数或密度曲线。f(x)xf(x)dxdx概率密度函数f(x)x密度函数F(xp)=P(Xxp)xpf(x)xxp概率分布函数与密度函数关系F(xp)=P(Xxp)F(x)F(xp)x三、随机变量的分布参数概率分布曲线完整地刻划了随机变量的统计规律。但在一些实际问题中,有时只要知道概率分布某些特征数值。这种以简便的形式显示出随机变量分布规律的某些特征数字称为随机变量的分布参数。(一)位置特征参数平均数反映密度分布的重心,计算公式亦可写成数学期望连续型随机变量的数学期望(二)离散特征参数离散特征参数是刻划随机变量分布离散程度的指标。1.标准差(均方差)分布愈分散,标准差愈大;分布愈集中,标准差愈小。标准差的平方σ2称为方差。标准差对频率曲线的影响σ1>σ2σ1σ22.离势系数(离差系数,变差系数)例如:甲地区的年雨量分布,EX1=1200mm,标准差σ1=360mm;乙地区的年雨量分布,EX2=800mm,标准差σ2=320mm。尽管σ1>σ2,但是EX2>EX1,应从相对观点来比较这两个分布的离散程度。采用一个无因次的数字来衡量分布的相对离散程度,称为离势系数算得两个地区年雨量的离势系数,CV1=0.30,CV2=0.40。说明甲地区的年雨量离散程度较乙地区的为小。3.偏态系数(偏差系数)反映分布是否对称的特征CS参数,记为用来表征分布不对称的情况。当密度曲线对EX对称,CS=0;若不对称,当正离差的立方占优时,CS>0,称为正偏;当负离差的立方占优势时,CS<0,称为负偏。Cs>0Cs=0Cs<0Cs对密度曲线的影响四、几种常用的概率分布曲线(一)正态分布概率密度函数形式:式中,—平均数σ—标准差正态分布在误差估算时将会应用。x正态分布曲线f(x)68.3%xxx(二)皮尔逊Ⅲ型分布皮尔逊III型曲线为一端有限一端无限的不对称单峰曲线,概率密度函数式中,α,β,a0-参数,且有:如果已知设计值xP,推求xp取决于p、α、β和αO四个数,并且当α、β、αO三个参数为已知时,则xp只取决于p了。α、β、αO与分布曲线的EX,CV和CS有关,因此只要确定EX、CV和CS,xp仅与p有关,可以由p唯一地来计算xp。P-3型分布的积分无解析解,实用中制表查用。取标准化变量Ф(离均系数)将之代入式(3—22)得被积函数只含一个参数CS。只要给定CS就可以算出ФP和P的对应值,最终制定出ФP~Cs~p的对应数值表(表3-2)。由给定的CS及p从表3—2查出ФP,通过xP=(ФPCV+1)EX即可决定出xP。因此,已知EX,CV,CS就可求出与各种p值相应的xP值,也就可以绘制分布曲线或频率曲线。例如,已知某地年平均雨量EX=1000mm、CV=0.5、CS=1.0,求p=1%的设计年雨量。由CS=1.0,p=1%查得ФP=3.02,X1%=(ФPCv+1)EX=(3.02×0.5+1)1000=2510(mm)第四节统计参数估算在概率分布函数中包含有,CV,CS三个参数。为了唯一确定概率分布函数,就得估算这些参数。一、样本估计总体水文变量的总体是指自古迄今以至未来长远岁月所有的水文系列,是不知道的,需要靠观测到的样本去估计总体参数。现有的水文观测的系列可以当作总体的一个随机样本来处理。x某地降雨量频率计算表由表3-4资料可绘出如图3-9所示的折线图,该图表示年降水量P(X≥x)的频率W(X≥x)和x的关系某地年降雨量经验分布曲线020406080100W(%)p12001000800随着样本容量的增加(即随着观测次数的增加),频率w就非常接近于概率p,经验分布曲线就非常接近于总体分布曲线。在某种程度上由样本的经验分布来推测总体分布,总体的参数就可以通过抽出的样本(观测的系列)来加以估算了。(1)样本的均值X,它与总体均值相对应,即(2)样本标准差S‘与总体标准差σ相对应,即(3)样本离势系数CV‘与总体离势系数相对应,即(4)样本偏态系数CS’,与总体参数偏态系数相对应,即只要掌握了样本,借助上列公式估计出参数;就可推出概率分布曲线,这种方法叫做矩法。原矩法公式得出的S‘,CV‘,和CS’并不是无偏估计量,目前水文上采用的是经修正后的矩法公式:第五节配线法估计水文分布参数某地年降雨量经验分布曲线020406080100W(%)x12001000800一、经验频率曲线W(X≥xi)=i/n二、经验频率如果用W(X≥xi)=i/n的经验分布曲线估计总体分布曲线,存在不合理现象。当m=n时,最末项的频率为100%,样本末项值为总体中的最小值,不符合事实,因为比样本最小值更小的数值今后仍可能出现。水文上用期望值公式估计频率。频率这个词比较抽象,为便于理解,有时采用重现期这个词。所谓重现期是指在许多试验中,某一事件重复出现的时间间隔的平均数。在工程水文中,重现期用字母T表示,一般以年为单位。当研究暴雨洪水问题时例如,当暴雨或洪水的频率采用p=1%时,T=100年,称此暴雨为百年一遇的暴雨或洪水。当研究枯水问题时例如,对于p=80%枯水流量,T=5年,称此为五年一遇的枯水流量。或称为保证率为80%的设计流量。T=1/PT=1/1-P所谓百年一遇的暴雨或洪水,是指大于或等于这样的暴雨或洪水在长时期内平均100年发生一次,而不能认为每隔100年必然遇上一次。三、配线法根据经验频率分布点据,找出与之配合最佳的频率曲线,其相应的分布参数,作为总体分布参数的估计值。计算步骤:(1)点绘经验点据纵坐标为变量值,横坐标为经验频率,采用期望值公式估计。(2)初定一组参数用矩法公式的估算EX和CV,并假定CS与CV的比值K估算CS。(3)根据初定的EX、CV和CS,计算频率曲线,并绘在点有经验点据的图上。若与经验点据配合不理想,则修改参数再次配线,主要调整CV以及CS。(4)选择一条与经验点据配合最佳曲线作为采用曲线。该曲线的参数看作总体参数的估计值。为了避免修改参数的盲目性,需要了解参数对频率曲线的影响。由频率曲线图可明显看出,CV值愈大,曲线愈陡;当CS增大时,曲线上段变陡而下段趋于平缓。配线法采用了概率格纸,以正态分布曲线成直线来划分概率坐标的。当CS=0,频率曲线在概率纸上为一直线。其特点是横坐标的两端分格较稀而中间较密,纵坐标为均匀分格或对数分格。这样,曲线两端的坡度变缓,使用起来比较方便。3-7某站年降水量频率计算表某站共有实测降水量资料24年,求频率为10%和90%的年降水量。(1)将原始资按大小次序排列,列入表(4)栏。(2)按期望值公式计算经验频率,列入表(5)栏。并将X与P对应点绘于概率格纸上。(3)用矩法计算系列的多年平均降水量和离差系数。(4)选定CV=0.30,并假定CS=2CV=0.60查表3-2得φP,求得xP=(φPCV+1),如表(3)栏。根据表中(1)、(3)两栏的对应数值点绘曲线,发现曲线头部和尾部都偏于经验频率点据之下。(5)改变参数,重新配线。因为曲线头尾部偏低,故需增大CS,CV=0.30不变,CS=3CV=0.90,查算出各xP值,列入表(4)、(5)栏,点绘后曲线的头部和尾部反而有些偏离,配线仍不理想。(6)再次改变参数,第三次配线。把CS稍微调小一些。选定CV=0.30,CS=2.5CV=0.75,查表计算出各xP值,列入表(6)、(7)栏中。绘制频率曲线,该线与经验点据配合较好,取为最后采用的频率曲线。(7)求得p=10%的年降水量为933mm,p=90%的年降水量为433mm。表-8频率曲线选配计算表配线法得到的成果仍具有抽样误差,而这种误差目前还难以精确估算,因此对于工程上最终采用的频率曲线及相应的统计参数,不仅要从水文统计方面分析,而且还要密切结合水文现象的物理成因及地区规律进行综合分析.一、相关关系的概念1.相关的意义与应用按数理统计法建立上述两个或多个随机变量之间的联系,称之为相关关系。把对这种
本文标题:5水文统计
链接地址:https://www.777doc.com/doc-2929775 .html