您好,欢迎访问三七文档
当前位置:首页 > 建筑/环境 > 工程监理 > 工程水文学-第三章-水文统计
水文统计基本原理及方法内容:3.1水文统计的意义及基本概念3.2频率和概率3.3经验频率曲线3.4随机变量的统计参数3.5理论频率曲线3.6抽样误差3.7水文频率分析方法3.8相关分析重点:水文频率及水文相关分析等水文统计基本知识;水文频率及水文相关分析等水文统计计算。难点:水文频率及水文相关分析等水文统计计算3.1水文统计的意义及基本概念3.1.1水文统计的意义•水文现象具有必然性、偶然性(随机性);•利用概率论和数理统计的理论和方法,研究和分析水文的随机现象(已经观测到的水文现象),找出水文现象的统计规律性;•以此为基础,对水文现象未来可能的长期变化做出概率意义下的定量预估,以满足工程规划、设计、施工以及运营期间的需要。3.1.2事件•随机试验:对随机现象的观测•事件:随机试验的结果。包括:1)必然事件:在一定能够的条件组合下,必然会发生的事情。2)不可能是件:在一定的条件组合下,一定不可能发生的事情。3)随机事件:在一定的条件组合下,可能发生也可能不发生的事件。3.1.3总体、样本、样本容量•随机变量:受随机因素影响,遵循统计规律的变量。通俗地讲,指在随机试验中测量到的数量。对于水文现象而言,指某种水文特征值,如某地区流域出口的年径流量和洪峰流量等。分:–连续性随机变量,如水位、流量;–离散性随机变量,如投掷硬币的正反面。•总体:随机变量所能取值的全体,分有限和无限总体。•样本:从总体中随机抽取出的一组观测值。•样本容量:样本中所含随机变量的项数。有的现象无法得到总体,例如水文现象。水文统计:各种水文现象的调查和实测过程当作随机试验,把已观测到的水文资料当作总体的一个随机样本(样本应足够大,才能比较好的反应总体的近似情况),利用数理统计的方法分析样本的统计规律,考虑抽样误差.作为总体的规律,应用到工程中去解决实际问题。3.1.4数理统计法对水文资料的要求•检查资料的可靠性;•检查资料的一致性;要求所使用的资料系列必须是同一类型或者在同一条件下产生的。如:暴雨洪水和雨雪洪水;瞬时水位和日平均水位。•检查资料的代表性;一般认为资料系列越长,平丰枯水段齐全,其代表性越高。•检查资料的随机性;•检查资料的独立性。3.2频率和概率3.2.1概率和频率(1)频率指在具体重复的实验中,某随机事件A出现的次数(频数)m与试验总次数n的比值,即:nmAW)((2)概率概率是指随即事件在客观上出现的可能性,即该事件的发生率,亦称为机率。根据事件出现的可能性是能够预先估计出来,可分为事先概率和事后概率:–事先概率:试验之前某随机事件出现的可能性可以预先估计出来,如投硬币出现正面和反面的机率;–事后概率:随机事件出现的可能性不能在试验之前预先估计出来,必须通过大量的重复试验之后才能估计出它出现的可能性。(3)频率与概率的关系(表3.1)•频率是经验值,概率是经验值;•可以通过实测样本的频率分析来推论事件总体概率特性;•样本容量越大,结果越准确;•对于水文现象,只能采用有限的多年实测水文资料组成样本系列,推求频率作为概率的近似值。)()(limAPAWn3.2.2概率运算定律(1)概率相加定理•互斥事件:在一次试验中,只有一个事件发生,其余事件均不能发生,这类事件称为互斥事件;•概率相加定理:互斥的各事件中,至少有一个发生的概率等于各个事件发生的概率总和。(2)概率相乘定理•独立事件:多个事件中,某一事件的出现并不影响其他事件的出现。•概率相乘定理:几个独立事件一并出现的概率等于各事件出现概率之积。(3)条件概率【例】某测站有40年的实测枯水位记录,各种水位出现的频率如表3.2所示,试确定水位H≥2.0m和H≥2.7m的概率?%70)0.4()5.3()7.2()7.2(=%5.92%70%5.22)7.2()0.2()0.2(HPWHP=某站水位频率计算表3.2序号水位H(m)频数f(a)频率W(%)累积频率P(%)123454.03.52.72.01.921016935254022.57.55307092.5100∑—40100—3.2.3随机变量的概率分布•随机变量与其概率一一对应,这种随机变量与概率一一对应的关系称为随机变量的概率分布规律简称概率分布•随机变量可分为两类:离散型随机变量和连续型随机变量•水文学关心随机变量取值大于等于某一定值的概率,即P(X≥xi),而该概率是x的函数【例3.6】离散型随机变量及其概率分布Xx1x2……xi……P(X=xi)p1p2……pi……dxxfxxPxFixi)()()(•F(X)=P(X≥x)代表X大于某一取值x的概率,其几何曲线称为概率分布曲线;如果用实测资料点绘的,水文上称为累积频率曲线。3.2.4累积频率和重现期(1)累积频率和随机变量的关系•水文特征值属于连续性随机变量•在分析水文系列的概率分布时,不用单个的随机变量(x=xi)的概率,而是用x≥xi(或者x≤xi)的概率P(x≥xi)(或者P(x≤xi))。•累计频率指等于或大于(等于或小于)某水文要素出现可能性的量度。•一般在实际应用中,用样本的频率分析曲线代替总体系列的概率分布。累积频率•样本足够大时,可以绘出累积频率曲线。•在一个确定的随机变量系列内,各个随机变量对应着一个累积频率值,随机变量的大小于累积频率成反比。•工程上一般把累积频率为频率。•根据选用样本的不同,频率分为年频率和次频率。(2)重现期•重现期:指等于及大于(或等于及小于)一定数量级的水文要素出现一次的平均间隔年数,以该量级频率的倒数。•当洪峰流量、洪水位、暴雨时,使用的设计频率P﹤50%,则T=1/P•当研究枯水流量、枯水位时,设计频率P常采用大于50%的值,则T=1/(1-P)(设计保证率)•水文现象无固定的周期性。注意:累积频率是指多年平均出现的机会;重现期则是平均若干年出现一次,而不是固定的周期。**年一遇3.2.5设计标准•水文现象具有明显的地区性和随机性,因而无法用水文特征值出现的量值为工程设计的标准。•主管部门根据工程的规模、工程在国民经济中的地位以及工程失事后果等因素,在各种工程设计规范中规定各种水文特征值的设计频率(或重现期)作为工程设计标准。各地工程业务部门,根据当地实测的水文资料,通过水文分析计算,求出对应于设计频率的水文特征值,作为工程设计的依据。3.3经验频率曲线3.3.1经验频率公式我国目前采用的数学期望公式为:当m=1时,P=1/(n+1)当T=100a,则T=1/P=n+1=100m—xm在n项观测资料中按递减顺序排列的序号,即在n次观测试验中大于或等于xm的次数%1001nmP3.3.2经验频率曲线的绘制和应用如果有n年的水文资料。1)将按时间顺序排列的实测资料按其数值大小进行递减顺序的排列。成x1,x2,…xn,对应序号m为1,2,…,n2)利用公式分别计算对应各个变量的经验频率。3)以实测资料为变量x作为纵坐标,以频率P为横坐标,在坐标纸上点绘经验频率点距(Pi,xi),通过点群中心,目估绘制一条光滑的曲线,该曲线为经验频率曲线。4)根据工程设计指定的频率,在该曲线上查出设计所需的相应设计频率的水文数据。将某水文变量f按递减顺序排列,排列中的序号不仅表示排列大小的次序,而且也表示变量自大到小(大于或等于)的累积次数。3.3.3经验频率曲线的外延概率格纸水平:正态曲线的概率分布制成分格制成的。非正态曲线:两端曲线坡度变缓,有利于曲线外延3.4随机变量的统计参数•统计参数是反映随机变量系列数值大小、变化幅度、对称程度等情况的数量特征值,因而能反映水文现象基本的统计规律,概括水文现象的基本特征和分布特点,也是进行理论频率曲线估计的基础。•统计参数有总体统计参数和样本统计参数。在水文学中主要应用样本统计参数,来估计总体统计参数。•水文频率分析主要使用的统计参数包括均值变差系数偏态系数矩3.4.1均值均值是反映随机变量系列平均情况的数。•加权平均法•算术平均法若实测系列内各随机变量很少重复出现,可以不考虑出现次数的影响,用算术平均法求均值。对于水文系列,一年内只选一个样或者几个样,水文特征值重复出现的机会很少,一般使用算术平均值,若系列内出现了相同的水文特征值,将相同值排在一起,各占一个序号。niixnx11推求的是累积频率均值特性平均数反映了随机变量的平均水平,代表整个随机变量系列的水平高低,故又称数学期望。利用均值可以推求设计频率的水文特征值。利用均值表示各种水文特征值的空间分布情况,绘制成各种等值线图。模比系数niixnx11xxKiiniinKnnKKKK121113.4.2均方差和变差系数要反映整个系列的变化幅度,或者系列在均值两侧分布的离散程度,需要使用均方差和变差系数。(1)均方差为了避免一阶离差代数和为0,一般取的平均值的开方作为离散程度的计量标准,称为均方差。即:对于样本系列有下列修正公式:2)(xxnxxsi2)(1)(2nxxsi均方差表征的意义:表示分布函数的绝对离散程度。均方差越大,系列在均值两旁分布越分散,其值变化幅度越大;反之,依然。【例】甲系列:48,49,50,51,52其均值=50;56均值51乙系列:10,30,50,70,90其均值=50;80均值55经计算后甲系列的均方差s甲=1.58,s乙=31.4。甲系列离散程度小,乙系列离散程度大。例:平均值相同,均方差不同进行比较。均方差小的均值代表性好,均方差大的系列均值代表性差(2)变差系数均方差不仅受到系列分布的影响,也与系列的水平有关。变差系数又称离差系数或者离势系数,是一个系列的均方差与其均值的比值用模比系数带入上式有:【例】同上一例,计算得Cv甲=0.005,Cv乙=0.33,甲系列在均值两旁要集中,离散程度小【例】见教材p50例3.8【思考】一条河流上、下游断面的年平均流量的Cv值哪个大?为什么?1)(12nxxxxsCiv1)1(2nKCiv3.4.3偏态系数偏态系数:对系列在均值两旁的对称情况的反映。表达式(对于样本系列):当Cs=0时,系列在均值两旁对称分布;当Cs0属正偏分布;当Cs0属负偏分布;3333)3()1()3()(viisCnKsnxxC一般认为没有上百年的资料,无法获得比较合理的Cs值。因此一般在实际计算中往往按照Cs和Cv的经验关系确定。设计暴雨量:Cs=3.5Cv设计最大流量:Cv0.5Cs=(3~4)CvCv0.5Cs=(2~3)Cv年径流及年降水:Cs=2Cv3.5理论频率曲线经验频率曲线的缺点:①由于实测系列的项数较小,所绘经验频率曲线往往不能满足推求稀遇频率特征值的要求②目估定线或外延会产生较大的误差。需要借助某些数字形式的频率曲线作为定线和外延的依据。通常在实测资料中选取或者算的2~3个有代表性的特征值作参数,并据此选配一些数学方程作为总体系列频率密度曲线的假想数学模型,在按一定的方法确定累积频率曲线。这种用数学形式确定的、符合经验点据分布规律的的曲线称为理论频率曲线【外延和内插的工具】我国水文分析常用到的理论频率曲线有:皮尔逊Ⅲ型曲线;特殊情况下也可以用指数Γ分布曲线,对数Γ分布曲线,极值分布曲线,对数正态分布和威布尔分布曲线。理论频率曲线—皮尔逊Ⅲ型曲线英国生物学家皮尔逊研究各种非正态的分布函数曲线形式,提出了13种分布曲线类型,其中第III型被引入水文学中,并被我国采纳。(1)皮尔逊Ⅲ型曲线是一条一端有限、一端无限的不对称单峰正偏曲线,数学上常称伽玛分布。•曲线特点:–只有一个众数–曲线的两端或一端以横轴为渐近线•由此建立微分方程式求解得:Γ(α)―α的伽玛函数、、a0分别为形状参数、尺度参数和位置参数。α﹥0,β﹥0。)(100)()()(axeaxxf•、、a0一经确定,PIII型密度函数随之确定。可以证明,三参数与均值、Cv、Cs有如下关系:•皮尔逊Ⅲ型频率曲线的
本文标题:工程水文学-第三章-水文统计
链接地址:https://www.777doc.com/doc-1717127 .html