您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 水文统计008第八章 假设检验1130
第八章假设检验问题的提出例1:某小流域,过去在天然状态下观测的多年平均年径流量,经过大量规模流域治理,那么能否说明流域正常径流量发生了显著变化?前后两系列平均值有较大差异,原因两方面①样本抽样误差;②前后两系列总体平均值确实发生了较大变化。以上多年平均年径流量所存在的差异,是否就能说明前后总体数学期望发生了较大变化呢?凭感觉或经验难于作出可靠推断,这就必借助统计手段作推断。可先假设治理后总体数学期望不变,然后在此前提下构造有关统计量,再利用两样本观测值对以上假设的正确值作出判断,这是一个比较典型假设检验问题。mmx2501mmx2102例2:投掷一颗硬币100次,观察出现正面的60次,那么这枚硬币是否匀称呢?若用随机变量X=1表示正面,X=0表示反面,那么问题变成是否成立?或者说x的数学期望是否正确?本例X=1在100次试验发生的频率为0.6与概率有较大差异,原因仍有两个。一是样本抽样误差导致,二是这枚硬币不匀称所致。因此要回答以上问题,必须作假设检验,即假设或?21)1(Xp21)1(Xp21EX21EX例3:对两个水文变量作了n年同期观测得到样本x1,x2,…,xn,y1,y2,…,yn,求得r=0.52,这两个变量是否为零相关?即总体相关系数是否成立?显然我们不能因为r=0.520较多,就认为两随机变量不是零相关。要知道,由于样本随机性,因此即使两随机变量总体相关系数,它的r也可超过0.52,为此,r=0.52的样本,可能来自总体,也可能来自总体,如何作判断?因此,必须作假设检验,如假设,构造统计量,利用实测r数值对假设正确与否作出判断。00000样本相关系数分布密度曲线例4:参数估计时,假定水文系列独立同分布且线型P-Ⅲ,其实当我们拿到一个原始水文系列时,是需要作这方面检验,即检验x1,x2,…,xn是否相互独立的,是否符合某P-Ⅲ分布。如果n年资料中后m年资料是在流域内作综合治理(如修水库等)取得的,那么前(n-m)年与后m年资料系列是否来自一总体?或者说它们分布函数是否相同?这些都需要作假设检验。检验内容:(1)?(2)?(3)?0),(~0xFX),(),(0021xFxFXX在假设检验理论中,称所要检验的假设为原假设或零假设,记为H0例1H0:a1=a2(a1,a2表示前后两系列数学期望)0:0H例2)21(21:0EXpH例3),(~:00xFXH),(),(:00021xFxFHXX例4把以上多种假设检验归纳为两类:其一是随机变量X的分布函数已知,其参数知,需要检验(常数)或(集合),这类检验称为参数假设检验,例1,例2,例3就是参数假设检验(注意,总认为它的总体分布以正态分布为前提)其二是随机变量X的分布函数未知,而要对它的某种性质作出判断,如例4,要检验x1,x2,…xn符合某一已知分布函数,前后两个系列是否为同一分布函数系列,这些都称为非参数假设检验12(,,,)nxxx0假设检验§8-1基本概念§8-2正态总体均值的假设检验§8-3正态总体方差的假设检验§8-4零相关检验§8-5非参数假设检验§8-1基本概念基本思想假设检验的一般步骤两类错误(一)小概率原理(实际推断原理)将概率很小、接近于0的事件(小概率事件)在一次试验中看成实际上的不可能事件;将概率较大、接近1的事件(大概率事件)在一次试验中看成实际上的必然事件。这就是概率论中的一个重要原理,即实际推断原理。例如,交通事故时有发生,但对每个人来讲,遇到车祸的概率是很小的,可看成实际上的不可能事件;又例如,若某种彩票中头奖的概率为1/500万,则买一张彩票就中头奖是一个小概率事件,也可看成实际上的不可能事件。(二)假设检验的基本方法假设检验基本方法是概率反证法。假定某种假设H0是正确的,在此前提下构造一个小概率事件A,作一次实验,如果事件A没有发生,就接受H0;反之,就有理由拒绝H0.说明原假设与”小概率事件不可能发生”相矛盾,原因是原假设不正确,所以应该拒绝H0,这就是反证法。做假设检验时,对于否定或拒绝H0更可信,因为小概率事件不可能发生一般是可能接受,但接受H0,不等于H0正确,事实往往是不正确。当然,这种反证法,不是真正意义上反证法,它可能发生错误,即小概率事件也可能发生。例:某车间用一台自动包装机包装奶粉,额定标准(三)假设检验的一般步骤下面通过例子来说明假设检验的一般步骤为每袋净重0.5公斤,设包装机称得的奶粉重量服从正态分布,且根据长期的经验知其标准差是0.015(公斤),某天开工后,为检验包装机的工作是否正常,随机抽取它所包装的奶粉9袋,称得净重为:0.497,0.506,0.518,0.524,0.488,0.511,0.510,0.515,0.512。问这天包装机的工作是否正常?解:设这天包装机所包装的奶粉重量为X,已知X~N(a,0.0152)。首先,假设a=0.5,记作H0:a=0.5。如果H0成立,0.5x不应该很大,0.50.0159x从而也不应该很大。0.50.0159XU因此考虑统计量00.5~(0,1)0.0159HXUN根据假设,如果成立,则统计量取一临界值,使之在H0成立的条件下,20.50.0159XPu件。大于临界值是小概率事9015.05.0x0120.50.0159Xu21.96u是一个小概率事件,由附表查得0.509x又0.50.5090.51.81.960.01590.0159x所以0.05如取,则设因为|1.8|1.96,这表明小概率事件没有发生,我们没有理由否定原来的假设,只能认为原假设成立,接受原假设H0,即认为这天包装机工作正常。这种检验又称显著性检验。假设检验的内容和形式尽管很多,但检验步骤一般如下:①②③④⑤0101:0.5,:0.5HHHaHa提出原假设和备择假设。如例1中的。0.50.015/9XU选择统计量。如例1中的。20.05,1.96u根据显著性水平,确定临界值。如例1中的查表得。1.8u根据样本,计算统计量的观测值。如例1中的。0002|1.81.96,HuuHH比较统计量的观测值与临界值,对原假设作出判断。如例1中的|故接受,反之,拒绝。假设检验中的基本术语上例中“H0:a=0.5”为原假设或零假设,而把相反的结论称作对立假设或备择假设,上例中的备择假设为“H1:a≠0.5”。如果拒绝H0,则就接受H1。给定的小概率为显著性水平。拒绝原假设的区域称为拒绝域或否定域。接受原假设的区域称为接受域。(四)两类错误第一类错误(“以真作假”错误或“弃真”错误):在原假设为真的情况下,如果一次试验中,小概率事件A发生了,我们就拒绝原假设,实际上,在成立条件下,虽然事件A发生的概率很小(等于显著性水平),但是,它还是有可能发生的,一旦发生,就拒绝原假设,即把一个正确的假定给否定了。犯第一类错误的概率就是。α/2α/2βa0a1uα/2-uα/2α/2α/2β0a0a1-uα/2uα/2α/2α/2β0a0a1-uα/2uα/2α/2α/2β0a0a1-uα/2uα/2α/2α/2β0a0a1-uα/2uα/2α/2α/2β0a0a1第二类错误(“以假作真”错误或“取伪”错误):在我们进行假设检验的时候,当我们接受原假设时,并不能保证原假设一定是正确的。因为在原假设不成立的情况下,统计量的取值也有可能落在接受域。犯第二类错误的概率为β(如下图)。nuanuaHHPaa2/02/000)/()(不真接受例,H0:a=a0在样本容量一定的情况下,变小了,则β变大了;反之,β变小了,则变大,不可能使两者同时都很小。当然,人们总希望尽可能地减小犯两类错误的概率。但是,欲使和β都变小,必须增加样本容量。因为n越大,σ2/n越小,分布越集中。nuaa2/0真的分布,0HXnuaa2/0不真的分布,0HX我们知道对同一个原假设,根据同一组样本,不同,可能有不同的判别结果。因此,的选择也很重要,一般须根据实际情况来确定。例如,在检验药品中,某种成分是否等于规定指标,因为关系到人民的安全,我们情愿犯“以真作假”的错误,而不愿犯“以假作真”的错误,即宁可将合格药品判为不合格药品,而不愿将不合格药品判为合格药品,此时,应把取大些。而在另外一些场合,例如,检查盒装螺丝钉的重量,就不必那么严格了,值可以取小些。§8-2正态总体均值的假设检验分两种情况讨论:212~,,(,,)nXNaxxxX设(),为的样本,Xs2与分别为样本均值和方差,0aa检验总体均值是否等于已知常量。2已知。2未知。一:一个正态总体均值的假设检验1①1.2.21.已知。。0100:,:aaHaaHnaXU/0选择统计量:0220,~(0,1)()/HUNPUuuxaUun当成立时。对给定的,由确定临界值。根据样本计算的观测值。检验。上述检验方法又称,;否则接受,则拒绝若uHHuu002法。所以仍可用上述检验方),,(的极限分布为由于很大时,不服从正态分布,当若10/0NnaXUnX例,已知x~N(a,22),a未知,从中抽取n=20样本,求得该样本平均值=98.5,试在置信度α=0.05下检验原假设H0:a=a0=100解:根据题意这是一个单个正态总体,总体方差已知,作均值检验问题,因此可用上述的检验法。H0:a=100,H1:a≠100计算统计量在α=0.05时,查标准正态分布表=1.96实测样本计算u值显然是在否定域以上结果表示总体数学期望与100有显著差异。35.320/21005.980naxu2/u/2,ux分析a0取多少会被接受:098.51.96220a则,97.63a099.37a0在以上范围内,称总体数学期望与a0无显著差异,当超过以上范围,则称有显著差异。由于当α=0.01,2/u=2.57则能使H0被接受a0取值范围是97.35a099.65未知。20010:,:HaaHaa。0/XaTSn选择统计量:,。对给定的成立时当)1(~,0ntTH22()PTtt由确定临界值。2.0/xaTtsn根据样本,计算的观测值。002ttHHt若,则拒绝;否则接受,上述检验方法又称检验法。2111niisxxn其中()例:由生产经验知,某种钢筋的强度服从正态分布N(a,σ2),但a,σ2均未知,今随机抽取6根钢筋进行强度试验,测得强度分别是(单位:kg/mm2):48.5,49.0,53.5,49.5,56.0,52.5,问能否认为该种钢筋的强度为52.0(=0.05)?解:。52:,52:10aHaH)(成立条件下:在1~/520ntnSXTH57.205.02tt分布表得,查由5.51)5.520.560.495.48(61x222221[48.551.549.051.56156.051.552.551.5]44.58.95s8.92.99s所以51.5520.412.996t00.412.5752H因为,所以接受,即可认为钢筋平均强度为。x2x11.3197.00.155.141nSaxt2tt2t例,一个地方年平均气温近似服从正态分布。据20年气象资料,求得某地年平均气温的平均值14.5℃,均方差S=0.7℃。试在显著性水平α=0.05下检查绘制年平均气温等温线图时,等温线15℃通过该地是否合理。解:按题目意义,需要检验的是该地年平均气温总体数学期望为15℃是否合理,即H0:a=15℃H1:
本文标题:水文统计008第八章 假设检验1130
链接地址:https://www.777doc.com/doc-4809991 .html