您好,欢迎访问三七文档
生物统计学如果一个人说他从来没有说过谎。他能够证明吗?要证明他没有说过谎,他必须出示他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的。这简直是不可能的。即使他找到一些证人,比如他的同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没有被听到说谎。反过来,如果要证明这个人说过谎很容易,只要有一次被抓住就足够了。企图肯定什么事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。区间估计与假设检验的基本区别上一章中讨论了置信区间的估计方法。它是利用样本数据,以抽样总体的分布为理论基础,用一定的概率保证来计算出原总体中未知参数的区间范围。特别值得注意的是:在作区间估计之前,我们对所要估计的参数是一无所知的。而在这一章中,我们所要做的工作是,先对要研究的参数作一个假设,然后去检验这个假设是否正确。因此假设检验对于所研究的参数总是先有一个假设的值。这也是这两种方法最基本的区别。假设检验又叫显著性检验是统计学中的一个重要内容。显著性检验的方法很多,常用的有u检验、t检验、F检验和2检验等。尽管这些检验方法的使用条件及用途不同,但检验的基本原理是相同的。6它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。假设检验基本思想7问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesistest)。8假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验9第一节统计假设检验的基本原理一、显著性检验的意义如,某地进行了两个水稻品种对比试验,在相同条件下,两个水稻品种分别种植10个小区,获得两个水稻品种的平均产量为:我们能否根据就判定这两个水稻品种平均产量不同?结论是,不一定。1510x2500x1210xx1210xx这里,试验的表面差异是由两部分组成:一部分是试验的真实差异;另一部分是试验误差。虽然真实差异未知,但试验的表面差异是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可将试验的表面差异与试验误差相比较间接推断真实差异是否存在,即进行差异显著性检验。12()xx12()12()12()12()xx12()xx12()二、显著性检验的步骤【例3·1】已知某品种玉米单穗重~N(300,9.52),即单穗重总体平均数300g,标准差9.5g。在种植过程中喷洒了某种药剂的植株中随机抽取9个果穗,测得平均单穗重308g,试问这种药剂对该品种玉米的平均单穗重有无真实影响?x0x(一)提出假设00000()x首先对样本所在的总体作一个假设。假设喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数之间没有真实差异,即或。也就是假设表面差异是由抽样误差造成的。这种假设通常称为无效假设或零假设,记为。无效假设是待检验的假设,它有可能被接受,也有可能被否定。相应地还要有一个对应假设,称为备择假设。备择假设是在无效假设被否定时,准备接受的假设,记为或。通过检验,若否定无效假设,我们就接受备择假设。此外,样本频率、变异数以及多个平均数的假设检验,也应根据试验目的提出无效假设和备则假设。00:H000:AH(二)确定显著水平在进行无效假设和备择假设后,要确定一个否定H0的概率标准,这个概率标准叫显著水平(significancelevel)或概率水平(probabilitylevel),记作α。α是人为规定的小概率界限,生物统计学中常取α=0.05和α=0.01两个显著水平。(三)计算概率在假定无效假设成立的前提下,根据所检验的统计数的抽样分布,计算表面差异是由抽样误差造成的概率。0()x本例是在假定无效假设成立的前提下,研究在~N(300,9.52)这一已知正态总体中抽样所获得的样本平均数的分布。00:Hxx18若,则样本平均数,,,将其标准化,得2(,)xN2(,)xxxNxxn0xxxxxxun本例,得09,308300nxgg9.5g03083002.5269.59xun下面估计|u|≥2.526的两尾概率,即估计P(|u|≥2.526)是多少?我们知道,两尾概率为0.05的临界值为=1.96,两尾概率为0.01的临界值为=2.58,即:0.01uP(||>1.96)=P(>1.96)+P(<-1.96)=0.050.05uuuuuuP(||>2.58)=P(>2.58)+P(<-2.58)=0.01uuu根据样本数据计算所得的值为2.526,介于两个临界值之间,即:<2.526<uu0.05u0.01u所以,||≥2.526的概率P介于0.01和0.05之间,即0.01<p<0.05说明假定表面差异()是由抽样误差造成的概率在0.01—0.05之间(小概率取值范围内)。u0x(四)统计推断根据小概率事件实际不可能性原理作出否定或接受无效假设的推断。根据这一原理,当表面差异是抽样误差的概率在小于0.05(α)时,可以认为在一次抽样中表面差异是抽样误差实际上是不可能的,因而否定原先所作的无效假设H0:,接受备择假设HA:,即认为存在真实差异。当表面差异是抽样误差的概率大于0.05(α)时,说明无效假设H0:成立的可能性大,不能被否定,因而也就不能接受备择假设HA:。0000显著性检验的结果表明:本例的样本平均数与原总体平均数之间的表面差异()除包含抽样误差外,还包含真实差异(),即喷洒了药剂的玉米单穗重总体平均数与原来的玉米单穗重总体平均数不同。0x0025综上所述,显著性检验,从提出无效假设与备择假设,到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对样本所属总体所作的无效假设的统计推断。上述显著性检验利用了分布来估计出∣u∣≥2.526的两尾概率,所以称为检验.uu26假设检验的步骤可概括为:(1)对样本所属总体提出无效假设H0和备择假设HA;(2)确定检验的显著水平α;(3)在H0正确的前提下,根据抽样分布的统计数,进行假设检验的概率计算;(4)根据显著水平α的统计数(如u值)临界值,进行差异是否显著的推断。三、显著水平与两种类型的错误(一)显著水平用来否定或接受无效假设的概率标准叫显著水平,记作。在生物学研究中常取=0.05,称为5%显著水平;或=0.01,称为1%显著水平或极显著水平。可以看到,是否否定无效假设,是用实际计算出的检验统计数的绝对值与显著水平对应的临界值比较:若||≥,则在水平上否定若||<,则不能在水平上否定。00:Huuuuuuu00:H00:H区间和称为水平上的否定域,而区间则称为水平上的接受域。,u,u(,)uu因为在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”,所以我们下的结论不可能有百分之百的把握。(二)两类错误例如,经检验获得“差异显著”的结论,我们有95%的把握否定无效假设H0,同时要冒5%下错结论的风险;(拒真错误)而经检验获得“差异不显著”的结论,在统计学上是指“没有理由”否定无效假设H0,同样也要冒下错结论的风险。(存假错误)uu显著性检验可能出现两种类型的错误:Ⅰ类错误(拒真)与Ⅱ类错误(存假)。Ⅰ类错误又称为错误,就是把真实的差异错判为是非真实的差异,即实际上H0正确,检验结果为否定H0。犯Ⅰ类型错误的可能性一般不会超过所选用的显著水平;Ⅱ类错误又称为错误,就是把非真实的差异错判为是真实的差异,即实际上HA正确,检验结果却未能否定H0。犯Ⅱ类型错误的可能性记为,一般是随着的减小或试验误差的增大而增大,所以越小或试验误差越大,就越容易将试验的真实差异错判为试验误差。00显著性检验的两类错误归纳如下:表3-1显著性检验的两类错误假设检验的结果客观实际拒绝H0“接受”H0H0成立I型错误()推断正确(1)H0不成立即H1成立推断正确(1)II型错误()35因而,不能仅凭统计推断就简单地作出绝对肯定或绝对否定的结论。“有很大的可靠性,但有一定的错误率”这是统计推断的基本特点。为了降低犯两类错误的概率,一般从选取适当的显著水平和增加试验重复次数来考虑。因为选取数值小的显著水平值可以降低犯Ⅰ类型错误的概率,但与此同时也增大了犯Ⅱ型错误的概率,所以显著水平值的选用要同时考虑到犯两类错误的概率的大小。n37减少(增加)I型错误,将会增加(减少)II型错误增大n同时降低与与间的关系38减少I型错误的主要方法:假设检验时设定值。减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合适的样本量:实验设计。在【例3·1】中,对应于无效假设H0:的备择假设为HA:。HA实际上包含了或这两种情况。此时,在水平上否定域为和,对称地分配在分布曲线的两侧尾部,每侧尾部的概率为,如图3-1所示。这种利用两尾概率进行的检验叫两尾检验.为水平两尾检验的临界值。四、两尾检验与一尾检验0000,u,uu/2u0u40图3-1双侧检验抽样分布H0值临界值临界值/2/2样本统计量拒绝域拒绝域接受域1-置信水平41图3-2单侧检验-1H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平42图3-2单侧检验-2H0值临界值样本统计量拒绝域接受域抽样分布1-置信水平两尾检验的目的在于判断与有无差异,而不考虑与谁大谁小。00在有些情况下两尾检验不一定符合实际情况。例如,目前我国大豆育种工作者认为,大豆籽粒蛋白质含量超过45%()的品种为高蛋白品种。如果进行样品含量检测,我们关心的是所在的总体平均数大于。此时的无效假设仍为H0:,但备择假设则为HA:。这时否定域位于分布曲线的右尾,即。例如当=0.05时,否定域为。0x000u[,)u[1.64,)一尾检验的=两尾检验的=2.33。这种利用一尾概率进行的检验叫一尾检验。此时为一尾检验的临界值。一尾检验的=两尾检验的uuu2u例如,一尾检验的=两尾检验的=1.64,0.05u0.10u0.01u0.02u实际应用中,如何选用两尾检验或一尾检验,应根据专业的要求在试验设计时就确定。一般情况下,若事先不知道与谁大谁小,只是为了检验与是否存在差异,则选用两尾检验;如果凭借一定的专业知识和经验推测应小于(或大于)时,则选用一尾检验。000小结假设检验的思想基础:小概率原理;假设检验的标准化4步骤;两类错误:Ⅰ类错误或错误(拒真)vs.Ⅱ类错误或错误(存假)双尾检验和一尾检验。4748END
本文标题:假设检验基本原理
链接地址:https://www.777doc.com/doc-4599571 .html