您好,欢迎访问三七文档
2020年6月16日第八章假设检验的基本概念2020年6月16日第一节检验假设与P值2020年6月16日假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。假设检验基本思想2020年6月16日问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesistest)。2020年6月16日例8–1通过以往大规模调查,已知某地一般新生儿的头围均数为34.50cm,标准差为1.99cm。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?2020年6月16日本例:034.50,33.89cmXcm,造成0X的可能原因有二:假设检验的目的——就是判断差别是由哪种原因造成的。①抽样误差造成的;②本质差异造成的。2020年6月16日一般新生儿头围34.50cm33.89cn矿区新生儿头围34.50cmX一种假设H0另一种假设H1抽样误差总体不同2020年6月16日第二节假设检验的基本步骤2020年6月16日例8–1通过以往大规模调查,已知某地一般新生儿的头围均数为34.50cm,标准差为1.99cm。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?2020年6月16日1.建立检验假设,确定检验水准(选用单侧或双侧检验)(1)无效假设又称零假设,记为H0;(2)备择假设又称对立假设,记为H1。对于检验假设,须注意:①检验假设是针对总体而言,而不是针对样本;②H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可;2020年6月16日③H1的内容直接反映了检验单双侧。若H1中只是0或0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。④单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。2020年6月16日(3)检验水准,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取=0.05。可根据不同研究目的给予不同设置。2020年6月16日H0:34.50(该矿区新生儿的头围与当地一般新生儿头围均数相同)H1:34.50(该矿区新生儿的头围与当地一般新生儿头围均数不同)0.052020年6月16日根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。2.计算检验统计量(33.89-34.50)(1.99/55)2.273u2020年6月16日3.确定P值,下结论如例8–1已得到P0.05,按所取检验水准0.05,则拒绝H0,接受H1,差异有统计学意义(统计结论),可以认为矿区新生儿的头围均数与一般新生儿不同,矿区新生儿的头围小于一般新生儿(专业结论)。2020年6月16日/2,t/2,ttP12020年6月16日若P,按所取检验水准,拒绝0H,接受1H,下“有差别”的结论。其统计学依据是,在0H成立的条件下,得到现有检验结果的概率小于,因为小概率事件不可能在一次试验中发生,所以拒绝0H。2020年6月16日若,不拒绝H0,但不能下“无差别”或“相等”的结论,只能下“根据目前试验结果,尚不能认为有差别”的结论。P2020年6月16日第三节大样本均数的假设检验2020年6月16日均数比较u检验的主要适用条件为:1.单样本数据,每组例数等于或大于60例;两样本数据,两组例数的合计等于或大于60例,而且基本均等。2.样本数据不要求一定服从正态分布总体。3.两总体方差已知。4.理论上要求:单样本是从总体中随机抽取,两样本为随机分组资料。观察性资料要求组间具有可比性,即比较组之间除了研究因素以外,其他可能有影响的非研究因素均应相同或相近。2020年6月16日一、单样本均数的u检验(one-sampleu-test)适用于当n较大(如n60)或已知时。检验统计量分别为0000000()()XXXXunSSnXXun较大时已知时P121例8-22020年6月16日P121例8-2例8–2(续例7-5)1995年,已知某地20岁应征男青年的平均身高为168.5cm。2003年,在当地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,问2003年当地20岁应征男青年的身高与1995年相比是否不同?2020年6月16日P121例8-20171.2168.54.70/5.3/85XuSn检验界值u0.05/2=1.96,u0.01/2=2.58,uu0.01/2,得P0.01,按α=0.05水准,拒绝H0,接受H1,2003年当地20岁应征男青年与1995年相比,差别有统计学意义。可认为2003年当地20岁应征男青年的身高有变化,比1995年增高了。2020年6月16日P121例8-2由例7-5可知,2003年当地20岁应征男青年身高总体均数的95%的可信区间为170.1~172.3cm。该区间的下限已高于1995年身高的总体均数168.5cm,也说明2003年20岁应征男青年增高了。2020年6月16日121212221212XXXXXXuSSSnn二、两样本比较的u检验(two-sampleu-test)适用于两样本含量较大(如n130且n230)时。检验统计量为P122例8-3两均数之差的标准误的估计值2020年6月16日P122例8-3两均数之差的标准误的估计值例8-3(续例7-7)为比较某药治疗流行性出血热的疗效,将72名流行性乙型脑炎患者随机分为试验组和对照组,两组的例数、均数、标准差分别为:132n,12.9X,11.9S;240n,25.2X,22.7S。问试验组和对照组的平均退热天数有无差别?12222211222.95.24.23//1.9/322.7/40XXuSnSn2020年6月16日由于u0.05/2=1.96,u0.01/2=2.58,|u|u0.01/2,得P0.01,按α=0.05水准,拒绝H0,接受H1,两组间差别有统计学意义。可以认为试验组和对照组退热天数的总体均数不相等,两组的疗效不同。试验组的平均退热天数比对照组短。例7-7已计算了的95%的可信区间:天,给出了两总体均数差别的数量大小。P122例8-3两均数之差的标准误的估计值3.3~1.32020年6月16日第四节大样本率的假设检验2020年6月16日率的u检验的应用条件:1、n较大,如每组例数大于60例。2、样本p或1-p均不接近100%和0。3、np和n(1-p)均大于5。2020年6月16日一、单样本率的u检验适用于样本率与已知的总体率的比较P123例8-40000(1)pppun2020年6月16日例8–4已知某地40岁以上成年男性高血压患病率为8.5%(π0),经健康教育数年后,随机抽取该地成年男性1000名,查出高血压患者55例,患病率(p)为5.5%。问经健康教育后,该地成年男性高血压患病率是否有降低?2020年6月16日0.0550.0853.4020.085(10.085)/1000u单侧界值u0.01=2.33,现|u|u0.01,故P0.01,按α=0.05水准拒绝H0,接受H1,差异有统计学意义,可认为经健康教育后,该地成年男性高血压患病率有所降低。2020年6月16日二、两个率比较的u检验推断两个总体率是否相同P124例8-51212121211(1)()ppccppppuppnn2020年6月16日例8–5某医院用黄芪注射液和胎盘球蛋白进行穴位注射治疗小儿支气管哮喘病人,黄芪注射液治疗117例,有效103例;胎盘球蛋白治疗55例,有效49例。试比较两种疗法有效率有无差别2020年6月16日%37.885511749103cp0.88030.89090.00540.8837(10.8837)/(1/1171/55)uu0.05/2=1.96,现|u|u0.05/2,故P0.05,按α=0.05检验水准接受H0,差异无统计学意义,尚不能认为两种疗法治疗小儿支气管哮喘的疗效有差别。2020年6月16日第五节检验水准与两类错误2020年6月16日I型错误和II型错误假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。详见表8-1。2020年6月16日I型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)。但n一定时,增大,则减少。2020年6月16日假设检验的结果客观实际拒绝H0“接受”H0H0成立I型错误()推断正确(1)H0不成立即H1成立推断正确(1)II型错误()可能发生的两类错误图8-2I型错误与II型错误示意图(以单侧u检验为例)H1:0成立界值0112020年6月16日1-:检验效能(power):当两总体确有差别,按检验水准所能发现这种差别的能力。2020年6月16日减少(增加)I型错误,将会增加(减少)II型错误增大n同时降低与与间的关系2020年6月16日减少I型错误的主要方法:假设检验时设定值。减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合适的样本量:实验设计。2020年6月16日第六节单侧检验与双侧检验2020年6月16日图8–3双侧u检验的检验水准α图8–4单侧u检验的检验水准α单侧检验概念2020年6月16日第七节假设检验的统计意义与实际意义2020年6月16日1.要有严密的研究设计,尤其是下因果结论。2.不同的资料应选用不同检验方法。3.正确理解“显著性”一词的含义(用统计学意义一词替代)。2020年6月16日4.结论不能绝对化,提倡使用精确P值。5.注意统计“显著性”与医学/临床/生物学“显著性”的区别2020年6月16日6.可信区间与假设检验各自不同的作用,要结合使用。一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。2020年6月16日另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。2020年6月16日有实际专业意义的值H0(2)(3)(4)(5)(1)有实际可能有实际无实际样本例数可接受专业意义专业意义专业意义太少H0有统计学意义无统计学意义可信区间在统计推断上提供的信息2020年6月16日虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。
本文标题:假设检验的基本概念
链接地址:https://www.777doc.com/doc-5949236 .html