您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 第八章 假设检验的基本概念
1第八章假设检验的基本概念2假设检验过去称显著性检验。它是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立。然后在H0成立的条件下计算检验统计量,最后获得P值来判断。假设检验基本思想及步骤3问题实质上都是希望通过样本统计量与总体参数的差别,或两个样本统计量的差别,来推断总体参数是否不同。这种识别的过程,就是本章介绍的假设检验(hypothesistest)。4例8–1通过以往大规模调查,已知某地一般新生儿的头围均数为34.50cm,标准差为1.99cm。为研究某矿区新生儿的发育状况,现从该地某矿区随机抽取新生儿55人,测得其头围均数为33.89cm,问该矿区新生儿的头围总体均数与一般新生儿头围总体均数是否不同?5本例:034.50,33.89cmXcm,造成0X的可能原因有二:假设检验的目的——就是判断差别是由哪种原因造成的。①抽样误差造成的;②本质差异造成的。6矿区新生儿头围34.50cm33.89cn矿区新生儿头围34.50cmX一种假设H0另一种假设H1抽样误差总体不同71.建立检验假设,确定检验水准(选用单侧或双侧检验)(1)无效假设又称零假设,记为H0;(2)备择假设又称对立假设,记为H1。对于检验假设,须注意:①检验假设是针对总体而言,而不是针对样本;②H0和H1是相互联系,对立的假设,后面的结论是根据H0和H1作出的,因此两者不是可有可无,而是缺一不可;8③H1的内容直接反映了检验单双侧。若H1中只是0或0,则此检验为单侧检验。它不仅考虑有无差异,而且还考虑差异的方向。④单双侧检验的确定,首先根据专业知识,其次根据所要解决的问题来确定。若从专业上看一种方法结果不可能低于或高于另一种方法结果,此时应该用单侧检验。一般认为双侧检验较保守和稳妥。9(3)检验水准,过去称显著性水准,是预先规定的概率值,它确定了小概率事件的标准。在实际工作中常取=0.05。可根据不同研究目的给予不同设置。10根据变量和资料类型、设计方案、统计推断的目的、是否满足特定条件等(如数据的分布类型)选择相应的检验统计量。2.计算检验统计量113.确定P值,下结论12/2,t/2,ttP113若P,按所取检验水准,拒绝0H,接受1H,下“有差别”的结论。其统计学依据是,在0H成立的条件下,得到现有检验结果的概率小于,因为小概率事件不可能在一次试验中发生,所以拒绝0H。14第三节大样本均数的假设检验15均数比较u检验的主要适用条件为:1.单样本数据,每组例数等于或大于60例;两样本数据,两组例数的合计等于或大于60例,而且基本均等。2.样本数据不要求一定服从正态分布总体。3.两总体方差已知。4.理论上要求:单样本是从总体中随机抽取,两样本为随机分组资料。观察性资料要求组间具有可比性,即比较组之间除了研究因素以外,其他可能有影响的非研究因素均应相同或相近。161.单样本u检验(one-sampleu-test)适用于当n较大(如n60)或已知时。验统计量分别为0000000()()XXXXunSSnXXun较大时已知时P121例8-217121212221212XXXXXXuSSSnn2.两样本u检验(two-sampleu-test)适用于两样本含量较大(如n130且n230)时。检验统计量为P122例8-3两均数之差的标准误的估计值18第五节检验水准与两类错误19I型错误和II型错误假设检验是利用小概率反证法思想,从问题的对立面(H0)出发间接判断要解决的问题(H1)是否成立,然后在假定H0成立的条件下计算检验统计量,最后根据P值判断结果,此推断结论具有概率性,因而无论拒绝还是不拒绝H0,都可能犯错误。详见表8-1。20I型错误:“实际无差别,但下了有差别的结论”,假阳性错误。犯这种错误的概率是(其值等于检验水准)II型错误:“实际有差别,但下了不拒绝H0的结论”,假阴性错误。犯这种错误的概率是(其值未知)。但n一定时,增大,则减少。21假设检验的结果客观实际拒绝H0“接受”H0H0成立I型错误()推断正确(1)H0不成立即H1成立推断正确(1)II型错误()表3-10可能发生的两类错误22图8-2I型错误与II型错误示意图(以单侧u检验为例)H1:0成立界值011231-:检验效能(power):当两总体确有差别,按检验水准所能发现这种差别的能力。24减少I型错误的主要方法:假设检验时设定值。减少II型错误的主要方法:提高检验效能。提高检验效能的最有效方法:增加样本量。如何选择合适的样本量:实验设计。25第六节单侧检验与双侧检验26图8–3双侧u检验的检验水准α图8–4单侧u检验的检验水准α单侧检验概念27第七节假设检验的统计意义与实际意义281.要有严密的研究设计,尤其是下因果结论。2.不同的资料应选用不同检验方法。3.正确理解“显著性”一词的含义(用统计学意义一词替代)。294.结论不能绝对化,提倡使用精确P值。5.注意统计“显著性”与医学/临床/生物学“显著性”的区别306.可信区间与假设检验各自不同的作用,要结合使用。一方面,可信区间亦可回答假设检验的问题,算得的可信区间若包含了H0,则按水准,不拒绝H0;若不包含H0,则按水准,拒绝H0,接受H1。31另一方面,可信区间不但能回答差别有无统计学意义,而且还能比假设检验提供更多的信息,即提示差别有无实际的专业意义。32有实际专业意义的值H0(2)(3)(4)(5)(1)有实际可能有实际无实际样本例数可接受专业意义专业意义专业意义太少H0有统计学意义无统计学意义图3-7可信区间在统计推断上提供的信息33虽然可信区间亦可回答假设检验的问题,并能提供更多的信息,但并不意味着可信区间能够完全代替假设检验。可信区间只能在预先规定的概率检验水准的前提下进行计算,而假设检验能够获得一较为确切的概率P值。34练习P134三、2、
本文标题:第八章 假设检验的基本概念
链接地址:https://www.777doc.com/doc-4042243 .html