您好,欢迎访问三七文档
§2.3假设检验学习目标:假设检验是有别于参数估计的又一种重要的统计推断方法,但与区间估计又有一定的联系。通过对该方法的研究学习,进一步提高利用随机样本对总体进行统计推断的能力。ExitHypothesistesting问题提出:问题2糖厂用自动包装机装糖,每箱的标准重量规定为100kg,某日开工后,抽测了9箱,其重量如下(单位kg):99.3,98.7,100.5,101.2,98.3,99.7,99.5,102.1,100.5,问此包装机是否正常工作。问题1要检查纺织厂中纱的强力是否达到了标准,我们只能抽出一小部分纱,然后根据这部分纱的质量来推断整批纱的质量是否合格。上面两个问题具有一个共同特点,就是从样本出发,对总体的某种假设作出判断——假设是否成立。在包装机装糖一例中,用表示糖箱的平均重量,则问题即为对假设1000:H作出肯定或否定的回答。在统计上,对总体所作的种种假设称为统计假设,[引例]某厂有一批产品共200件,须经检验合格才能出厂,按照国家标准次品率不得超过1%,今在其中任意抽取5件,发现这个5件中有次品,问这批产品能否出厂?解:设这批产品的次品率为,则问题化为检验假设01.00:H是否成立。由样本出发来判断统计假设是否成立称为假设检验。现假定0H成立,看会出现什么结果,此时200件产品中最多有二件次品,任意抽取5件,那么5件中无次品的概率为StatisticalHypothesis件中没有件次品时。,当件中有一件次品时;,当件中有两件次品时;,当无次品200200200)(520052005200519952005198CCCCCCP显然95.052005198CCP(无次品)05.0(有次品)P上面的分析讨论中,我们基于一个基本原理——实际推断原理,同时用了反证法的思想.假设总体),(2~NX,nXXX,,,21为来自总体X的一个样本,其观察值为nxxx,,,21。一.2已知,检验假设000(:H已知)构造统计量nXU20(2-55)则当0H成立时,U服从标准正态分布,即)10(~,NU,对于给定的10(通常比较小),由}{UP(2-56)查标准正态分布表可求得。Statistic(2-56)表明事件“U”是一小概率事件,因此计算U的观察值nXu20,如果u,则表明小概率事件在一次试验中发生了,根据实际推断原理,应拒绝假设0H;如果u,则不怀疑0H的真实性(接受0H)。有时也称u为检验0H的拒绝域。y2/2/ox拒绝域接受域拒绝域Rejectionregion例2-20根据长期的经验和资料分析,某砖瓦厂所生产的砖的抗断强度X服从正态分布,方差21.12,今从该厂生产的一批砖中随机地抽取6块,测的抗断强度(单位:kg/cm2)如下:32.56,29.66,31.64,30.30,31.87,31.03,问这批砖的平均抗断强度可否认为是32.50kg/2cm)05.0(。解:依题意需检验假设50.320:H。由于方差21.12,故取统计量nXU20当0H成立时U服从标准正态分布,即),(10~NU,由此知0H的拒绝域为nX20,经计算13.316161iixX3621.150.3213.3120nXu对于给定的05.0,由(2-56)查正态分布表得96.1,可见96.13u,故拒绝0H,即这批砖的平均抗断强度不能认为是32.50kg/cm2。通常称为显著性水平,或简称水平。在假设检验中通常取0.05或0.10,一般不超过0.10。当0H为真时而加以拒绝,即“以真为假”,所犯错误的概率为,这种错误称为第一类错误。当0H不成立时却接受假设0H,即以假为真,这种错误称为第二类错误。用表示犯错误的概率。y2/2/ox拒绝域接受域拒绝域当0H不成立时却接受假设0H,即以假为真,这种错误称为第二类错误。用表示犯错误的概率。Significancelevel当0H不成立时却接受假设0H,即以假为真,这种错误称为第二类错误。用表示犯错误的概率。当0H不成立时却接受假设0H,即以假为真,这种错误称为第二类错误。用表示犯错误的概率。2/ox拒绝域接受域拒绝域当时,00:H)1,/(~/00nNnXU需要指出的是,在上述假设检验中,当拒绝假设00:H时,实际上接受了“0”,因此该检验问题通常叙述成:在显著性水平下,检验假设00:H;01:H(2-57)当检验统计量取某个区域中的值时,我们拒绝原假设0H,则称该区域为拒绝域,拒绝域的边界称为临界值(点)。也常说成“在显著性水平下,针对1H检验0H”,0H称为原假设,1H称为备择假设。形如(2-57)式中的备择假设1H表示可能大于0,也可能小于0,称为双边备择假设,而称形如(2-57)式的假设检验为双边假设检验。检验假设00:H;01:H(2-58)称为右边假设检验。检验假设00:H;01:H(2-59)称为左边假设检验。右边假设检验和左边假设检验统称为单边假设检验。引例中的检验即为单边假设检验,其原假设为01.00:H,备择假设为01.01:H。为了叙述方便,对双边假设检验只写原假设0H。(00:H;01:H)二.2未知,检验假设000(:H已知)取统计量nSXT20(2-60)则当0H成立时,)1(~ntT,对于给定的10,由}{TP(2-61)查)1(nt分布表可求得。(2-61)表明事件“T”是一小概率事件,因此计算T的观察值nSXt20,如果t,则表明小概率事件在一次试验中发生了,根据实际推断原理,应拒绝假设0H;如果t,则不怀疑0H的真实性(接受0H)。有时也称t为检验0H的拒绝域。问题:假设检验与EX的区间估计之间有何联系?因此对000(:H已知)的检验等价于下述检验“找出总体均值的置信区间,如果0不在其中,即nSX20,则拒绝假设0H,否则不怀疑0H的真实性”。由区间估计的讨论知,EX的置信度为1的置信区间是满足不等式nSX2的的集合。三.关于方差2的检验2020:H(20已知)我们从2的无偏2S着手,为求2S的分布,将2S稍加修改,即得统计量2022)1(Sn(2-62)由例2-2知,当2020:H成立时)1(~22n分布,因此对于给定的(10),令2/}{12P(2-63)2/}{22P(2-64)查21()n分布表可求得临界值12,,计算2的观测值20122022)()1(niiXxSn如果12或22则拒绝假设0H,否则接受0H。到目前为止,我们已得到了一系列关于一个正态总体参数检验的类型与方法,现将常用的几种列入表2-1,以便查阅。例2-22某车间生产铜丝,生产一向比较稳定,今从产品中随机抽取10根检查折断力,得数据如下:(单位kg)578,572,570,568,572,570,570,572,596,584,假定铜丝的折断力X服从正态分布,问是否可认为该车间生产的铜丝的折断力的方差为64?)05.0(。解:依题意需检验假设6420:H,2022)1(Sn)1(~2n,2.575101101iixX故取统计量经计算6.681)(1012iiXx65.10/)(2010122iiXx2/}{12P(2-63)对于给定的05.0,由2/}{22P(2-64)查)9(2分布表得,70.210.192,而221,故不能拒绝假设0H,即可认为该车间生产的铜丝的折断力的方差为64。例2-24食品厂用自动装罐机装食品罐头,规定标准重量为500克,且标准差不得超过8克,每天定时检查机器工作情况,现抽取了25罐,测得其平均重量为502X克,样本标准差为8克,假定罐头重量X服从正态分布,试问机器工作是否正常?)05.0(解:机器工作正常有两个标准,一是标准重量为500克,另一个是标准差不得超过8克,又知罐头重量)(~2,NX,因此问题化为如下两个假设检验:(1)2未知,检验假设00:H(5000);(2)未知,检验假设)(:220202018H;20211:H。(1)取统计量255002SXT)(24~t(0H成立时)对给定的05.0,查)24(t表得064.2,由502X,样本标准差S8得064.225.1t,因此可认为罐头重量均值500克。(2)取2022)1(Sn)1(~2n(当202时)对于给定的05.0,由05.0}{22P查)24(2分布表得42.362,由S8,得242,从而42.362422,故不能拒绝假设01H。因为以上两个假设都被接受,所以可以认为机器工作正常。四.两个正态总体的假设检验设总体)(~211,NX,)(~222,NY,mXXX,,,21为来自总体X的样本;nYYY,,,21为来自总体Y的样本,且两样本相互独立。令niiYnY11,niiYYYnS122)(11则有以下几种检验问题:(1)当2221与均已知时,检验假设H0112:;(2)当1222但未知时,检验假设H0112:;(3)检验假设H021222:。miiXmX11,miiXXXmS122)(11对于检验问题(1),当2221与均已知时,1222mn也已知,且当H01成立时,统计量nmYXU2221~N(,)01即化为“一”的情形。对于给定的水平(01),(通常比较小),由PU{}查标准正态分布表可求得。如果u应拒绝假设H0;如果u,则不怀疑H0的真实性(接受H0)。对于检验问题(2),令nmnmmnSnSmYXTYX)2()1()1(22(2-67)可证当01H成立时)2(~nmtT。类似“二”的讨论.对于给定的10(通常比较小),由}{TP,查)2(nmt分布表可求得。因此计算T的观察值t,如果t,则表明小概率事件在一次试验中发生了,根据实际推断原理,应拒绝假设01H;如果t,则不怀疑01H的真实性(接受01H)。有时也称t为检验01H的拒绝域。对于检验问题(3),令22YXSSF(2-68)可证当02H成立时)11(~nmFF,。对于给定的(10)令2/}{1FP(2-69)2/}{2FP(2-70)由(2-69)、(2-70)式查)11(nmF,分布表可求得1、2,计算F的观察值,如果21FF或则拒绝02H,否则不怀疑02H的真实性。例5-25在漂白工艺中要考虑温度对针织品的断裂强力的影响,在70Co和80Co下分别作了八次试验,测得断裂强力数据如下:70Co:20.5,18.8,19.8,20.9,21.5,19.5,21.0,21.280Co:17.7,20.3,20.0,18.8,19.0,20.1,20.2,19.1记YX、分别表示70Co和80Co下的断裂强力,并假定)(~211,NX,)(~222,NY,试问温度对针织品的断裂强力有无影响)05.0(?解:依题意需检验假设2101:H,为此先考虑检验假设222102:H,这里8nm,经计算7/80.57/20.64.194.2022YXSSYX,,,于是由(2-68)式得07.180.5/20.6f,再由(2-70),查)77(,
本文标题:应用统计2-3
链接地址:https://www.777doc.com/doc-2420457 .html