您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 第八章假设检验《概率论与数理统计》西南交大峨眉校区.
第8章假设检验8.1基本概念与思想8.2单正态总体参数的假设检验8.3双正态总体参数的假设检验8.4分布拟合检验假设检验是统计推断的另一类重要问题,用来推断总体是否具有某种统计特性。如抽查一批产品,考察产品的合格率是否达到标准;抽查一批灯泡,考察灯泡的寿命是否服从指数分布等。解决这类问题的思路是,首先假设总体具有某种性质,以此给出其样本统计量应该具有的特征,然后依据样本观测值是否与这种假设相吻合,来推断假设是否成立。也就是“先提出假设,再根据样本对假设做出检验,判断假设是否成立”,这就是“假设检验”。1.引例8.1基本概念与思想例1:某厂生产一批产品共80件。按规定,次品率不超过1%才能出厂。今在其中任意抽取2件,发现有次品。问这批产品能否允许出厂?记次品率为p,“这批产品能否出厂”转化为根据抽样结果来判断假设“0.01p”是否成立.称此待检验的假设为原假设,记为0H,与原假设对立的假设称为备择假设,记为1H。本例的原假设与备择假设分别为01:0.01;:0.01HpHp例2:某电子元件的寿命(单位:小时)服从正态分布2(1000,)N。现在采用新的生产工艺,想检验在新工艺下该电子元件的寿命的均值与1000相比有无显著变化。设新工艺下生产的电子元件的寿命X仍服从正态分布,均值为,方差不变。从新工艺下生产的产品中抽取一组样本,问题转化为依据此样本检验假设0H:1000是否成立。两个例子的共同点是从样本出发去判断一个“假设”是否成立,这就是“假设检验”。关于总体参数的假设称为参数假设;其余的假设称为非参数假设,如关于总体分布类型的假设。例3:某车间用包装机包装糖果,包装出的每一袋的重量X(单位kg)服从正态分布2(0.5,0.015)N。为检验某日包装机是否正常,随机抽取9袋糖果,称得重量为:0.497,0.506,0.518,0.524,0.498,0.511,0.520,0.515,0.512如果标准差不变,问包装机工作是否正常?0010:0.5;:HH如果接受0H,认为包装机工作正常;如果拒绝0H,则接受1H,认为包装机工作不正常。分析:包装机是否正常工作,就是检验下面的假设:由于样本均值X是总体均值的无偏、一致估计,因此当0H为真时,X与00.5应该比较接近。如果0X很大,超出了能用随机抽样误差来解释的范围,就有理由怀疑0H的正确性,进而拒绝0H。当0H为真时,统计量0~(0,1)XUNn,因此当0H为真时,U的观测值u不应太大,若它太大,则拒绝0H。对于给定的较小的,2PUu例如取0.05,则0.0251.96u,又知0.015,9n,再算得0.511x,从而00.5110.52.20.0159xun因此2Uu是一个小概率事件,我们认为它在一次试验中不应该发生。如果它发生了,则认为生产不正常,从而拒绝0H。于是拒绝0H,即认为包装机工作不正常。0.0251.96u如果此列中通过抽样计算得样本均值为0.508x,仍取0.05,则00.5080.51.60.0159xun在以上检验中,当统计量的观测值2uu即其值落入22(,)(,)uu中时,拒绝0H。因此,称2uu为0H的拒绝域,一般记为2Ruuu。于是接受0H,即认为包装机工作正常。0.0251.96u此列中统计量U对检验起着关键作用,称之为检验统计量,并称该检验法为U检验法。可以看出:(1)假设检验的推理方法利用的是“小概率事件的实际不可能性原理”;(2)假设检验过程用到了反证法思想。(3)必须注意,这种有违“常规”的“矛盾”并不是逻辑上绝对不可能发生的,即不是逻辑上的矛盾。我们所用的反证法是基于“小概率事件的实际不可能性原理”的概率反证法。①根据问题要求,提出原假设0H及备择假设1H;③在显著性水平下,确定0H的拒绝域R,若检验统计量的观测值tR,则拒绝0H,否则接受0H。②在0H成立的条件下,选择检验统计量12(,,,)nTXXX并确定其分布;假设检验的一般步骤:2.假设检验可能犯的两类错误(1)第一类错误(2)第二类错误原假设0H事实上是假的,由于抽样的随机性,统计量的观测值没有落入拒绝域R,从而接受0H,即接受了错误的假设,这时犯了“纳伪”的错误。原假设0H事实上是真的,由于抽样的随机性,统计量的观测值落入了拒绝域R,从而拒绝了0H。这时犯了“弃真”的错误,即将正确的假设摒弃了。记犯第一类错误的概率不超过,则有简记为00=HPH拒绝。00PHH拒绝为真在实践中,通常取等号,即00=PHH拒绝为真在例3中2PUu,显著性水平就是犯第一类错误的概率。记犯第二类错误的概率不超过,则有在实践中通常取等号,即00=PHH接受不真。00PHH接受不真已有的研究表明,当样本容量n给定后,犯第一类错误的概率减小时,犯第二类错误的概率就会增大,要使它们同时都很小是不可能的。基于这种情况,统计学家奈曼和皮尔逊提出了一个原则,即在控制犯第一类错误的概率的前提下,使犯第二类错误的概率尽量小。在这种原则下,只需控制犯第一类错误的概率。这种假设检验问题称为显著性检验问题,犯第一类错误的概率称为显著性水平。3.单边检验例3中,0H的拒绝域为22(,)(,)Ruu,分别位于数轴两侧,把这类假设检验称为双边假设检验或双侧假设检验,简称双边检验或双侧检验。0010:,HH:除了双边检验外,有时还需要用到单边或单侧检验。以例3来说,如果有迹象表明“包装的糖果的平均重量不小于0.5kg”,问这种看法是否成立?即需要检验假设:0H成立时,选择检验统计量~(0,1)XUNn,则当0H成立即0时,0XX,进而有=XPUuPun0XXuunn0XXnn于是,若0Xun,则必有Xun,即上述推理表明,在原假设0H:0成立的条件下,0XPun,所以事件0Xun是小概率事件。如果抽样结果表明,统计量U的观测值满足0xun,即小概率事件发生了,则拒绝0H而接受1H;否则,接受0H。所以0XXPuPunn0H的拒绝域均为uu。因此,假设也常常写成后一种形式。由于其拒绝域uu在左侧,也称这类假设检验为左边或左侧检验。0010:,HH:综上所述,不论假设为0010:=,HH:还是为0010:,HH:类似地,右边检验为0010:=,HH:或记为4.如何提出假设例4:要求某种元件的平均使用寿命不得低于1000小时。今从某厂生产的这种元件中随机抽取25件,测得其寿命的平均值为980小时,已知该种元件寿命服从标准差为100的正态分布。在显著性水平0.05下,(1)从生产厂家的角度,确定这批元件是否合格;(2)从采购员的角度,确定这批元件是否合格。在假设检验中,原假设是要加以保护的假设,往往也是提出假设者希望接受的假设,没有充分的理由是不能拒绝的。因此立场不同,提出的原假设也不同,这时得出的结论可能大相径庭。解:设X表示元件使用寿命,则2~(,)XN。其中01000,选择检验统计量XUn,0H的拒绝域为uu,现在100,n25,x980,查附表4有0.05u1.645,则(1)厂家自然希望这批产品合格,因此提出如下假设0010:,HH:00.05980100011.64510025xun统计量的观测值没有落入拒绝域,接受0H,认为这批元件合格。其中100。选择检验统计量0XUn,按照前面的分析方法可得0H的拒绝域为uu,此时因为(2)采购员为了采购到的合格产品的可能性更大,当然尽可能认为这批产品不合格,就会提出如下假设0010:,HH:00.05980100011.64510025xun统计量的观测值没有落入拒绝域,接受0H,认为这批元件不合格。本例对于同一组数据,同一检验统计量的观测值,却因原假设不同,也就是看问题的角度不一样、侧重点不同、立场不同,而得到截然相反的结论。对于一个实际问题,选择哪一个为原假设,哪一个为备择假设是非常重要的。由于原假设是作为检验的前提提出来的,因而通常受到保护,要拒绝原假设必须有充分的理由,而备择假设是当原假设被拒绝后才能被接受,这就决定了原假设和备择假设不是处于对等的地位。将0H为真时拒绝0H的概率定为很小的概率,使得原假设不能被轻易拒绝,这就体现了保护原假设的思想。(1)将久已存在的状况作为原假设。比如某药厂生产了某种新药,他们声称新药的疗效1p好于旧药的疗效0p,一般将“10pp”作为原假设,而将“10pp”作为备择假设。(2)将后果更严重的错误作为第一类错误。比如在一般的刑事审判中,原假设往往是“被告无罪”,备择假设才是“被告有罪”,没有非常充足的证据是不能轻易推翻原假设的,否则就会造成冤假错案,这也符合现代司法观念“疑罪从无”。在实际应用中,通常从两个角度考虑:8.2单正态总体参数的假设检验1.均值的检验设总体2(,)XN,12,,,nXXX是从总体抽出的一组样本。本节在显著性水平下,讨论均值和方差的假设检验。设0是已知的数,下面分两种情况讨论。(1)方差2已知(2)方差2未知0H检验统计量0H为真时统计量的分布1H拒绝域0uu0uu0000XUn(0,1)N02||uu(1)方差2已知(U检验法)例1:已知某炼铁厂的铁水含碳量在正常情况下服从正态分布2(4.55,0.11)N,测得5炉铁水含碳量如下:4.28,4.40,4.42,4.35,4.37,如果标准差不变。是否可以认为:(1)铁水含碳量的平均值是否有显著变化?(2)铁水含碳量的平均值是否有显著降低?(取0.05)解:设X表示铁水含碳量,则2~(,0.11)XN,由题知04,0.11。方差2已知时,检验统计量为0(0,1)XUNn0H的拒绝域为2uu。由样本观测值计算得x4.364,因此当0.05时,查附表4得0.02521.96uu,所以04.3644.553.780.11/5xun0.0253.781.96uu则拒绝0H,接受1H,即可以认为铁水含碳量有显著变化。0010:4.55,:HH(1)提出假设0H的拒绝域为uu。根据样本观测值计算得当0.05时,查附表4得0.051.645uu,从而得04.3644.553.780.11/5xun0.053.781.645uuu所以拒绝0H,接受1H,即可以认为铁水含碳量显著降低。(2)提出假设0010:4.55,:HH0H检验统计量0H为真时统计量的分布1H拒绝域0(1)ttn0(1)ttn0000XTSn(1)tn02||(1)ttn(2)方差2未知(t检验法)例2:设某次考试的考生成绩服从正态分布,从中随机地抽取36位考生的成绩,算得平均成绩为66.5分,标准差为15分。问在显著性水平0.05下,是否可以认为这次考试全体考生的平均成绩为70分?并给出检验过程。解:设考生成绩为X,则2~(,)XN。提出假设0010:70,:HH由题知36n,66.5x,15s,检验统计量为0XTSn当0.05
本文标题:第八章假设检验《概率论与数理统计》西南交大峨眉校区.
链接地址:https://www.777doc.com/doc-2086099 .html