您好,欢迎访问三七文档
0第七章假设检验假设检验(hypothesistest)是统计推断的另一基本问题,它包括参数假设检验和非参数假设检验。所谓参数假设检验是对总体分布函数中的未知参数提出某种假设,然后利用样本提供的信息对所提出的假设进行检验并作出判断。而非参数假设检验是对总体分布函数形式或类型的假设进行检验。7.1假设检验的基本概念先看几个例子。例1随机抽取了26块被播撒过“硝化银”的云,检测其产生的降雨量是否多于未播撒过“硝化银”的云。取每块云降雨量的对数作为观测指标X,假设2(,)X,其中2未知,未播撒“硝化银”的云通常有04,现在我们想根据已有数据1226,,,XXX来判定4是否成立?例2某厂有一批产品,须经检验合格才能出厂。按规定,次品率不得超过%2。今从中任取10件发现有1件次品,问这批产品能否出厂?设这批产品的次品率是p,问题化为如何根据抽样结果判断假设02.0:0pH是否成立。例3由实践经验知,某建筑材料的抗断强度指标服从正态分布,现改变了该材料的生产配方并进行新的生产流程,从新材料中随机抽取100件,测其抗断强度,试问新材料的抗断强度指标是否仍服从正态分布?设新材料的抗断强度指标为X,则问题可转换为如何根据样本推断假设,~:20NXH是否成立。类似的问题还很多,其共同特点是根据来自总体的样本去判断某个假设0H是否成立,这就是所谓假设检验的问题。例1、例2是关于总体参数的假设检验,属于参数假设检验,例3是关于总体分布函数形式的假设检验,属于非参数假设检验。一、假设检验的基本思想现在通过一个简单的例子来说明。1例4袋中有黑白两种颜色的球共100个,甲说这里有95个白球,乙从袋中任取一个,发现是黑球,问甲的说法是否正确?我们可以先做假设0H:袋中确有95个白球,如果0H正确,那么从袋中任取一个球是黑球的概率只有0.05,概率很小。人们通常认为,在一次试验中,概率大的事件发生,而概率小的事件不发生。但现在乙做了一个实验,抽到了黑球,即小概率事件发生了,这是不合理现象,因此有理由怀疑假设0H的正确性,也就是说可以拒绝假设0H,即认为甲的说法不正确。如果乙从袋中任取一球,发现是白球,这说明在一次试验中小概率事件未发生,即没有发生不合理现象,因此有理由怀疑假设0H的正确性,也就是说不能拒绝假设0H,应认为甲的说法正确。假设检验的基本思想是带有某种概率性质的反证法。为了检验一个假设0H是否成立,首先假定这个假设0H成立,然后看由此会产生什么后果。如果样本观察值导致了一个不合理的现象出现,表明假设0H不成立,应该拒绝假设0H;如果样本观察值未导致不合理的现象发生,则认为假设0H成立,应该接受0H。假设检验中所谓“不合理”,并不是逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的一个原则——小概率事件在一次事件中几乎是不发生的。究竟概率小到什么程度才能当做“小概率事件”,显然,“小概率事件”的概率越小,否定假设0H就越有说服力。我们把这个概率值记作10,称为检验的显著性水平(significancelevel)。对于不同的实际问题,检验的显著性水平可以选取不同值,但一般应取为一个较小的数,通常取为一些标准值,如0.1,0.05或0.01。二、假设检验的两类错误当假设0H正确时,小概率事件也有可能发生,一旦小概率事件发生,我们会拒绝假设0H,因此犯了“弃真”的错误,称为第一类错误。犯第一类错误的概率恰好就是“小概率事件”发生的概率,即为真拒绝00|HHP(7.1.1)除此之外,还会有另一种情形,假设0H不真,但一次抽样检验结果,未发生不合理现象,这时我们会接受0H,因而犯了“取伪”的错误,称为第二类错误,2记为犯第二类错误的概率,即不真接受00|HHP(7.1.2)我们希望犯两类错误的概率都很小,但是,当样本容量n一定时,和不能同时都变小,即变小时,就变大;变小时,就变大。在实际问题中,一般总是控制犯第一类错误的概率,即给定检验的显著性水平,然后通过增大样本容量n来减小。检验的显著性水平如何给定呢?如果注重经济效益,可取小些,如1.0;如果既要考虑经济效益,又要考虑社会效益,一般取0.05。三、假设检验的一般步骤在假设检验问题中,把要检验的假设0H称为原假设(nullhypothesis),把原假设0H的对立面称为备择假设或对立假设(alternativehypothesis),记为1H。在确定原假设和备择假设时往往把有把握的、不能够轻易被否定的命题作为原假设0H,而把无把握的、不能够轻易肯定的命题作为备择假设1H。由假设检验的两类错误可知:原假设成立时被否定的概率是很小的,这说明在假设检验问题中,原假设是受到保护的。假设检验一般可按如下步骤进行:(1)充分考虑和利用已知的背景知识,提出原假设0H和备择假设1H。(2)构造检验统计量Z,并在0H成立的前提下确定Z的概率分布。(3)确定拒绝域形式,根据假设检验问题以及给定的水平和Z的分布,由为真拒绝00|HHP确定出拒绝域。(4)根据抽样得到的样本观察值和所得到的拒绝域,对假设0H作出拒绝或接受的判断。37.2单个正态总体参数的检验设总体2,~NX,nXXX,,,21是来自总体X的样本,X和2S分别是样本均值和样本方差。一、总体均值的检验检验假设0100:,:HH其中0为已知数。下面对方差2已知和未知两种情形予以讨论。1.方差2已知——u检验法当0H为真时,1,0~0NnXU(7.2.1)所以选取nXU0作为检验统计量。由于X是的无偏估计量,当0H成立时,U不应太大,当1H成立时,U有偏大的趋势,所以以拒绝域形式为0xukn,(k待定)对于给定的显著性水平,查标准正态分布表得2Zk,使2ZUP即得拒绝域为20Znxu(7.2.2)由样本观察值nxxx,,,21计算出U的观察值u,如果2Zu,则拒绝原假设0H,即认为总体均值和0有显著差异;如果2Zu,则接受0H,即认为4总体均值和0无显著差异。例1某车间生产钢丝,用X表示钢丝的折断力,由经验判断2,~NX,其中228,570;今换了一批材料,从性能上看估计折断力的方差2不会有什么变化(即仍有228),但不知折断力的均值和原先有无差别。先抽得样本,测得其折断力为:578572570568572570570572596584取05.0,试检验折断力均值有无变化?解(1)建立假设570:,570:100HH(2)选统计量1,0~0NnXU(0H成立时)(3)对于给定的显著性水平,确定k,使kUP(0H成立时)查正态分布表得96.1025.02ZZk,从而拒绝域为96.1u(4)由于64,20.5751012101iixx,所以96.106.20nxu故应拒绝0H,即认为折断力的均值发生了变化。SAS程序如下:dataexample10;inputzheduanli@@;cards;578572570568572570570572596584;procmeansnmeanstderr;varzheduanli;run程序运行结果为:5由结果可知数据的平均值为575.2.DATAexample11;N1=10;MEAN1=575.2;SD1=8;U=(MEAN1-570)/SQRT(SD1**2/N1);P=(1-PROBNORM(ABS(U)))*2;PUTUP;RUN;运行结果如下:u=2.0554804791p=0.0398326192由运行结果可知检验的p值为0.0398326192,小于检验的水平0.05,所以应该要拒绝原假设。2.方差2未知——t检验法当0H为真时,1~0ntnSXT(7.2.3)所以选取nSXT0作为检验统计量。由于X是的无偏估计量,2S是2的无偏估计量,当0H成立时,T不应太大,当1H成立时,T有偏大的趋势,所以拒绝域形式为0xtksn,(k待定)对于给定的显著性水平,查标准正态分布表得12ntk,使12ntTP即拒绝域为6120ntnsxt(7.2.4)由样本观察值nxxx,,,21计算出T的观察值t,如果12ntt,则拒绝0H,否则接受0H。例2高强度轻质材料越来越普及,导致高尔夫球杆的设计与制造也发生了革命性变化,由于所谓“弹簧效应”使得中空且瘦长的球杆能使得击球更远。将球杆与球相撞后分离速度与相撞前的速度之比定义为“球杆复原系数”X,通常假定为2,~NX,过去球杆的平均复原系数为00.82。现随机的选择了某家球杆制造商所造的15根球杆,并测得其球杆复原系数分别为:0.84110.81910.81820.81250.87500.85800.85320.84830.82760.79830.80420.87300.82820.83590.8660给定显著性水平为05.0,现在我们感兴趣的是:能否断言这批新球杆的复原系数已经不同于老球杆?解(1)建立假设001:0.82,:0.82HH(2)选统计量1~0ntnSXT(0H成立时)(3)对于给定的显著性水平,确定k,使kTP(0H成立时)查t分布表得0.0252(1)(14)2.1448ktnt,从而拒绝域为2.1448t。(4)由于00.8372,s=0.02456,0.82,15xn,所以02.722.1448xtsn故应拒绝0H,即认为新球杆与老球杆的“复原系数”存在显著差异。本例SAS程序如下:dataexample2;inputfuyuan@@;cards;0.84110.81910.81820.81250.87500.85800.85320.84830.82760.798370.80420.87300.82820.83590.8660;procttesth0=0.82alpha=0.05data=example2;varfuyuan;run;运行结果如下:由上述运行结果可知,检验的p值为0.0166,小于检验水平0.05,故应该拒绝原假设。二、总体方差2的检验——2检验法检验假设20212020:,:HH其中20为已知数。当0H成立时,1~11221202022nXXSnnii(7.2.5)所以选取20221Sn作为检验统计量。由于2S是2的无偏估计量,当0H成立时,2S应在20附近,当1H成立时,2有偏小或偏大的趋势,所以拒绝域形式为120221ksn或220221ksn(21,kk待定)查2分布表得81,12222211nknk使112222212nnP或即得拒绝域为112212022nsn或11222022nsn(7.2.6)由样本观察值nxxx,,,21计算出2的观察值,如果12212n或1222n,则拒绝域0H,即认为总方差2与20有显著差异;如果11222221nn则接受0H,即认为总体方差2与20无显著差异。例3一种自动填装机器用来给空瓶装入液态洗涤剂,为了保证填装效果,要求每瓶装入量的方差为0.01盎司,现从中随机的抽取了20瓶洗涤剂,并测得其样本方差为0.01。问这批洗涤剂装入量是否达标?(显著性水平05.0,假定每瓶装入的洗涤剂服从正态分布)解设每瓶装入的洗涤剂为X,假定2,~NX,其方差为0.01。该题需要检验总体的方差。(1)建立假设2
本文标题:第七章 假设检验
链接地址:https://www.777doc.com/doc-4049358 .html