您好,欢迎访问三七文档
假设检验第一节假设检验的基本原理第二节单个正态总体的假设检验第三节两个正态总体的假设检验第一节:假设检验的基本原理一、基本概念假设检验是统计推断的另一种重要形式,其任务是通过样本对未知的总体分布特征作出合理的推测。先对总体分布中的某些参数或对总体分布类型做某种假设,然后根据样本值做出接受还是拒绝所做假设的结论。这类问题为假设检验问题。假设检验参数假设检验:总体分布已知,检验关于未知参数的某个假设,包括:总体均值、均值差的检验;总体方差、方差比的检验等非参数假设检验:是指对随机变量X的分布函数表达式提出的假设作检验,以及随机变量X和Y之间的相关性和独立性等问题的假设检验参数假设检验非参数假设检验1.两个假设原假设(又称零假设):在统计中常把要检验的假设称为原假设,记为:H0备择假设(又称对立假设):在被拒绝时所接受的假设成为备择假设,记为H1双边假设H0:m=m0H1:m≠m0单边假设H0:m≤m0H1:mm0如何选择原假设和备择假设?注意:一般情况下(1)清楚地知道或足够的了解,不能轻易的推翻的假设,作为原假设(H0);(2)没有足够的了解,趋向于某结论,可能或希望成立的假设,作为备择假设(H1);但是,H0与H1的划分不是绝对的,有时,原假设的选定还要考虑数学上的处理方便。2.拒绝域与接受域拒绝域:使原假设被拒绝的样本观察值(x1,x2,…,xn)所组成的区域;接受域:保留原假设的样本观察值所组成的区域W记为拒绝域,记为接受域。如果根据样本值(x1,x2,…,xn)求出的检验统计值T,出现了(x1,x2,…,xn)∈W(小概率事件发生了),则拒绝H0,否则不能拒绝H0W3.两类错误第一类错误(弃真错误)——原假设H0为真,而检验结果为拒绝H0;记其概率为,即P{拒绝H0|H0为真}=第二类错误(受伪错误)——原假设H0不符合实际,而检验结果为接受H0;记其概率为,即P{接受H0|H0为假}=希望:犯两类错误的概率越小越好,但样本容量一定的前提下,不可能同时降低和。原则:保护原假设,即限制的前提下,使尽可能的小。检验水平注意:“接受H0”,并不意味着H0一定为真;“拒绝H0”,也不意味着H0一定不真。犯两类错误的概率:P{拒绝H0|H0为真}=P{接受H0|H0为假}=显著性水平为犯第一类错误的概率.H0为真实际情况决定拒绝H0接受H0H0不真第一类错误正确正确第二类错误4.P值在一个假设检验问题中,拒绝假设H0的最小显著性水平成为p值。利用p值和给定的显著性水平可以建立如下判断法则:若p值,则拒绝原假设H0;若p值,则保留原假设H0。如:双侧检验的P值/2/2Z拒绝H0拒绝H00临界值计算出的样本统计量计算出的样本统计量临界值1/2P值1/2P值参数的假设检验:已知总体的分布类型,对分布函数或密度函数中的某些参数提出假设,并检验。基本原则——小概率事件在一次试验中是不可能发的。思想:如果原假设成立,那么某个分布已知的统计量在某个区域内取值的概率应该较小,如果样本的观测数值落在这个小概率区域内,则原假设不正确,所以,拒绝原假设;否则,接受原假设。二、基本思想拒绝域检验水平(或显著性水平)根据实际问题的要求提出原假设H0和第一步:三假设检验的一般步骤备择假设H1,H0和H1是相互对立的.例如若H0:m=m0,则H1有以下三种情况:(1)H0:m=m0,H1:mm0(2)H0:m=m0,H1:mm0(3)H0:m=m0,H1:mm0其中(1)称为双边检验.其中(2),(3)称为单边检验.第二步:选取一个合适的检验统计量,并根据原假设H0和备择假设H1确定H0的拒绝域.在(1)中,22(,)uu2{}1Puu2{}Puu或为H0的拒绝域.则22(,)(,)uu而为H0的接受域.2u称为临界值.第三步:给定显著性水平,通常=0.05,0.01,0.10,0.001等第四步:由样本的观测值计算出检验统计量的具体值.第五步:作出判断.若计算结果在拒绝域内,则拒绝H0.否则就不拒绝H0.(拒绝域与接受域是互斥的,因而只要知道其中之一即可.)两点说明:1对于H0,给定不同的显著性水平,对应不同的拒绝域.012u22u32u32u22u12u1120.012.58u2220.051.96u3320.101.65u如果检验统计量u的值落入阴影中当给定3=0.10时,作出否定H0的结论当给定2=0.05时,作出接受H0的结论2不拒绝H0(或接受H0),并不是说不必再作进一步的检验就可以断然接受H0,即并不认为H0一定是正确的.拒绝H0比接受H0更有说服力.接受H0只是因为没有充足的理由拒绝H0才接受H0.取检验统计量单个正态总体的假设检验设总体X~N(m,2),X1,X2,...,Xn是取自总体的样本,和S2为样本均值和方差,为显著性水平.一当2已知时,均值m的检验(U检验)H0:m=m0H1:mm01(双边检验)0XUnm~N(0,1)若检验的假设是X0XUnm当H0成立时,对给定的,查正态分布表,使得于是得到H0的拒绝域为2{}Puu22(,)(,)uu这种检验法称为u检验法.()u,2(单边检验)若检验的假设是H0:m=m0H1:mm0当H0成立时,0XUnm~N(0,1)当H0成立时,u的值不应太大.而当H1成立时,u的值往往偏大.因此,P{uu}=于是得到H0的拒绝域为(,)u类似地,若检验的假设是H0:m=m0H1:mm0可得到H0的拒绝域为例1由经验知某零件的重量X~N(m,2),m=15,=0.05;技术革新后,抽出6个零件,测得重量为(单位:克)14.715.114.815.015.214.6,已知方差不变,试统计推断,平均重量是否仍为15克?(=0.05)解由题意可知:零件重量X~N(m,2),且技术革新前后的方差不变2=0.052,要求对均值进行检验,采用U检验法。假设H0:m=15;H1:m≠15构造U统计量,得U的0.05双侧分位数为96.1025.0u因为4.91.96,即观测值落在拒绝域内所以拒绝原假设。而样本均值为154.90.056xU故U统计量的观测值为14.9x0XTSnm~(1)tn2{||(1)},Pttn二当2未知时,均值m的检验(t检验)1(双边检验)H0:m=m0H1:mm0此时2未知,不能用0XUnm用当H0成立时,因此,对给定的,查t分布表,使0XTSnm22(,(1))((1),tntn)因此,H0的拒绝域为(这种检验法,称为t检验法.)2(单边检验)H0:m=m0H1:mm0可得到H0的拒绝域为(,(1))tn例2化工厂用自动包装机包装化肥,每包重量服从正态分布,额定重量为100公斤。某日开工后,为了确定包装机这天的工作是否正常,随机抽取9袋化肥,称得平均重量为99.978,均方差为1.212,能否认为这天的包装机工作正常?(=0.1)解由题意可知:化肥重量X~N(m,2),m0=100方差未知,要求对均值进行检验,采用T检验法。假设H0:m=100;H1:m≠100构造T统计量,得T的0.1双侧分位数为86.1)8(05.0t而因为0.05451.86,即观测值落在接受域内所以接受原假设,即可认为这天的包装机工作正常。99.9781000.05451.2129xTSnm故T统计量的观测值为样本均值、均方差为99.978,1.212xS三方差2的检验(2检验法)2220(1)nS2200H:2210H:2~(1)n设要检验的假设为(02为已知常数)2220(1)nS用检验统计量当H0成立时即222122{(1)(1)}1Pnn2200H:212(0,(1))n22((1),)n因此,对给定的,H0的拒绝域为类似地,若检验的假设是2210H:H0的拒绝域为2((1),)n若检验的假设是2200H:2210H:H0的拒绝域为21(0,(1))n例1某炼铁厂的铁水含碳量X在正常情况下服从正态分布,现对工艺进行了某些改进,从中抽取5炉铁水测得含碳量如下:4.421,4.052,4.357,4.287,4.683,据此是否可判断新工艺炼出的铁水含碳量的方差仍为0.1082(=0.05)?解这是一个均值未知,正态总体的方差检验,用2检验法由=0.05,得临界值假设222201:0.108;:0.108;HH220.9750.025(4)0.048,(4)11.142统计量的观测值为17.8543因为所以拒绝原假设即可判断新工艺炼出的铁水含碳量的方差不0.108217.854311.14设总体X~N(m1,12),而X1,X2,...,Xn为X的样本,总体Y~N(m2,22),而Y1,Y2,...,Ym为Y的样本,并且假定两个样本相互独立.记1iXXn22111iSXXn1iYYm22211iSYYm两个正态总体的比较一当12,22已知时,检验假设(U检验)012(0Hmm或:;012;Hmm:112Hmm:1120)Hmm:12()EXYmm()DXYDXDY2212nm因为,XY分别服从正态分布且相互独立221212(,)XYNnmmm所以因此,当H0:m1=m2成立时,用检验统计量2212()(0,1)XYUNnm对给定的,查正态表,使得从而得到H0的拒绝域为2{}Puu22(,)(,)uu(这种检验法称为u检验法)类似地,若检验的假设为012;Hmm:112Hmm:可得到H0的拒绝域为(,)u若检验的假设为012;Hmm:112Hmm:可得到H0的拒绝域为(,)u二当12=22=2未知时,检验假设H0:m1=m2H1:m1m2122212()()(1)(1)112XYTnSmSnmnmmm取检验统计量当H0:m1=m2成立时,即m1m2=0时,2212()(1)(1)112XYTnSmSnmnm~(2)tnm检验假设拒绝域H0:m1=m2H1:m1m2H0:m1=m2H1:m1m2H0:m1=m2H1:m1m2(这种检验法称为t检验法)某卷烟厂生产甲、乙两种香烟,分别对他们的尼古丁含量(单位:毫克)作了六次测定,获得样本观察值为:甲:25,28,23,26,29,22;乙:28,23,30,25,21,27.假定这两种烟的尼古丁含量都服从正态分布,且方差相等,试问这两种香烟的尼古丁平均含量有无显著差异(显著性水平α=0.05,)解:由题意,在方差相等时,设原假设为,备择假设为.构造检验统计量61125.56iiXx22111()7.51niiSxxn61125.66676iiYy22211()11.06671niiSyyn012:Huu112:Huu1212||(2)11wXYttnnSnn其中则,在显著性水平222112212(1)(1)9.2834(2)wnSnSSnn|25.525.6667|0.0948119.283466t0.05下,查表可得120.97512(2)(10)2.22810.0948tnnt即接受原假设,认为这两种香烟的尼古丁平均含量无显著差异.三方差的检验2122SFS22012,H:~(1,1)FFnm22112H:检验假设(m1,m2均未知,称为F检验法)取检验统计量由抽样
本文标题:假设检验
链接地址:https://www.777doc.com/doc-3909204 .html