您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 关于置信区间与假设检验的研究
关于置信区间与假设检验的研究摘要:关于置信区间与假设检验的问题主要从以下几个方面进行研究:定义,解决方法,在实际问题中的应用以及二者的区别与联系等。其中引入了许多数理统计中的思想,对解决实际问题有很大帮助。关键词:置信区间;假设检验;正态总体AboutconfidenceintervalandhypothesistestresearchAbstract:Aboutconfidenceintervalandhypothesistestingproblemsmainlyfromthefollowingaspects:definition,thesolutionactualproblem,intheapplicationandthedifferenceandrelationship,etc.Theintroducedmanymathematicalstatisticsofthethought,tosolvepracticalproblemsareofgreathelp.Keywords:confidenceinterval;hypothesistesting;normalpopulation一.引言置信区间与假设检验是统计推断的两类重要问题,在解决实际问题时都有着广泛的应用,二者既有区别又有联系,本文就置信区间与假设检验这两个问题进行探究,从而了解二者如何解决统计方面的问题,并简单归纳总结二者的区别与联系。二.研究问题及成果1置信区间1.1定义(注:置信区间的长度𝜽̅−𝜽反映了估计精度,𝜽̅−𝜽越小,估计精度越高;反映了估计的可靠度,越小,越可靠,越小,1-越大,估计的可靠度越高,但这时,𝜽̅−𝜽往往增大,因而估计精度降低;确定后,置信区间的选取方法不唯一,常选最小的一个)表示(如图a所示),(a)1.2利用枢轴量法求置信区间○1是待估参数𝛍和统计量𝑿的函数○2不含其他未知函数○3服从与未知参数无关的已知分布服从以上三条性质的量Q称为枢轴量(或主元)利用枢轴量法求置信区间的步骤:○1根据待估参数构造枢轴量Q,一般可由未知参数的极大似然估计量改造得到○2对于给定的置信水平1-𝛂,利用枢轴量Q的分布的上分位点求出常数a,b,使(,比如取a,b分别为Q的上1-𝛂/𝟐和上𝛂/𝟐分位点估计的精度最高。)○3利用不等式的恒等变形,将○2中不等式变形即可得到置信区间1.31.3.1(1)○1方差枢轴量Q=~,则置信度为1-𝛂的置信区间为因为,且所以由有(见图b)图(b)标准正态分布的双侧𝛂分位点再由置信区间定义可知,即为所求均值𝛍的置信度为1-𝛂的置信区间,常写成例:已知某种灯泡的寿命X(单位:小时)服从正态分布N(μ,8).现从这批灯泡中取10个,测得其寿命分别为1050110010801120120012501040113013001200若𝛂=𝟎.𝟎𝟓,试求期望𝛍的置信区间。解:由样本得𝑿=1147,n=10,𝛂=0.05,查表得𝒛𝛂/𝟐=𝒛𝟎.𝟎𝟓=1.96.由于𝝈𝟐已知,故𝛍的置信区间为,即1147𝟏.𝟕𝟓−+即(1145.25,1148.75)为所求置信区间○2方差由于𝝈𝟐未知,故考虑到𝑺𝟐是𝝈𝟐的无偏估计,将中的,则,(参见图c)图(c)t分布的双侧𝛂分位点即例.由式(2)方差𝝈𝟐的置信区间○1均值𝛍已知,取枢轴量Q=∑(𝑿𝒊−𝝁𝝈)𝟐𝒏𝒊=𝟏~𝛘𝟐(n)由概率P[𝛘𝟐𝟏−𝜶𝟐(n)∑(𝑿𝒊−𝝁)𝟐𝒏𝒊=𝟏𝝈𝟐𝛘𝟐𝜶𝟐(𝒏)]1-𝛂得2的置信度为1-𝛂得𝝈𝟐的置信度为1-𝛂的置信区间为[∑(𝑿𝒊−𝝁)𝟐𝒏𝒊=𝟏𝛘𝟐𝜶𝟐(𝒏),∑(𝑿𝒊−𝝁)𝟐𝒏𝒊=𝟏𝛘𝟐𝟏−𝜶𝟐(𝐧)]○2均值𝛍未知因为,,,即得(参见图d)图(d)𝝌𝟐分布的双侧𝛂分位点例.求例3中1.3.2(𝑿𝟏,𝑿𝟐,…𝑿𝐧)为取自总体N(𝝁𝟏,𝝈𝟏𝟐)的样本,(𝒀𝟏,𝒀𝟐,…𝒀𝐧)为取自总体N(𝝁𝟐,𝝈𝟐𝟐)的样本,𝑿,𝑺𝟏𝟐;𝒀,𝑺𝟐𝟐分别表示两样本的均值与方差,置信度为1-𝛂(1)○1或,取其○2均为未知,但此时取○3均为未知,但m,n50则𝝈𝟏𝟐𝐧+𝝈𝟐𝟐𝐦≈𝑺𝟏𝟐𝐧+𝑺𝟐𝟐𝐦,推出(𝑿−𝒀)−(𝝁𝟏−𝝁𝟐)√𝑺𝟏𝟐𝐧+𝑺𝟐𝟐𝐦~N(0,1)因为𝑿,𝒀相互独立,因此𝝁𝟏−𝝁𝟐的置信区间为[(𝑿−𝒀)+𝒛𝜶𝟐√𝑺𝟏𝟐𝐧+𝑺𝟐𝟐𝐦]○4均为未知,但n=m令𝐙𝒊=𝑿𝒊=𝒀𝒊,i=1,2…,n,可以将它们看成来自正态总体Z~N(𝝁𝟏+𝝁𝟐,𝝈𝟏𝟐+𝝈𝟐𝟐)的样本𝒁=𝑿−𝒀,𝑺𝒁𝟐=𝟏𝒏−𝟏∑[(𝑿𝒊−𝒀𝒊)−(𝑿−𝒀)]𝟐𝒏𝒊=𝟏仿单个正态总体公式[𝑿−𝒕𝜶𝟐(𝒏−𝟏)𝑺√𝒏,𝑿+𝒕𝜶𝟐(𝒏−𝟏)𝑺√𝒏]此时𝝁𝟏−𝝁𝟐的置信区间为[(𝑿−𝒀)+𝒕𝜶𝟐(𝒏−𝟏)𝑺𝒁√𝒏](2)在下,即1.4非正态总体均值的区间估计若总体X的分布未知,但样本容量很大,由中心极限定理,可近似地视X~𝐍(𝛍,𝝈𝟐𝒏)若𝝈𝟐已知,则𝛍的置信度为1-𝛂的置信区间可取为𝑿+𝐳𝜶𝟐𝝈√𝒏若𝝈𝟐未知,则𝛍的置信度为1-𝛂的置信区间可取为𝑿+𝐭𝜶𝟐𝑺√𝒏1.5例:2假设检验2.1定义假设检验是推论统计的重要内容,是先对总体的未知数量特征作出某种假设,然后抽取样本,利用样本信息对假设的正确性进行判断的过程。2.2基本思想小概率反证法思想。小概率思想是指小概率事件(P0.01或P0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设成立。2.3特点第一,假设检验采用逻辑上的反证法,即为了检验一个假设是否成立,首先假设它是真的,然后对样本进行观察,如果发现出现了不合理现象,则可以认为假设是不合理的,拒绝假设。否则可以认为假设是合理的,接受假设。第二,假设检验采用的反证法带有概率性质。所谓假设的不合理不是绝对的,而是基于实践中广泛采用的小概率事件几乎不可能发生的原则。至于事件的概率小到什么程度才算是小概率事件,并没有统一的界定标准,而是必须根据具体问题而定。如果一旦判断失误,错误地拒绝原假设会造成巨大损失,那么拒绝原假设的概率就应定的小一些;如果一旦判断失误,错误地接受原假设会造成巨大损失,那么拒绝原假设的概率就应定的大一些。2.4原假设和备择假设假设检验中,我们称作为检验对象的待检验假设为原假设或零假设,用H0表示。原假设的对立假设称为备择假设或备选假设,用H1表示。2.5两类错误第一类错误是原假设H0为真时,检验结果把它当成不真而拒绝了。犯这种错误的概率用α表示,也称作α错误或弃真错误。第二类错误是原假设H0不为真时,检验结果把它当成真而接受了。犯这种错误的概率用β表示,也称作β错误或取伪错误2.6显著性检验2.7双侧检验和单侧检验根据假设的形式不同,假设检验可以分为双侧假设检验和单侧假设检验。若原假设是总体参数等于某一数值,如H0:X=X0,即备择假设H1:X≠X0,那么只要X<X0和X>X0二者中有一个成立,就可以否定原假设。这种假设检验称为双侧检验。若原假设是总体参数大于等于或小于等于某一数值,如H0:X≥X0(即H1:X<X0);或H0:X≤X0(即H1:X>X0),那么对于前者当X<X0时,对于后者当X>X0时,可以否定原假设。这种假设检验称为单侧检验。可以分为左侧检验和右侧检验。2.8假设检验的步骤○1根据研究需要提出原假设H0和备择假设H1○2确定适当的检验统计量○3确定显著性水平α和临界值及拒绝域○4根据样本数据计算检验统计量的值○5将检验统计量值与临界值比较,作出拒绝或接受原假设的决策2.92.9.1(1)当原假设𝑯𝟎:𝛍=𝝁𝟎成立时有𝑿−𝝁𝟎𝝈√𝒏⁄~N(0,1)所以P{|𝑿−𝝁𝟎𝝈√𝒏⁄|≥𝒁𝜶𝟐⁄}=𝛂即P{|𝑿−𝝁𝟎|≥𝒁𝜶𝟐⁄∙(𝝈√𝒏⁄)}=𝛂所以拒绝域为|𝑿−𝝁𝟎|≥𝒁𝜶𝟐⁄∙(𝝈√𝒏⁄)即利用统计量Z=𝑿−𝝁𝟎𝝈√𝒏⁄来确定拒绝域(2)根据定理𝑿−𝝁𝟎𝑺√𝒏⁄~𝒕(𝐧−𝟏)于是当原假设𝑯𝟎:𝛍=𝝁𝟎成立时有𝑿−𝝁𝟎𝑺√𝒏⁄~𝒕(𝐧−𝟏)所以P{|𝑿−𝝁𝟎𝑺√𝒏⁄|≥𝒕(𝐧−𝟏)(𝜶𝟐)}=𝜶所以拒绝域为|𝑿−𝝁𝟎|≥𝑺√𝒏⋅𝒕(𝐧−𝟏)(𝜶𝟐)以上检验法叫t检验法例:用某仪器间接测量温度,重复5次,测的结果分别为1250°1265°1245°1260°1275°设测量值X服从正态分布,水平𝛂=0.05.问是否有理由认为该仪器测量值大于1277°(真实值)解:𝑯𝒐:𝛍≤𝛍𝒐=1277,𝑯𝟏:𝛍1227.因方差未知,用t检验法,这时拒绝域𝑿−𝝁𝟎𝑺√𝒏⁄≥𝒕𝜶(n-1)其中n=5,𝒕𝜶(n-1)=𝒕𝟎.𝟎𝟓(4)=2.1384.由样本得𝑿=1259,𝑺𝟐=142.5代入可得𝒕𝒐≈-3.3722.1348因此接受𝑯𝒐,即认为测量值不大于1277°2.9.2设两个总体X~N(μ1,σ12),Y~N(μ2,σ22)相互独立,(X1,X2,…,Xn1)与(Y1,Y2,…,Yn2)是分别来自X与Y的两个样本.样本均值分别为:,,样本方差分别为:,.方差σ12、σ22未知,但σ12=σ22.选用统计量,例:解:2.9.3例:2.102.10.1例:2.10.2得检验问题的拒绝域为33.1区别○1区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验以假设总体参数值为基准,不仅有双侧检验也有单侧检验;○2区间估计立足于大概率,通常以较大的把握程度(置信水平)1-α去保证总体参数的置信区间。而假设检验立足于小概率,通常是给定很小的显著性水平α去检验对总体参数的先验假设是否成立。3.2联系○1区间估计与假设检验都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。○2对同一问题的参数进行推断,二者使用同一样本、同一统计量、同一分布,因而二者可以相互转换。区间估计问题可以转换成假设问题,假设问题也可以转换成区间估计问题。区间估计中的置信区间对应于假设检验中的接受区域,置信区间以外的区域就是假设检验中的拒绝域。3结束语以上对置信区间与假设检验问题所进行的研究是基于数理统计的思想,置信区间与假设检验问题在实际应用中广泛存在,因此对这两个问题进行深入探究具有重要的现实意义。参考文献[1]盛骤.概率论与数理统计(第五版)[M].北京:高等教育出版社,2010:156~169,174~190[2]上海交通大学数学系.概率论与数理统计(第二版)[M].北京:科学出版社,2011:156~190
本文标题:关于置信区间与假设检验的研究
链接地址:https://www.777doc.com/doc-1788526 .html