您好,欢迎访问三七文档
第三节置信区间前面讨论了参数的点估计,它是用样本算出的一个值去估计未知参数.即点估计值仅仅是未知参数的一个近似值,它没有给出这个近似值的误差范围.例如,在估计某湖泊中鱼的数量的问题中,若根据一个实际样本,利用最大似然估计法估计出鱼的数量为50000条,这种估计结果使用起来把握不大.实际上,鱼的数量的真值可能大于50000条,也可能小于50000条.且可能偏差较大.若能给出一个估计区间,让我们能较大把握地(其程度可用概率来度量之)相信鱼的数量的真值被含在这个区间内,这样的估计显然更有实用价值.本节将要引入的另一类估计即为区间估计,在区间估计理论中,被广泛接受的一种观点是置信区间,它由奈曼(Neymann)于1934年提出的.分布图示★引言★置信区间的概念★寻求置信区间的方法★例1★例2★例3★10分布参数的区间估计★例4★单侧置信区间★例5★例6★内容小结★课堂练习★习题6-3内容要点一、置信区间的概念定义1设为总体分布的未知参数,nXXX,,,21是取自总体X的一个样本,对给定的数)10(1,若存在统计量),,,,(),,,,(2121nnXXXXXX使得,1}{P则称随机区间),(为的1双侧置信区间,称1为置信度,又分别称与为的双侧置信下限与双侧置信上限.注:1.置信度1的含义:在随机抽样中,若重复抽样多次,得到样本nXXX,,,21的多个样本值),,,(21nxxx,对应每个样本值都确定了一个置信区间),(,每个这样的区间要么包含了的真值,要么不包含的真值.根据伯努利大数定理,当抽样次数充分大时,这些区间中包含的真值的频率接近于置信度(即概率)1,即在这些区间中包含的真值的区间大约有)%1(100个,不包含的真值的区间大约有%100个.例如,若令95.01,重复抽样100次,则其中大约有95个区间包含的真值,大约有5个区间不包含的真值.2.置信区间),(也是对未知参数的一种估计,区间的长度意味着误差,故区间估计与点估计是互补的两种参数估计.3.置信度与估计精度是一对矛盾.置信度1越大,置信区间),(包含的真值的概率就越大,但区间),(的长度就越大,对未知参数的估计精度就越差.反之,对参数的估计精度越高,置信区间),(长度就越小,),(包含的真值的概率就越低,置信度1越小.一般准则是:在保证置信度的条件下尽可能提高估计精度.二、寻求置信区间的方法寻求置信区间的基本思想:在点估计的基础上,构造合适的函数,并针对给定的置信度导出置信区间.一般步骤:(1)选取未知参数的某个较优估计量ˆ;(2)围绕ˆ构造一个依赖于样本与参数的函数);,,,,(21nXXXuu(3)对给定的置信水平1,确定1与2,使,1}{21uP通常可选取满足2}{}{21uPuP的1与2,在常用分布情况下,这可由分位数表查得;(4)对不等式作恒等变形化后为1}{P,则),(就是的置信度为1的双侧置信区间。三、(0—1)分布参数的置信区间考虑(0—1)分布情形,设其总体X的分布率为),10(,1}0{,}1{ppXPpXP现求p的置信度为1置信区间.已知(0—1)分布的均值和方差分别为),1()(,)(ppXDpXE设nXXX,,,21是总体X的一个样本,由中心极限定理知,当n充分大时,npppXnXDXEXu/)1(/)()(近似服从)1,0(N分布,对给定的置信度1,则有,1/)1(2/unpppXP经不等式变形得,1}0{2cbpapP其中.)(,)(2,)(222/22/XncuXnbuna解式中不等式得,1}{21pppP其中).4(21),4(212221acbbapacbbap于是),(21pp可作为p的置信度为1的置信区间.四、单侧置信区间前面讨论的置信区间),(称为双侧置信区间,但在有些实际问题中只要考虑选取满足}{1uP或}{2uP的1与2,对不等式作恒等变形后化为1}{P或1}{P从而得到形如),(或),(的置信区间.例如,对产品设备、电子元件等来说,我们关心的是平均寿命的置信下限,而在讨论产品的废品率时,我们感兴趣的是其置信上限.于是我们引入单侧置信区间.定义设为总体分布的未知参数,nXXX,,,21是取自总体X的一个样本,对给定的数)10(1,若存在统计量),,,,(21nXXX满足,1}{P则称),(为的置信度为1的单侧置信区间,称为的单侧置信下限;若存在统计量),,,,(21nXXX满足,1}{P则称),(为的置信度为1的单侧置信区间,称为的单侧置信上限.例题选讲寻求置信区间的方法例1(E01)设总体22),,(~NX为已知,为未知,设nXXX,,,21是来自X的样本,求的置信水平为1的置信区间.解已知X是的无偏估计,且),1,0(~/NnX而)1,0(N不依赖于任何未知参数.按标准正态分布的双侧分位数的定义,有,1/2/unXP即.12//unXunXPn这样,就得到了的一个罡信水平为1的置信区间,,2//unXunXn常写成.2/unX若取,05.0即,95.01及,16,1n查表得,96.1025.02/uu则得到一个置信水平为0.95的置信区间).49.0(X若由一个样本值得样本均值的观察值,20.5x则进一步得到一个置信水平为0.95的置信区间).69.5,71.4()49.020.5(这个区间的含义是:若反复抽样多次,每个样本值均确定一个区间,在这些区间中,包含的约占95%,或者说该区间属于包含的区间的可信程度为95%.例2设总体),8,(~NX为未知参数,361,,XX是取自总体X的简单随机样本,如果以区间)1,1(XX作为的置信区间,那么置信度是多少?解),,(~2NX所以.92,368,,(~2NNnNX从而),1,0(~3/2NX依题意,1}11{XXP即2323}11{XP12321)121.2(2,1966.0所求的置信度为96.6%.例3设总体X的密度为,0,001);(xxexfx未知参数nXX,,,01为取自X的样本.(1)试证);2(~22nXnW(2)试求的1置信区间.解(1)记,2XY设Y的分布函数与密函数分别为)(yG与),(yg则}{)(yYPyG}2{yXPyFyXP2}2{这里,0,00,1)(/xxexFx于是,0,00,1)(2/yyeyGy,0,00,21)(2/yyeygy即),2(~2Y从而),2(~22iX.,,1ni又由2分布的可加性得),2(~221nXini而,22211XnXXniiini故).2(~22nXn(2)由上节例7知,X是的最大似然估计,从X出发考虑,2XnW由(1)知W的分布只依赖于样本容量,n即),2(~22nXnW给定的,1由)2({22/1nP.1)}2(222/nXn经不等式变形得,12)2(222/122/XnnXnP于是,所求置信区间为.2,)2(222/122/XnnXn(0—1)分布参数的置信区间例4(E02)设抽自一大批产品的100个样品中,得一级品60个,求这批产品的一级品率p的置信水平为0.95的置信区间.解一级品率p是10分布的参数,此处,100n,6.0100/60x,95.01,025.02/,96.12/u现按上述方法来求p的置信区间,其中,84.10322/una,84.123)2(22/uxnb.362xnc于是,50.01p,69.02p故得p的一个置信水平为0.95的近似置信区间为).69.0,50.0(单侧置信区间例5(E03)从一批灯泡中随机地抽取5只作寿命试验,其寿命如下(单位:h)10501100112012501280已知这批灯泡寿命),,(~2NX求平均寿命的置信度为95%的单侧置信下限.解),1(~/ntnSXT对于给定的置信度,1有,1)1(/ntnSXP即,1)1(nSntXP可得的置信度为1的单侧置信下限为,)1(nSntX由所得数据计算,有,1160x,57.99s,5n.05.0查表得,14.2)4(05.0t所以的置信度为95%的置信下限为,56.1064)1(nsntx也就是说,该批灯泡一平均寿命至少在1064.56h以上,可靠程度为95%.例6假设总体),,(~2NX从总体X中抽取容量为10的一个样本,算得样本均值,3.41x样本标准差05.1S,求未知参数的置信水平为0.95的单侧置信区间的下限.解由题设知),1(~/ntnSX即),9(~10/tSX令,95.01)9(10/tSXP即,95.0)9(105.0.0tSXP故置信水平为0.95的单侧置信区间下限为.84.403831.11005.13.41课堂练习1.为考虑某种香烟的尼古丁含量(以mg计),抽取了8支香烟并测得尼古丁的平均含量为.26.0x设该香烟尼古丁含量)3.2,(~NX.试求的单侧置信上限,置信度为0.95.
本文标题:03第三节置信区间
链接地址:https://www.777doc.com/doc-3117649 .html