您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 企业财务 > 第八章 第三节 区间估计
概率统计问题的引出第三节区间估计在参数的点估计中用样本构造一个估计量,用去估计,这仅仅是解决了一个求未知参数的一个“近似值”问题,而没有解决“近似值”的精确程度问题,即没有给出这个近似值的误差范围和估计的可信程度。ˆˆ在参数的区间估计中则要用样本去给出未知参数的一个大致的范围,并使未知参数在其中有指定的概率。概率统计具体:若估计参数为,要考虑估计量落在的可能性有多大。ˆˆ?)ˆ(P即求,若给定了可能的值,则就可以求出它的可能范围。在估计湖中鱼数的问题中,若已知得到鱼数N的极大似然估计为1000条。而实际上N的真值可能大于1000条,也可能小于1000条。则在区间估计中就可以给出一个区间,在此区间内合理地相信N的真值位于其中。这样就可对鱼数的估计更有把握.例如:概率统计希望确定一个区间,使得在该区间内能以比较高的可靠程度相信它包含未知参数的真值。[]而这“可靠程度”是用概率来度量的,称为置信概率、置信度或置信水平.习惯上把置信水平记作1,这里是一个很小的正数。称该区间为置信区间。湖中鱼数的真值故所讨论的问题是:概率统计一.置信区间定义:设总体X的分布函数含有一个未知参数,),(xF和12(,)nxxx12(,,)nxxx满足:,ˆ()1P12,nXXX(01)对于给定的值,若由样本确定的两个统计量:(,)ˆ1是的置信度为的置信区间,1和为置信度为的双侧置信区间的置信下限和置信上限.1称为置信度或置信概率。则称随机区间概率统计注:定义的含义是指:在反复抽样多次(各种得到的样本容量相等,均为n),每个样本值确定一个区间,每个这样的区间要么包含的真值,要么不包含的真值,按贝努力大数定理可知在这么多的区间中包含真值的约占不包含真值的仅占(,))%1(100100%▲▲对置信区间有两个要求:(,)大的可能被包含在该区间内,即要求:一是要求以很{}P尽可能大.二是要求估计的精度要尽可能的高,即要求区间尽可能短。可靠度与精度是一对矛盾,一般是在保证可靠度的条件下尽可能提高精度.概率统计正态随机变量情形的区间估计.给定置信度,求置信区间.1讨论的问题:讨论的对象:二.正态总体均值的区间估计1.单各正态总体情形2(,)N问题:设X1,…Xn是取自的样本,2,XS2(,)N求:参数的置信度为的置信区间.1解:(1).当方差已知的情形2选的点估计(无偏估计)为X寻找未知参数的一个良好估计~N(0,1),XUn且统计量而且是样本的均值与方差,给定置信度1概率统计U不依赖于任何未知参数。现对于给定的置信水平(大概率),根据U的分布,确定一个区间,使得U取值于该区间的概率为11故对于给定的置信水平,按照标准正态分布的分位点的定义有:2{||}1XPzn从中解得:概率统计22{}1PXzXznn1于是所求的置信度为置信区间为:22(,)XzXznn也可简记为:2()Xzn概率统计例1.某实验室测量铝的比重16次,得平均值2.705X,设总体2~(,0.029)XN(高斯已证明测量误差是服从正态分布)求:的95%的置信区间.解:195%5%,0.050.02522zzz(10.025)1.96u20.0291.960.01416zn由已知:查正态分布表得:0.025(()10.0250.975)z得:取统计量:~(0,1)XnN概率统计(2.7050.014,2.7050.014)(2.691,2.719)即用来估计值的可靠程度达到95%的区间范围是(2.691,2.719)705.2X(2).方差未知的情形2用去代替得统计量:2s2~(1)Xtnsn它是不依赖于任何未知参数的.95%从而的的置信区间为:2未知,但考虑到样本方差是的无偏估计,2概率统计2{||(1)}1XPtnSn即:从中解得:22{(1)(1)}1SSPXtnXtnnn22[(1),(1)]SSXtnXtnnn1于是所求的置信度为置信区间为:概率统计例2.确定某种溶液的化学浓度,现任取4个样品,测得样本均值为8.34%,X样本标准方差为:%03.0s现溶液的化学浓度近似求:的置信度为95%的置信区间解:195%5%0.0252(1)(3)tnt%0477.01824.3403.0)1(2ntns由已知:查t分布表得:得:95%从而的的置信区间为:(8.2923%,8.3877%)3.1824取统计量:~(1)Xsntn服从正态分布概率统计2.两个正态总体的情形221122(,),(,)NN问题:nXXX,,21是来自第一个总体211(,)N的样本,nYYY21,是来自第二个总体222(,)N的样本,它们相互独立,又设,XY分别是两个总体的样本均值;求:两个总体均值差的置信区间.122212,ss1分别是两个总体的样本方差。给定置信度为解:2212(1).,均为已知时概率统计2111~(,),XNn2222~(,),YNn故有:22121212~(,)XYNnn所以得统计量:12221212()~(0,1)XYNnn,XY12,分别为的无偏估计XY12是的无偏估计又由的独立性以及已知条件可得:,XY概率统计2221212()XYznn(2).均为未知时2212,同单个总体在方差未知的情形下用代替的构思2s2相同,可以得到当均很大时(一般大于50)21,nn的一个置信度为的近似置信区间:1212221212()ssXYznn1于是所求的置信度为置信区间为:12概率统计22212(3).未知时同单个总体方差未知的情形类似(又因)22221121212()~(2)11wXYtnnsnn1212211((2))wXYtnnsnn其中22112212(1)(1),2wnsnssnn2wwss得统计量:1于是所求的置信度为置信区间为:12概率统计例3.分别用金球和铂球测定引力常数(单位:)2131110skgm设测定值总体为均为未知.22(,),,N(1)用金球测定观察值为:6.683,6.681,6.676,6.678,6.679,6.672(2)用铂球测定观察值为:6.661,6.661,6.667,6.667,6.667,6.6641.分别就(1),(2)两种情况求的置信度为0.9的置信区间2.若设用金球和用铂球测定时测定值总体的方差相等,求两个测定值总体均值差的置信度为0.9的置信区间.概率统计解:在(1)中:40.0696.678,6X11(0.0003)0.0038761S0.112(1)stnn0.003872.0150.0036(0.03,0.003)(6.675,6.681)XX用6.678作为引力常数的估计值的可靠程度为90%的区间是(6.675,6.681)1.10.9又即:0.120.00387(5)6t于是所求的置信度为90%置信区间为:取统计量:~(1)Xsntn概率统计在(2)中664.6532.33Y003.0)00036.0(1512S10.9,0.1又20.1220.003(1)(4)5stntn0.0032.13180.00282.236(0.028,0.0028)(6.661,6.667)YY于是所求的置信度为90%置信区间为:用6.664作为引力常数的估计值的可靠程度为90%的区间是(6.661,6.667)概率统计两个测定值总体的方差相等但又未知,12现要求的置信区间,可依公式计算:014.0664.6678.6YX0.10.052(652)(9)1.8331tt11(61)[(0.0003)](51)[(0.000036)]6151652ws0.00003730.006110.366670.6055652.概率统计1212211((2))wXYtnnsnn注:于是所求的置信度为0.9的置信区间为:12(0.01,0.02)一般,若的置信区间包含零,则可认为这两个总体的均值没有显著差别;若下限大于零,则可认为比大。1212即用0.014作为的估计值的可靠程度达到1290%的区间是(0.01,0.02)概率统计问题:求:方差的置信区间.2222(1)~(1)nSn解:是不依赖于任何未知参数的。三.正态总体方差的区间估计1.单个正态总体的情形2(,)N设总体未知。2,2~(,),XN本方差,给定置信度112,,nXXX2是总体X的一个样本,是样22S是的无偏估计,且统计量:概率统计2221222(1){(1)(1)}1nSPnn2故对于给定的置信水平,按照分布的上分位点的定义有:2222(1){||(1)}1nsPn从中解得:1于是所求的置信度为置信区间为2:概率统计2222122(1)(1)(,)(1)(1)nsnsnn标准差的一个置信度为的置信区间:12212211(,)(1)(1)nsnsnn1于是所求的置信度为置信区间为2:概率统计例4.求例3中的(1),(2)两种情况下,的置信度为0.9的置信区间.2解:在(1)中21(1)(61)(0.0003)0.000361ns220.10.052(61)(5)11.071220.10.9512(61)(5)1.145的置信度为0.9的置信区间为:20.00030.0003(,)(0.0000271,0.000262)11.0711.145542.7110,2.6210()(1)用金球测定观察值为:6.683,6.681,6.676,6.678,6.679,6.672取统计量:222(1)~(1)nSn概率统计0.0000360.000036(,)(0.0000038,0.0000506)9.4880.7112(1)1(51)(0.00036)0.0003651ns220.10.052(51)(4)9.488在(2)中220.10.9512(51)(4)0.711的置信度为0.9的置信区间为:2(2)用铂球测定观察值为:6.661,6.661,6.667,6.667,6.667,6.664653.810,5.0610()取统计量:222(1)~(1)nSn概率统计2.两个正态总体的情形221122(,),(,)NN问题:nXXX21,来自的样本,211(,)NnYYY21,222(,)N来自的样本,它们相互独立。求:两个总体方差比的置信区间.2122解题思路同单个总体情况类似2211211(1)~(1)nsn分别是两个总体的样本方差与2212,;ss12,样本均值,且样本均值均为未知,给定置信1度解:概率统计)1(~)1(2222222nsn且这两个统计量是相互独立的。由F分布的定义得统计量:2112211211122222222222(1)(1)~(1,1)(1)(1)nssnFnnsnsn是不依赖于任何未知参数的。2211211(1
本文标题:第八章 第三节 区间估计
链接地址:https://www.777doc.com/doc-5864558 .html