您好,欢迎访问三七文档
高等院校非数学类本科数学课程——概率论与数理统计大学数学(四)第17讲区间估计脚本编写:肖庆丰教案制作:肖庆丰第七章参数估计理解总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计算。了解卡方分布、t分布和F分布的定义及性质,了解分布分位数的概念并会查表计算。了解正态总体的某些常用统计量的分布。理解点估计的概念。掌握矩估计法和极大似然估计法。了解估计量的评选标准(无偏性、有效性、一致性)。理解区间估计的概念。会求单个正态总体的均值和方差的置信区间。了解两个正态总体的均值差和方差比的置信区间。第七章参数估计第四节区间估计一、区间估计的方法与步骤二、正态总体均值的区间估计三、正态总体方差的区间估计四、两个正态总体均值差的区间估计五、两个正态总体方差比的区间估计对一个未知量,人们在测量或计算时,常不以得到近似值为满足,还需估计误差,即要求知道近似值的精确程度(亦即所求真值所在的范围).类似地,对于未知参数q,除了求出它的点估计外,还希望估计出一个范围,并希望知道这个范围包含参数q真值的可信程度.这样的范围通常以区间的形式给出,同时还给出此区间包含参数q真值的可信程度.这种形式的估计称为区间估计.qˆ一、区间估计的方法与步骤置信区间设总体X的分布函数F(x;q)含有一个未知参数q,q(是q的可能取值范围),对于给定值a(0a1),若由样本X1,X2,...,Xn确定的两个统计量q=q(X1,X2,...,Xn)和`q=`q(X1,X2,...,Xn)(q`q),对于任意q满足P{q(X1,X2,...,Xn)q`q(X1,X2,...,Xn)}1-a(1)则称随机区间(q,`q)是q的置信水平为1-a的置信区间,q和`q分别称为置信水平为1-a的双侧置信区间的置信下限和置信上限.当X是连续型随机变量时,对于给定的a,总是按要求P(qq`q)=1-a求出置信区间,而当X是离散型随机变量时,对于给定的a,常常找不到区间(q,`q)使得P(qq`q)恰为1-a.此时去找区间(q,`q)使得P(qq`q)至少为1-a,且尽可能地接近1-a.(1)式的含义为:若反复抽样多次(各次得到的样本的容量相等,都是n),每个样本值确定一个区间(q,`q),每个这样的区间要么包含q的真值,要么不包含q的真值,按大数定律,包含q真值的约占100(1-a)%,不包含q真值的约占100a%,例如,若a=0.01,反复抽样1000次,则得到的1000个区间中不包含q真值的约仅为10个.例设总体X~N(m,s2),s2为已知,m为未知,设X1,X2,...,Xn是来自X的样本,求m的置信水平为1-a的置信区间.解).,(N~nX10sm-且有是μ的无偏估计,X我们知道参数1)不依赖于任何未知所服从的分布N(0,nXsm-按标准正态分布的上a分位点的定义,有)(,znXP/312asma--0a/2za/2a/2-za/2这样就得到了m的一个置信水平为1-a的置信区间(5).znσX,znσXα/2α/2-常写成(4)α.1znσXμznσXP(3)α,1znσμXPα/2α/2α/2----(6).znσXα/2如果取a=0.05,即1-a=0.95,又若s=1,n=16,查表得za/2=z0.025=1.96.于是得到一个置信水平为0.95的置信区间(7)0.49).X即(,1.96161X再者,若由一个观察值算得样本均值的观察值`x=5.20,则得到一个区间(5.200.49),即(4.71,5.69)(6).znσXα/2最后得到的区间(4.71,5.69)已经不是随机区间了,但我们仍称它为置信水平为0.95的置信区间.其含义是:若反复抽样多次,每个样本值(n=16)按(4.7)式确定一个区间,按上面的解释,在这么多的区间中,包含m的约占95%,不包含m的约仅占5%.现在抽样得到区间(4.71,5.69),则该区间属于那些包含m的区间的可信程度为95%,或该区间包含m这一陈述的可信度为95%.然而,置信水平为1-a的置信区间并不是惟一的.以上例来说,若给定a=0.05,则又有(8)znσX,znσX故0.95.znσXμznσXP0.95,znσμXzP0.040.010.040.010.010.04----也是置信水平为0.95的置信区间.而比较两个置信区间比前者要大.,nσ为4.08后者的区间长度,nσ92前者的区间长度为3.znσX,znσX和znσX,znσX0.040.010.0250.025--易知,象N(0,1)分布那样其概率密度的图形是单峰且对称的情况,当n固定时,以形如(5)那样的区间其长度为最短.我们自然选用它.通过上例,可看到求未知参数q的置信区间的具体做法如下(1)寻求一个样本X1,X2,...,Xn的函数:W=W(X1,X2,...,Xn;q),它包含待估的参数q,而不含其它未知参数,并且W的分布已知且不依赖于任何未知参数(当然不依赖于待估参数q);(2)对于给定的置信水平1-a,定出两个常数a,b,使P{aW(X1,X2,...,Xn;q)b)1-a;(3)若能从aW(X1,X2,...,Xn;q)b得到等价的不等式qq`q,其中q=q(X1,X2,...,Xn),`q=`q(X1,X2,...,Xn)都是统计量,那么(q,`q)就是q的一个置信水平为1-a的置信区间.函数W(X1,X2,...,Xn;q)的构造,通常可以从q的点估计着手考虑.常用的正态总体参数的置信区间可以用上述步骤推得.二、正态总体均值的区间估计设已给定置信水平为1-a,并设X1,X2,...,Xn为总体N(m,s2)的样本.`X,S2分别是样本均值和样本方差.1,均值m的置信区间(a)s2为已知,此时由例1采用(2)的函数,已得到m的置信水平1-a为的置信区间为(1)znσXα/2(b)s2为未知,由第六章定理三,知(2)),n(t~nSX1--m(3)α11)(ntnSμX1)(ntPα/2α/2-----右边的分布t(n-1)不依赖于任何未知参数,可得(3)amaa-----11122)n(tnSX)n(tP//0a/2a/2-ta/2(n-1)ta/2(n-1)于是得m的一个置信水平为1-a的置信区间(4).1)(ntnSXα/2-α.11)(ntnSXμ1)(ntnSXP即(3)α11)(ntnSμX1)(ntPα/2α/2α/2α/2---------例1从一大批糖果中随机取16袋,称得重量(克)为:506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496设袋装糖果重量近似服从正态分布,求总体均值m的置信水平为0.95的置信区间.解1-a=0.95,a/2=0.025,n-1=15,t0.025(15)=2.1315,算得`x=503.75,s=6.2022.由(4)式算得置信区间为,2.1315166.2022503.75即(500.4,507.1).2,方差s2的置信区间(m未知)s2的无偏估计为S2,由第六章§2定理二知),1n(~S)1n(222-s-(6)'α11)(nχ1)S(nσ1)(nχ1)S(nP即(6)α11)(nχσ1)S(n1)(nχP2α/21222α/222α/2222α/21-----------上式右端分布不依赖任何参数,故有a--s--aa-1)1n(S)1n()1n(P22/2222/1a/2)1(22/-na)1(22/1--naa/2得到方差s2的一个置信水平为a的置信区间(7).1)(nχ1)S(n,1)(nχ1)S(n2α/2122α/22-----)'6(1)1n(S)1n()1n(S)1n(P1)1n(S)1n()1n(P22/12222/222/2222/1a---s--a--s--a-aaa-即由(6)'式还可得到标准差s的1-a置信区间为)8(1n(S1n,1n(S1n22/122/----a-a在密度函数不对称时,如2分布和F分布,习惯上仍是取对称的分位点来确定置信区间的.(6)'α11)(nχ1)S(nσ1)(nχ1)S(nP2α/21222α/22------例2求例1中总体标准差s的置信水平为0.95的置信区间.解现在a/2=0.025,1-a/2=0.975,n-1=15,查表得,262.6)15(,488.27)15(2975.02025.0又s=6.2022,由(5.8)式得所求的标准差s的一个置信水平为0.95的置信区间为(4.58,9.60)三、单侧置信区间在上述讨论中,对于未知参数q,我们给出两个统计量q,`q,得到q的双侧置信区间(q,`q).但在一些实际问题中,例如,对于设备,元件的寿命来说,平均寿命长是我们所希望的,我们关心的是平均寿命q的下限,与此相反,在考虑化学药品中杂质含量的均值m时,我们常关心参数m的上限.这就引出了单侧置信区间的概念.对于给定值a(0a1),若由样本X1,X2,...,Xn确定的统计量q=q(X1,X2,...,Xn),对于任意q满足P{qq}1-a,(1)称随机区间(q,)是q的置信水平为1-a的单侧置信区间,q称为q的置信水平为1-a的单侧置信下限.又若统计量`q=`q(X1,X2,...,Xn),对于任意q满足P{q`q}1-a,(2)称随机区间(-,`q)是q的置信水平为1-a的单侧置信区间,`q称为q的置信水平为1-a的单侧置信上限.例如对于正态总体X,若均值m,方差s2均为未知,设X1,X2,...,Xn是一个样本,由)1n(t~nSX-m-.1)1n(tnSXP,1)1n(tnSXPa---ma--m-aa有即于是得到m的一个置信水平为1-a的单侧置信区间)3(.),1n(tnSX--a)4().1n(tnSX--mam的置信水平为1-a的单侧置信下限为又由),1(~)1(222--nSns.1)1()1(,1)1()1(21222122asasaa--------nSnPnSnP有即于是得s2的一个置信水平为1-a的单侧置信区间)5(.)1n(S)1n(,0212--a-)6(.)1n(S)1n(2122--sa-s2的置信水平为1-a的单侧置信上限为例从一批灯泡中随机地取5只做寿命试验,测得寿命(以小时计)为1050,1100,1120,1250,1280设灯泡寿命服从正态分布.求灯泡寿命平均值的置信水平为0.95的置信下限.解1-a=0.95,n=5,ta(n-1)=t0.05(4)=2.1318,`x=1160,s2=9950.由(7.4)式得所求单侧置信下限为.1065)1n(tnsx--ma(二)两个总体N(m1,s12),N(m2,s22)的情况个总体的样本方差.二分别是第一,S,S二个总体的样本均值,分别为第一,Y,X且设这两个样本相互独立,本,是来自第二个总体的样Y,,Y,Y本;是来自第一个总体的样X,,X,X并设α,设已给定置信水平为12221n21n2121-1,两个总体均值差m1-m2的置信区间----2221212122221121212221nσnσ,μμN~YX)得nσ,N(μ~Y),
本文标题:第17讲-区间估计
链接地址:https://www.777doc.com/doc-1517140 .html