您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 概率统计第七章参数估计
第七章参数估计参数估计是统计推断的基本内容之一,它是凭借从总体中抽取的样本,构造合适的样本函数,对总体中的未知参数作出符合要求的估计.例1.某批产品的质量用次品率来衡量,但是数量太大,无法一一检测,那么如何估计该批产品的质量呢?我们可以抽取100件进行检测,如果其中有95件正品,5件次品.这时我们就把100件样品的次品率0.05,作为该批产品的次品率的估计。例2.要统计某地人均年商品消费额,我们抽取1000户进行调查,计算得到人均年商品消费额为6800元,这时我们就把样本的人均年商品消费额6800元作为该地人均年商品消费额的估计。上述例子的共同之处是:利用样本资料得到的信息来估计有关总体分布中的一些未知参数,这类估计方法称为参数估计。依据估计形式的不同,参数估计分为点估计和区间估计两种。第一节参数的点估计一.估计量,估计值和点估计1.估计量:设是来自总体X的样本,是总体的未知参数,若用一个合适的统计量来估计,则称为参数的估计量.2.估计值:在抽样后,每当有了一组样本值12,,,nxxx,将其代入统计量,称12ˆ,,,nxxx为参数的估计值。3.点估计:设是总体的未知参数,如果用估计值12ˆ,,,nxxx来估计未知参数,这种估计称为点估计。二.点估计的两个基本估计式1.用样本均值X作为总体X的数学期望EX的估计量2.用样本方差2S作为总体X的方差DX的估计量特别地,对于正态总体2,N,有22ˆˆ,XS.例1.某灯泡工厂某天生产了一大批灯泡,从中任意取出10只进行寿命试验,测得数据如下(单位:小时):1050110010801120120012501040113013001200试估计该天生产的灯泡的平均寿命。解:11050110010801120120012501040113013001200114710x所以ˆ1147x,即:估计该天生产的灯泡的平均寿命为1147小时.例2.设总体X的概率密度为1,01;0,0,1xxfxxx,其中是总体的未知参数,求的估计量。解:设为取自总体X的样本,因为110;1EXxfxdxxxdx取样本均值X作为总体X的数学期望EX的估计量,即:ˆEXX,于是得到:ˆˆ1X,所以ˆ1XX.第二节估计量的评价标准一.无偏性[定义]设为未知参数的估计量,若成立ˆE,则称为参数的无偏估计量.【注1】无偏估计的实际意义就是无系统偏差,即若对总体进行大量重复的抽样,那么所有这些得出的估计值的平均值收敛于.或者可以理解为“平均偏差为0”.当然“平均偏差为0”的估计优于平均偏差不为0的估计.例1.设为取自总体X的样本,2,EXDX,试证:样本均值X及样本方差2S分别是和2的无偏估计量.证:因为11111nniiiiEXEXEXnEXnnn,所以1niiXX是的无偏估计量.※{又:222211111nniiiiDXDXDXnnnnn,而222222111111111nnniiiiiiESEXXEXnXEXnEXnnn22222211111niiiDXEXnDXEXnnnnn22111nn.所以,2S分别是2的无偏估计量.}※例2.设总体2~,XN,123,,XXX为取自总体X的样本,则1123211ˆ5102XXX,2123111ˆ333XXX都是的无偏估计量.解:∵1123211211ˆ51025102EEXXX;∵2123111111ˆ333333EEXXX.∴它们都是的无偏估计量.二.有效性[定义]设1ˆ和2ˆ都是未知参数的无偏估计量,若12ˆˆDD,则称1ˆ比2ˆ有效.【注2】作为无偏估计量,它们的观察值都是在的真值左右摆动,而1ˆ比2ˆ有效指的是1ˆ的摆动幅度比2ˆ的摆动幅度更小些,因此有效性还有比较高的估计精度的含义.例3.比较上例中1ˆ及2ˆ的有效性解:由于211231231111111ˆ3339993DDXXXDXDXDX;2212312321141121ˆ510225100450DDXXXDXDXDX;有21ˆˆDD所以,2ˆ比1ˆ有效.三.一致性[定义]设为未知参数的估计量,若对任意0,ˆlim1nP成立,则称为未知参数的一致性估计量.【注3】一致性是一种大样本的性质,事实上,当n时,信息量越来越大,对的估计也应该越来越精确,ˆ应该与相差无几才合理.如果一致性不满足,估计量显然不是合的。可以证明:样本均值X及样本方差2S分别是和2的一致性估计量.第三节正态总体参数的区间估计用点估计来估计总体参数,估计值一般不是参数的真值.点估计没有给出估计的精确程度和可信程度,我们希望在一定可靠程度下,指出被估计的总体参数所在的一个数值范围,这就是区间估计。一.置信区间和置信度[定义]设总体X的概率密度为;fx,是未知参数,12,,,nXXX是来自总体X的样本,如果对于给定的01,若存在统计量12,,,nXXX和12,,,nXXX,使得1P,则称区间,为未知参数的置信度为的置信区间.称为置信度,和分别称为置信下限和置信上限。【注1】置信区间,是一个随机区间,对于不同的样本值会得到不同的区间,它可能包含的真值,也可能不包含的真值.当置信度为时,置信区间,包含真值的概率为1。可以这样理解:如果取0.05,10.95,若重复抽样100次得到了100个不同的区间,则其中大约有95个包含了真值,不包含真值的仅仅占5个。【注2】置信区间长度的大小是反映估计的精确程度的,而置信度是反映估计的可靠程度的.当样本容量给定后,很可惜这两者是一对矛盾,置信度高,则精确性相对就差,即:置信度越高,则置信区间的长度越长.置信区间和置信度提出了一个在一定的概率保证下,参数的估计满足一个精确度的概念,从这个角度来说,区间估计是统计意义上的近似计算和误差分析,所以在处理实际问题时更加有用。下面,我们讨论正态总体参数的区间估计。二.正态总体数学期望的区间估计1.正态总体2~,XN,其中2已知,求的置信区间.设12,,,nXXX是来自总体X的样本,于是由抽样分布定理知:统计量~0,1XUNn,对于给定的置信度1,查标准正态分布表,确定临界值2u,(注意:这里212u),使得221XPuun,即221PXuXunn,于是,得到均值的置信度为1的置信区间为:22,XuXunn.例1.某车间生产滚珠,从长期实践中知道,滚珠直径X服从正态分布,从某天生产的产品中随机抽取6个,量得直径如下(单位:mm):14.7,15.0,14.9,14.8,15.2,15.1,求的置信度0.9的置信区间和置信度0.99的置信区间。解:由于已知,所以选用的置信区间22,XuXunn。当,0.1,10.952,查表得2u=1.64;当,0.01,10.9952;查表得2u=2.576;代入数据得的置信度0.9的置信区间为,即为。的置信度0.99的置信区间为,即为。2.正态总体2~,XN,其中2未知,求的置信区间.由于2未知,所以用2的无偏估计量22111niiSXXn,引入统计量~1XTtnSn,对于给定的置信度1,查t分布表,确定临界值21tn,使得22111XPtntnSn,即,22111SSPXtnXtnnn于是,得到均值的置信度为1的置信区间为:221,1SSXtnXtnnn.例2.假定某商店中一种商品的月销售量服从正态分布,未知。为了合理的确定对该商品的进货量,需对作估计,为此随机抽取七个月,其销售量分别为:64,57,49,81,76,70,59,试求的置信度为0.95的置信区间.解:由于和都未知,故的置信区间为221,1SSXtnXtnnn代入数据得:20.02565.14,126.48,11.25,7,62.45,xSSnt所以,的置信度为0.95的置信区间为:11.2511.2565.142.45,65.142.457765.1410.42,65.1410.4254.72,75.56.三.正态总体方差的区间估计正态总体2~,XN,其中未知,求2的置信区间.引入统计量2221nS,于是由抽样分布定理知:22221~1nSn.对于给定的置信度1,查2分布表,确定临界值221221;1nn,使得22221221111nSPnn,即:2222212211111nSnSPnn,于是,得到2的置信度为1的置信区间为:222212211,11nSnSnn;从而标准差的置信度为1的置信区间为:222212211,11nSnSnn.例3.随机地取某种子弹9发作试验,测得子弹速度的11S,设子弹速度服从正态分布,求这种子弹速度的标准差和方差的置信度为0.95的置信区间。解:由于未知,故的置信度为1的置信区间为222212211,11nSnSnn,代入数据得29,121,nS,0.05,0.025,10.97522,220.02521817.54n,220.97512812.18n.所以,的置信度为0.95的置信区间为:81218121,17.542.1855.19,444.04;的置信度为0.95的置信区间为:55.19,444.047.43,21.07.
本文标题:概率统计第七章参数估计
链接地址:https://www.777doc.com/doc-2362413 .html