您好,欢迎访问三七文档
第五章参数估计5.1参数估计5.1.1参数估计的基本概念(1)参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法.人们常常需要根据手中的数据,分析或推断数据反映的本质规律,即根据样本数据如何选择统计量去推断总体的分布或数字特征等.统计推断是数理统计研究的核心问题,所谓统计推断是指根据样本对总体分布或分布的数字特征等作出合理的推断.(2)参数估计分为点估计和区间估计两部分.5.1.2参数的点估计(1)点估计的基本概念①点估计是用样本统计量来估计总体参数,因为样本统计量为数轴上某一点值,估计的结果也以一个点的数值表示,所以称为点估计.②设总体样本的分布函数;xF(多于一个未知参数时,可同样讨论)的形式为已知,是待估参数,nXXX,,,21是总体的一个样本,nxxx,,,21是相应的样本值.点估计问题就是要构造一个适当的统计量nXXX,,,ˆ21,用它来估计未知参数,用它的观察值nxxx,,,ˆ21作为未知参数的近似值,则称:nXXX,,,ˆ21为的估计量;nxxx,,,ˆ21为的估计值.(2)构造估计量的两种常用法:矩估计和最大似然估计①矩估计(a)矩估计的定义利用样本矩来估计总体中相应的参数.(b)矩估计的具体方法设总体所体现的分布的随机变量为X,若X为连续型随机变量,其概率密度为kxf,,,;21,或X为离散型随机变量,其分布律为kxpxXP,,,;21,其中k,,,21为待估参数,设nXXX,,,21是总体的一个样本.1、计算X前k阶原点矩(假设都存在):当X为连续型随机变量,dxxfxXEkll,,,;21,当X为离散型随机变量,XRxkllxpxXE,,,;21,其中,XR是X可能取值的范围.2、令样本矩等于总体矩klXEXnlnili,,2,111这是一个包含k个未知参数k,,,21的k个联立方程组.3、求解上述方程,得到l的矩估计为klXXnll,,2,1,,ˆˆ1,则lˆ为l的矩估计量,,,ˆ1nlxx为l的矩估计值.【例5.1】设设总体所体现的分布的随机变量为X,且X的均值及方差2都存在,又设nXXX,,,21是总体的一个样本,试求和2的估计量.解:因为XE,2222XEXDXE,令样本矩估计总体矩有:niiXnXE11,niiXnXEXDXE1222221,所以niiXn11ˆ,2112211ˆniiniiXnXn.②最大似然估计(a)最大似然估计的定义若已观察到样本nXXX,,,21的样本值为nxxx,,,21,当在离散型的情况下,取到这一样本值的概率为p,当在连续型的情况下,落在样本值nxxx,,,21的邻域内的概率为p,而p与未知参数有关,于是参数就取使概率p达到最大值时的估计量ˆ.(b)最大似然估计的具体方法设总体所体现的分布的随机变量为X,当X为连续型随机变量时,其概率密度,;xf的形式已知,为待估参数,为可能取值的范围.设nXXX,,,21是总体的一个样本,则nXXX,,,21的联合概率密度为niixf1;.又设nxxx,,,21是相应于样本nXXX,,,21的样本值,则随机点nXXX,,,21落在点nxxx,,,21的邻域(边长分别为ndxdxdx,,,21的n维立方体)内的概率近似地为iniidxxf1;.其值随的取值而变化,但因子式niidx1不随的取值而变,故只需考虑函数niinxfxxxLL121;;,,,的最大值.这里L称为样本的似然函数.若;,,,maxˆ;,,,2121nnxxxLxxxL,则称nxxx,,,ˆ21为的最大似然估计值,称nXXX,,,ˆ21为的最大似然估计量.当X为离散型随机变量时,用分布律,;xpxXP代替样本的似然函数中的;xf即可.这样,确定最大似然估计量的问题就归结为微分学中的求最大值的问题了.在很多情况下,;xp和;xf关于可微,则可以从方程0ddL或0lndLd(由于L与Lln在同一处取到极值)中解得.如果X的分布中含有k个未知参数k,,,21,则似然函数是这些参数的函数kLL,,,21.分别令0iddL或0lnidLd(ki,,2,1),解此方程组,可得各个待估参数i的最大似然估计值.【例5.2】设总体所体现的分布的随机变量为X,2,~NX,2,为未知参数,nxxx,,,21是来自总体的一个样本值,求2,的最大似然估计值量.解:X的概率密度为2222121,;xxf,.21exp221exp21,1222/22/1222niinnniixxL似然函数为而niixnnL122221ln22ln2ln.niiniixnLnxL12222212.0212ln,01ln令解得xxnnii11ˆ,niixxn12^21.因此2,的最大似然估计值量为XXnnii11ˆ,niiXXn12^21.(3)估计量的评选标准下面是评价估计量好坏的三个常用的标准.设总体所体现的分布的随机变量为X,nXXX,,,21是来自总体的一个样本,是包含在X分布中的待估参数,这里是的取值范围.①无偏性若估计量nXXX,,,ˆˆ21的数学期望ˆE存在,且对任意有ˆE,则称ˆ是未知参数的无偏估计量.②有效性设估计量nXXX,,,ˆˆ2111与nXXX,,,ˆˆ2122都是未知参数的无偏估计量,若对于任意,有21ˆˆDD,且至少有一个,使得此不等号成立,则称1ˆ较2ˆ有效.③一致性设nXXX,,,ˆˆ2111为未知参数的估计量,若对于任意都满足:对于任意0有1ˆlimPn,则称ˆ为的一致估计量.【例5.3】设总体所体现的分布的随机变量为X,X在区间,0上服从均匀分布,nXXX,,,21是来自总体的一个样本,niiXnX11,nnXXX,,max1.(Ⅰ)求的矩估计量和最大似然估计量;(Ⅱ)求常数ba,,使得Xa1ˆ,nbX2ˆ均为的无偏估计量,并比较其有效性;(Ⅲ)应用切比雪夫不等式证明:21ˆ,ˆ均为的一致估计量.解:依题意X的密度函数、分布函数分别为:,,0,0,1其它xxf,,1,0,,0,0xxxxxF(Ⅰ)由于2XE,令样本矩等于总体矩有niiXnXE112,所以XXnnii221.样本nXXX,,,21的似然函数为:.,0,),,2,1(0,1;;,11否则nxxxfxxLiinniinL是的单调减函数,且),,2,1(0nxxii,即要取大于ix的一切值,因此的最小取值为nxx,,max1,的最大似然估计量nXˆ.(Ⅱ)由于2XE,122XD,所以2ˆ11aXnaEXaEEnii,取2a,即X2ˆ1时,1ˆE,1ˆ为的无偏估计.由于nnXXX,,max1,得nX的分布函数和密度函数为:nniinnxfxXPxXPxF1,.,0,0,11其它xnxxfXFnxfnnnn故101nndxnxxXEnnn,220122nndxnxxXEnnn,2222221212nnnnnnnXEXEXDnnn,则1ˆ2nbnXbEEn,当nnb1时,2ˆE,即nXnn1ˆ2为的无偏估计.由于nnnXnDXDDnii312422ˆ22211,nnnnnnnXDnnDn21211ˆ22222,所以12ˆˆDD,则2ˆ比1ˆ有效.(Ⅲ)由于iEˆ且0ˆliminD(2,1i),故根据切比雪夫不等式:对于任意0,有有0ˆˆˆlim2iiinDEP,即0ˆliminP(2,1i),则称iˆ(2,1i)为的一致估计量.5.1.3参数的区间估计(1)区间估计的基本概念①通过从总体中抽取的样本,根据一定的正确度与精确度的要求,构造出适当的区间,以作为总体的分布参数(或参数的函数)的真值所在范围的估计称为区间估计.②区间估计是从点估计值和抽样标准误出发,按给定的概率值建立包含待估计参数的区间.其中这个给定的概率值称为置信度或置信水平,指总体参数值落在样本统计值某一区内的概率.这包含待估计参数的区间称为置信区间,置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度.置信区间越大,置信水平越高.划定置信区间的两个数值分别称为置信下限和置信上限.(2)求置信区间的具体方法设总体所体现的分布的随机变量为X,nXXX,,,21是来自总体的一个样本,X的分布已知,k,,21为待估参数,求kii,,2,1置信度为的置信区间.①求一个函数inXXGG;,,1,且其分布已知;②确定常数ba,使bXXGaPin;,,1;③反解不等式bGa得等价不等式:baXXXbaXXXnn,;,,,ˆ,;,,,ˆ212211,则21ˆ,ˆ是的置信度为的一个置信区间.【例5.4】有一大批糖果,现从中随机地取16袋,称得重量(克)分别为:506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496.设袋装糖果的重量近似地服从正态分布,试求总体均值的置信度为0.95的一个置信区间.解:根据题意,样本均值75.503X,样本方差平方根2022.6S.因为当2,~X,1~/ntnSX,则有15~4/2022.675.503t,又因为15t分布是一个对称分布,且025.01315.2tF,所以有95.01315.24/2022.675.5031315.2P,即95.0055.507445.500P,则的置信度为0.95的一个置信区间为055.507,445.500.
本文标题:第五章参数估计
链接地址:https://www.777doc.com/doc-2083886 .html