您好,欢迎访问三七文档
第四章参数估计4.1参数估计的一般问题4.2一个总体参数的区间估计4.3两个总体参数的区间估计4.4样本容量的确定学习目标1.估计量与估计值的概念2.点估计与区间估计的区别3.评价估计量优良性的标准4.一个总体参数的区间估计方法5.两个总体参数的区间估计方法6.样本容量的确定方法参数估计(parameterestimation)就是在抽样及抽样分布的基础上,根据样本统计量来推断我们所关心的总体参数。统计推断的过程样本总体样本统计量如:样本均值、比率、方差非参数统计是统计学的一个重要分支,它在实践中有着广泛的应用。所谓统计推断就是由样本观察值去了解总体,它是统计学的基本任务之一。若根据经验或某种理论我们能在推断之前就对总体作一些假设,则这些假设无疑有助于提高统计推断的效率。这种情况下的统计方法称为参数统计。如果我们所知很少,以致于在推断之前不能对总体作任何假设,或仅能作一些非常一般性(例如连续分布、对称分布等)的假设,这时如果仍然使用参数统计方法,其统计推断的结果显然是不可信的,甚至有可能是错的。在对总体的分布不作假设或仅作非常一般性假设条件下的统计方法称为非参数统计。参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计第一节参数估计的一般问题1.估计量:用于估计总体参数的随机变量–如样本均值,样本比率、样本方差等–例如:样本均值就是总体均值的一个估计量2.参数用表示,估计量用表示3.估计值:估计参数时计算出来的统计量的具体值–如果样本均值x=80,则80就是的估计值一、估计量与估计值(estimator&estimatedvalue)ˆ参数估计的方法估计方法点估计区间估计点估计(pointestimate)1.用样本的估计量直接作为总体参数的估计值–例如:用样本均值直接作为总体均值的估计–例如:用两个样本均值之差直接作为总体均值之差的估计2.没有给出估计值接近总体参数程度的信息3.点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等1ULPUL,1区间估计(intervalestimate)区间估计就是根据样本估计量以一定可靠程度推断总体参数所在的区间范围。分别称为置信下限和置信上限,通称为置信限。为显著性水平则称为置信度。1.在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的2.根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量–比如,某班级平均分数在75~85之间,置信水平是95%样本统计量(点估计)置信区间置信下限置信上限区间估计的图示x95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65xxxzx21.将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比率称为置信水平2.表示为(1-为是总体参数未在区间内的比率3.常用的置信水平值有99%,95%,90%相应的为0.01,0.05,0.10置信水平1.由样本统计量所构造的总体参数的估计区间称为置信区间2.统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间3.用一个具体的样本所构造的区间是一个特定的区间,我们无法知道这个样本所产生的区间是否包含总体参数的真值–我们只能是希望这个区间是大量包含总体参数真值的区间中的一个,但它也可能是少数几个不包含参数真值的区间中的一个置信区间(confidenceinterval)置信区间与置信水平样本均值的抽样分布(1-)%区间包含了%的区间未包含x1–/2/2xx影响区间宽度的因素1.总体数据的离散程度,用来测度2.样本容量,3.置信水平(1-),影响z的大小nx评价估计量的标准无偏性(unbiasedness)无偏性:估计量抽样分布的数学期望等于被估计的总体参数P()BA无偏有偏ˆˆ有效性(efficiency)有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效AB的抽样分布的抽样分布1ˆ2ˆP()ˆˆ一致性(consistency)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数AB较小的样本容量较大的样本容量P()ˆˆ充分性充分利用信息5.2一个总体参数的区间估计一、总体均值的区间估计二、总体比率的区间估计三、总体方差的区间估计-分位点的概念:Z9545.026826.01:zPzP如02z2z122.1,122一一对应与zzzP68.26%180%1.2890%1.64595%1.9695.45%299%2.5899.73%312Z(一)正态总体、方差已知(大、小)样本nNxNX22,~,~xZn一、总体均值的区间估计nZxnZxnZx222,:::1:的置信区间为总体均值就有给定置信度即122nZxnZxP12ZnxP抽样极限(允许)误差:%5Nn1:2NnNnZxnZE212NnNnZE%5NnnZx2:【例】一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%25袋食品的重量112.5101.0103.0102.0100.5102.6107.595.0108.8115.6100.0123.5102.0101.6102.2116.695.497.8108.6105.0136.8102.8101.598.493.3解:已知X~N(,102),n=25,1-=95%,z/2=1.96。根据样本数据计算得:28.109,44.10192.336.105251096.136.105:2nzx该食品平均重量的置信区间为101.44g~109.28g36.105x例题6:某企业从长期实践得知,其产品直径X是一随机变量,服从标准差为0.05的正态分布。从某日产品中随机抽取6个,测得其直径分别为14.8,15.3,15.1,15,14.7,15.1(单位:厘米)。在0.95的置信度下,试求该产品直径的均值的置信区间。:96.195.0105.01561.153.158.14:025.02求知由已知ZZnxx04.15,96.14nZx2::解605.096.115P110~5.905.22,55.2153.096.18.21nZx2:(二)大样本1、方差已知nZx2:重复抽样1:2NnNnZx不重复抽样2、方差未知1:2NnNnSZx不重复抽样nSZx2:重复抽样【例】一家保险公司收集到由36投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如下表。试建立投保人年龄90%的置信区间36个投保人年龄的数据233539273644364246433133425345544724342839364440394938344850343945484532解:已知n=36,1-=90%,z/2=1.645。根据样本数据计算得:总体均值在1-置信水平下的置信区间为63.41,37.3713.25.393677.7645.15.392nszx投保人平均年龄的置信区间为37.37岁~41.63岁5.39x77.7s例题7:某企业生产某种产品的工人有1000人,某日采用非重复抽样抽取100人调查他们的当日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。21:%45.951,5.4,35%5%1030100n,1000N:ESxNn求已知86.35,14.3486.035:2Ex112NnNnSZE2%45.951:2Z知由解件86.01100010010001005.42习题6:某药厂在生产过程中改换了一种新的酵素,测定了36批的产出率与理论产出率的比值:1.281.311.481.100.991.251.221.651.400.951.251.321.231.431.241.731.351.310.921.101.051.391.161.191.410.980.821.220.911.261.321.711.291.171.741.51要求:(1)计算这一比值95%的置信区间;(2)得出上述结论时作了什么假设;(3)能否以95%的置信水平说明新酵素的产出率提高了。:1%951228.0,268.1:求已知snxx342.1,194.136228.096.1268.1nSZx2:96.1%95:2Z知由解(2)假设36批的样本是随机的。(3)(1.194,1.342)1,说明新酵素的产出率提高了。P109~5.72300960,2199040:N192.460,808.4391005296.1450nsZx2:习题7:某汽车轮胎厂欲估计其轮胎的平均行驶里程,由于轮胎行驶里程受汽车型号、行驶的路面以及汽车前后轮位置等影响,因此使用了大样本进行随机配置,试验结果公里,标准差为6000公里。要求估计总体均值的置信区间,置信系数为95%。400n20000x20588,19412nszx2::)(%,9516000,20000,400:求大样本已知sxn96.1%951:2z知由解400600096.120000习题8:某企业购进一批部件,这批部件的质量取决于平均每件的缺陷数。根据以往的经验,平均每件产品的缺陷数为1,标准差为0.2,如果缺陷数超过1就应该拒收。现随机抽取64件,其平均缺陷数为1.1,要求以95%的置信系数构造缺陷数的置信界限,并决定是否拒收。121:%951,1.13064,2.0:?求已知xn应该拒收1149.1,051.12nzx2:149.1,051.1642.096.11.196.1%951:2z知由解(三)正态总体、方差未知、小样本()30nnstEnstxnn1212:例题7:某商场从一批袋装食品中随机抽取10袋,测得每袋重量(单位:克)分别为789、780、794、762、802、813、770、785、810、806,要求以95%的把握程度,估计这批食品的平均每袋重量的区间范围及其允许误差。21:%951136.171109.264211.79110806780789:2Enxxsnxx求已知nstEn1212622.2%951:110205.0
本文标题:第4章参数估计
链接地址:https://www.777doc.com/doc-2109652 .html