您好,欢迎访问三七文档
11◎第五章参数估计※一、单一总体的参数估计※●(一)估计的含义●估计:人人都做过。如:上课时,你会估计一下老师提问你的概率有多大?当你去公司应聘时,会估计你被录用的可能性是多少?推销员年初时要估计今年超额完成任务的概率有多大?◎估计量:用来估计总体参数的样本统计量。如:算术平均数、中位数、标准差、方差等。●估计的可能性与科学性:数理统计证明,一个“优良”的样本统计量应具备以下特征:(1)、无偏性。样本估计量的期望值应等于总体参数。无系统偏差。(2)、有效性。与离散度相联系。在多个无偏估计量中,方差最小的估计量最有效。(3)、一致性。随着样本容量的增加,可以使估计量越来越靠近总体参数。(4)、充分性。估计量能够充分利用有关信息,中位数和众数不具备这一点。※估计的类型包括:1、点估计:只有一个取值。如样本平均数nxx22就是总体平均数μ的点估计值。2、区间估计:给出取值范围(值域)。见PPT▲两种估计类型哪一种更科学?※区间估计的优点在于:它在给出估计区间时,还可以给予一个“可信程度”。例如:销售经理想估计一下明年的出口总值,甲估计是53万美元,乙估计是50—56万美元之间,并可以确切地说“有95%的把握”。显然后者的可信程度大于前者。那么,50—56万美元之间的范围是如何计算的?“有95%的把握”是什么意思?【引例】:某食品进出口公司向东南亚出口一批花生制品,管理人员从中抽取50包作为样本,计算其平均数为250克。另外,合同规定总体标准差为6克。如果问这批花生制品的平均重量,可用样本平均数作为总体平均数的最佳估计量:250克。但这是远远不够的,在许多时候,管理人员还想了解“这个估计值的平均误差是多少?”“总体平均数可能落入样本平均数上、下多大范围内?”“这个估计值的可靠程度是多少?”〖1〗由于n=50,根据中心极限定理可作图:n=50,σ=6〖2〗抽样平均误差:8487.0506nx〖3〗若用250克这个估计值估计总体平均数,其平均误差为0.8487。x33〖4〗若用区间表示估计的值域:这批花生制品的总体平均重量是250±0.8487克之间。〖5〗总体平均数在250±0.8487克之间的可信度为68.3%。总体平均数在250±2×0.8487克之间的可信度为95.5%。总体平均数在250±3×0.8487克之间的可信度为99.7%。●(二)区间估计中几个常用概念1、置信度(置信系数):它是指与一个估计区间相联系的概率,它表示该区间将包括总体参数的可能程度。用1-α表示。置信度越大,估计区间内所包含总体参数的可信度越高。(68.3%、95.45%、99.7%都是置信度)2、置信区间:与一个“置信度”相联系的估计值的取值范围。用xzx表示(如250±2x)※250±2x:表示有95.45%的样本平均数构造的区间将包含总体平均数。※※250±3x:表示有99.73%的样本平均数构造的区间将包含总体平均数。※3、置信限:与置信区间相联系的界限,包括上限和下限。如上题中下限:250-x,上限:250+x▲思考题:置信度与置信区间有何关系?44(三)总体平均数的区间估计1、大样本条件下的区间估计●(1)、总体标准差σ已知条件下,对总体平均数的区间估计▲案例1:在【引例】中:食品进出口公司出口一批花生制品,管理人员抽取50包为样本,其平均数为250克。合同规定总体标准差为6克。问:(1)如果置信区间为:250±2x、250±1.96x,总体参数这一范围的把握程度有多大?(2)若用90%的置信系数,则该批食品平均重量是多少?解:(1)a、250±2×0.8487,与z=2对应的置信度是:0.4772×2=95.44%;b、250±1.96×0.8487,与z=1.96对应的置信度是:0.4750×2=95%。(2)8487.007.76506nx与90%对应的Z值是0.9/2=0.45,Z=(1.64+1.65)/2=1.645,置信区间:250±1.645*0.8487,即该批食品的平均重量在248.6—251.396克之间的把握程度是90%。▲案例2:某茶叶进出口公司,准备处理一批库存2年的茶叶,出库之前要进行一次检验。检验数据如下;样本容量为64包,样本平均数为每包2公斤,入库记录表明总体标55准差为0.2公斤。经理要求在95%的可信度下,估计一下这批茶叶的平均重量在多大范围内?解:(公斤)(公斤)049.2025.096.12951.1025.096.12,025.0642.096.1,475.02/95.0,95.01,2.0,30,6421cczxnznnxx答:这批茶叶平均重量在1.951—2.049公斤,其可信程度为95%。●课堂练习教材P157,1、2●(2)、总体标准差σ未知条件下的区间估计※总体标准差σ未知条件下,一般用样本标准差S代替总体标准差σ。▲案例:某项抽样调查中获得如下资料:N可以视为无限总体,n=81,样本平均数为500,样本标准差为90,求:总体平均数可信度为90%的置信区间。解:45.51610645.150055.48310645.1500,108190ˆ645.1,500,90,308121ccxnszxsnxx答:此项调查中,总体平均数的可信度为90%的置信区间是66在483.55—516.45之间。▲习题1:一次等级考试,因急于评估试题质量,教师先随机抽取36份试卷批改,平均分是72分,标准差13.2分,系主任要求在90%的可信度下,对全体考生的平均成绩做一个区间估计。解:62.752.2645.172;38.682.2645.172,2.2362.13645.1,2.13,72,303621cczxnzsxnxx▲习题2:某土产畜产公司收购一批烟草,抽取30箱为样本,平均重量为20公斤,标准差为3公斤。求:(1)置信度为95%时,这批烟草的平均重量;(2)置信度为80%时,这批烟草的平均重量。解:(1)(公斤)(公斤)07.215477.096.12093.185477.096.120ˆ,5477.04772.53303ˆ96.1,95.01,3,20,3021cczxnzsxnxx(2)(公斤)(公斤)7.205477.027.1203.195477.027.12027.1,4.02/8.0,8.0121ccz◆课后作业:教材P157,32、小样本条件下的区间估计77●使用t分布的条件:当样本容量n<30,且总体标准差σ未知时,用样本标准差S代替总体标准差σ。样本标准差S计算公式:1)x-(xss2xnnssxtxx▲例1:从大学一年级学生中随机抽取12名学生,其阅读能力得分为28,32,36,22,34,30,33,25,31,33,29,26。试评估一下大学一年级学生阅读能力的总体平均分数。要求置信度分别是95%和99%。解:步骤:(1)计算样本平均数:917.29/nxx(2)计算样本标准差:1.41)(2nxxs(3)计算平均误差:184.1121.4nssx(4)确认自由度:df=12-1=11,误差概率:α=1-0.95=0.05/2=0.025,查表,t=2.201(5)估计总体平均数置信区间:523.32311.272.606184.1201.2917.29;上限下限xtsx解释:有95%的把握程度说大学一年级学生阅读能力平均88分数在27.311—32.523分之间。当α=1-0.99=0.01/2=0.005,查表,t=3.105829.917-3.1058×1.184=26.24;29.917+3.1058×1.184=33.59。▲习题2:一批出口商品出库之前从中抽取14箱,其平均重量为40.5公斤,标准差0.5公斤。主管人员要求在98%的置信系数下,对这批商品的平均重量做个区间估计。公斤公斤584.401336.06503.25.40;146.401336.06503.25.406503.2,13,01.02/02.098.01;1336.0742.35.0145.021cctdfnx置信系数为98%时,这批商品的平均重量是40.146—40.584公斤。▲习题3:某公司共有技术开发和中层管理人员600名,公司十分关心他们的身体健康现状,责成有关部门进行了一次睡眠状况抽样调查,获得资料如下表:(单位:小时)员工每周睡眠员工每周睡眠员工每周睡眠员工每周睡眠序号时间序号时间序号时间序号时间15064811541650240747125617513308451350184743894314481948542104715482054试以95%的置信系数对600名技术开发和中层管理人员平均每周的睡眠状况作一个区间估计。99解:),(,,(小时)。)((小时),63.4997.4335.1093.28.46ˆ093.21912035.120021.6ˆ021.618.46xtxtdfnsnxxsnxxxx●课堂练习:教材P157,4、5※小样本比例的区间估计可参照平均数的区间估计。不同条件下总体平均数的区间估(P140)总体分布样本容量σ已知σ未知正态分布大样本(n≥30)nzx2nszx2小样本(n<30)ntx2nstx2非正态分布大样本(n≥30)nzx2nszx2◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆◆●(四)、总体比率的区间估计※中心极限定理证明:P不接近0或1,且n很大时,其抽样分布趋近于正态分布。比例抽样分布的平均误差为:1010np)1(npz)1(总体比率的估计区间:nzp)1(2π是总体比率;P是样本比率。若π未知,可用P。▲案例1:为适应清理整顿要求,某地审计局要对本地公司进行查账,主管负责人估计查账对象中有40%的人会响应这一要求,如果向一个包括45个单位的随机样本寄去要求查账的通知单,审计局希望通过这一样本估计一下置信度为95%时,包含总体实际比例的区间有多大。解:%)31.54%,69.25(073.096.14.01.96z,073.0456.04.0)1(置信区间:np▲习题1:某西部人才咨询部门收到大批申请去西部工作的信函,人力资源管理部门想了解被录用的比例,从中抽取500人,发现只有76人被录用。现要求使用95%的可信度,对总体比例做一个区间估计。1111解:%)34.18(1834.0016.096.1152.0%)06.12(1206.0016.096.1152.0,016.0500848.0152.096.1,848.0152.01,152.0500/7621xxpzpczpcnpqzqp▲习题2:某私营企业为提高业务人员的业务能力,在拟订一项培训计划之前,对一个由300名员工组成的随机样本进行测试,结果发现参加测试人员中只有75人达到要求。主管人员要求在置信度为99%的条件下,作一个区间估计。解:%)4375.31(314375.0025.0575.225.0%)5625.18(185625.0025.0575.225.0,,025.030075.025.0575.2,495.02/99.0,25.0300/75,30021cczpnpqzpnpp▲习题3:为了研究我国真丝制品的销路,在纽约举办的我国纺织品展销会上,对1000名成人进行了抽样调查,其中有600人我国的喜欢真丝制品。试以95%的置信系数确定纽约市民成人喜欢真丝制品的比率的置信区间。%
本文标题:第五章总体参数估计
链接地址:https://www.777doc.com/doc-2189337 .html