您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 《应用统计学》第6章:置信区间估计
1本章教学目标:(1)单个正态总体均值和方差的区间估计。(2)总体比例的区间估计。(3)均值和比例置信区间估计中的样本容量确定。(4)两个正态总体的均值差和方差比的区间估计。(5)单侧置信区间估计。第6章置信区间估计22由于点估计存在误差,因此仅对总体参数作出点估计是不够的,还需要了解估计的精度及其误差。参数的区间估计就是在给定的可信度下,估计未知参数的可能取值范围。1θˆ,ˆ2θ设为总体分布的未知参数,若由样本确定的两个统计量和对给定的概率(01),满足1}ˆˆ{21P则称随机区间)ˆ,ˆ(21为的置信度为1-的置信区间。区间估计3niiX122一.总体方差2的区间估计1.2分布设总体X~N(0,1),X1,X2,···,Xn为X的一个样本,则它们的平方和为服从自由度为n的2分布,记为2~2(n)§6.1单个正态总体均值和方差的区间估计4niiX12若对于随机变量X1,X2,···,Xn,存在一组不全为零的常数c1,c2,···,cn,使c1X1+c2X2+···+cnXn=0则称变量X1,X2,···,Xn线性相关,或称它们间存在一个线性约束条件;若X1,X2,···,Xn间存在k个独立的线性约束条件,则它们中仅有n-k个独立的变量,并称平方和的自由度为n-k。“自由度”的含义52分布密度函数的图形xf(x)on=1n=4n=106由给定的概率和自由度,可查表得到2分布的右侧分位点为2分布中满足下式的的右侧分位点:)(2n)(2n)(2n})({22nPf(x)xo)(2n7语法规则如下:格式:CHIINV(,n)功能:返回可用Excel的统计函数CHIINV返回用Excel求)(2n)(2n)(2n的值。82.总体方差2的区间估计设总体X~N(μ,σ2),)1()1(,)1()1(22/1222/2nSnnSn)1(22/n/2)1(22/1n/21-f(x)x0从而2的置信度为1-的置信区间为:)}1()1()1({22/2222/1nSnnP由222)1(Sn~)1(2nX和S2分别为样本均值和样本方差。1})1()1()1()1({22/12222/2nSnnSnP可得X1,X2,···,Xn为X的容量为n的样本,可以证明,19【例2】求例1中元件寿命方差2的95%置信区间。解:由例1,S2=196.52,n=10,/2=0.025,1-/2=0.975,)9(2025.07.2)9(2975.0,023.19)9(2025.0)9(2975.0故所求2的置信区间为(135.22,358.82)(n-1)S2/(n-1)S2/=9196.52/19.023=9196.52/2.7=135.22=358.8210课堂练习1某车床加工的缸套外径尺寸X~N(μ,σ2),现随机测得的10个加工后的某种缸套外径尺寸(mm)如下:90.01,90.01,90.02,90.03,89.9989.98,89.97,90.00,90.01,89.99()求σ2的置信度为95%的置信区间。2201853.0S111.标准正态分布的右侧分位点ZZ是标准正态分布中满足下式的右侧分位点:P{ZZ}=0f(x)xz1-二.总体均值μ的区间估计如图所示,(Z)=1-,因此,可由正态分布表得到Z。如:要查Z0.025,由正态分布表可查得:(1.96)=0.975=1-0.025,故Z0.025=1.9612由正态分布的性质可得对给定的置信度1-,nXZ/}/{2/2/ZnXZP0f(x)xz/2/2-z/2/21-~N(0,1)}//{2/2/nZxnZxP由此可得从而的置信度为1-的置信区间为,/(2/nZx,),(dxdxnZd/2/为便于记忆和理解,将的置信区间表示为如下形式:2.σ2已知时总体均值μ的区间估计有11)/2/nZx其中d称为估计的允许误差。13可用Excel的统计函数NORMSINV返回Z。语法规则如下:格式:NORMSINV(1-)功能:返回Z的值。说明:NORMSINV()返回的是Z1-的值。用Excel求Zα14Y/nXt3.t分布设X~N(0,1),Y~2(n),且X与Y相互独立,则随机变量服从自由度为n的t分布,记为t~t(n)。15t分布密度函数的图形标准正态分布分布是t分布的极限分布。当n很大时,t分布近似于标准正态分布。xf(x)0n=1n=4n=10n=∞,N(0,1)160xf(x)t分布的右侧分位点t(n)t(n)为t分布中满足下式的右侧分位点:P{tt(n)}=由给定的概率,可查表得到t(n)。由t分布的对称性,可得:t1-(n)=-t(n)。t(n)t1-(n)=-t(n)17可用Excel的统计函数TINV返回t(n)。语法规则如下:格式:TINV(2,n)功能:返回t(n)的值。说明:TINV(,n)返回的是t/2(n)的值。用Excel求t/2(n)184.2未知时总体均值μ的区间估计~t(n-1),),(dxdxnSntd/)1(2/nSXt/设总体X~N(μ,σ2),X和S2分别为样本均值和样本方差。由此可得的置信度为1-的置信区间为因此,对给定的置信度1-,有1)}1(/)1({2/2/ntnSXntP1}/)1(/)1({2/2/nSntXnSntXP即X1,X2,···,Xn为X的容量为n的样本,可以证明:19nPPPp/)1()1,0(N近似服从1}/)1({2/2/ZnPPPpZP,),(dpdpnppZd/)1(2/用样本比例代替总体比例,设总体比例为P,则当nP和n(1-P)都大于5时,样本成数p近似服从均值为P,方差为P(1-P)/n的正态分布。从而对给定的置信度1-,由可得总体成数P的置信度为1-的置信区间为§6.2总体比例的区间估计20【例3】求例1中元件平均寿命的95%置信区间。故所求的95%置信区间为解:由例1,x/2=0.025,10/5.1962622.2=1423.1,S=196.5,=1-0.95=0.05,n=10,查表得t0.025(9)=2.26226.140nSntd/)1(2/),(dxdx可用Excel的【工具】→“数据分析”→“描述统计”求解正态总体均值的置信区间。)7.1563,5.1282(21课堂练习2:某车床加工的缸套外径尺寸X~N(μ,σ2),下面是随机测得的10个加工后的缸套外径尺寸(mm),90.01,90.01,90.02,90.03,89.9989.98,89.97,90.00,90.01,89.99(,)求μ的置信度为95%的置信区间;001.90x2201853.0S22【例4】某厂为了解产品的质量情况,随机抽取了300件产品进行检验,其中有5件次品,求该厂产品次品率的置信度为95%的置信区间。解:产品次品率为比例,=1-0.95=0.05,/2=0.025,n=300,,查表得Z0.025=1.96,样本成数%67.1300/5pnppZd/)1(2/300/)0167.01(0167.096.1该厂产品次品率的置信度为95%的置信区间为),(dpdp)3.12%%,22.0(%45.123案例思考题国外民意调查机构在进行民意调查时,通常要求在95%的置信度下将调查的允许误差(即置信区间的d值)控制在3%以内。⑴问为满足该调查精度要求,至少需要多大的样本?⑵如果要求置信度达到99%,调查误差仍为3%,此时至少需要多大的样本?24案例思考题解答(1)本案例中,,可得由/)1(2/nppZd222/)1(dppZn时,当5.0p故需要的样本容量至少为2203.05.05.096.1n1.1067(人)1068达到最大值,)1(pp25案例思考题解答(2)如果要求置信度达到99%,则Z/2=Z0.005=2.575,2203.05.05.0575.2n8.1841(人)184226§6.3样本容量确定前面的分析都是在给定的样本容量和样本数据下求置信区间。但在实际应用中,应当在随机抽样前就确定所需抽取的样本容量。抽取的样本容量过大,虽然可以提高统计推断的精度,但将增加不必要的人力、物力、费用和时间开支;如果抽取的样本容量过小,则又会使统计推断的误差过大,推断结果就达不到必要的精度要求。确定样本容量的原则——在满足所需的置信度和允许误差条件(置信区间的d值)下,确定所需的最低样本容量。271.总体均值区间估计时样本容量的确定在给定置信度和允许误差d的条件下,由nSntd/)1(2/可得22/)1(dSntn22/dz其中总体标准差或样本标准差也是未知的,通常可以先通过小规模抽样作出估计。由于使用的是近似公式,可知实际采用的最低样本容量应比计算结果稍大。22/dSz28【例6】在例3元件平均寿命的区间估计问题中,要求⑴在95%的置信度下,使估计的允许误差不超过其平均寿命的10%,并设已得到例1的先期抽样数据。求所需的最低样本容量。⑵其他条件不变,在99%的置信度下求所需最低样本容量。解:⑴由例1,,1.1423x2025.0dSznS=196.5,d=1423/10=142.3可知取n=10已能满足所给精度要求。⑵23.1425.19696.183.72005.0dSzn23.1425.19658.2137.12可知此时取n=20就能满足所给精度要求。在总体均值的区间估计中,通常n=30就称为大样本。在大样本时,无论总体服从什么分布,都可用前述公式进行区间估计。292.总体比例区间估计时样本容量的确定其中样本成数p同样可先通过小规模抽样作出估计,也可根据其他信息估计,或取0.5。,由/)1(2/nppZd222/)1(dppZn可得30【例7】某企业要重新制定产品抽样检验的规范。已知过去检验的次品率在3.6%左右,现要求允许误差不超过2%,置信度为95%。问每次至少应抽查多少产品?解:由题意,要推断的是总体成数,p=0.036,1-p=0.964,d=0.02,α=0.05,zα/2=z0.025=1.96故每次至少应抽查334件产品。由此可知,在总体比例的区间估计问题中,要达到一定的精度要求,样本容量至少要在几百以上。2202.0964.0036.096.1)(3.333件222/)1(dppZn31【例5】(1)求例1中元件平均寿命的95%置信下限。(2)求元件寿命方差的95%置信上限。解:(1)1)}1(/{ntnSXP从而的单侧1-置信下限为/)1(nSntX本例中,t0.05(9)=1.8331,故所求置信下限为1423.1-1.8331196.5/10该在95%的置信度下,该元件的平均寿命大于1309.2小时。=1390.2可得1}/)1({nSntXP由§6.4单侧置信限的区间估计32同理可得2的置信度为1-的单侧置信上限为)1()1(212nSn本例中,)1(21n故所求2的95%置信上限为9196.52/3.325=323.32(小时2)由以上分析可知,求单侧置信限与求双侧置信限的差别仅在于用相应分布的右侧分位点代替双侧区间估计公式
本文标题:《应用统计学》第6章:置信区间估计
链接地址:https://www.777doc.com/doc-6953379 .html