您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 统计学基础(第八章)
第八章参数估计statistics统计学——第八章参数估计第一节参数估计的一般问题第二节单总体参数的区间估计第三节样本容量的确定本章内容statistics统计学——第八章参数估计第一节参数估计的一般问题statistics统计学——第八章参数估计参数估计在统计方法中的地位参数估计假设检验统计方法描述统计推断统计statistics统计学——第八章参数估计一、抽样推断(一)抽样推断的概念:按照随机性原则,从研究对象中抽取一部分进行观察,并根据所得到的观察数据,对研究对象的数量特征做出具有一定可靠程度的估计和推断,以达到认识总体的一种统计方法。(二)抽样推断的特点:1.样本资料对总体的数量特征作出具有一定可靠性。2.按照随机性原则从全部总体中抽取样本单位。3.抽样推断必然会产生抽样误差。statistics统计学——第八章参数估计二、参数估计的一般问题(一)参数估计(parameterestimation)就是用样本统计量去估计总体的参数。1.估计量:用于估计总体参数的随机变量•如样本均值、样本比率、样本方差等•样本均值就是总体均值的一个估计量2.参数用表示,估计量用表示3.估计值:估计参数时计算出来的统计量的具体值•如果样本均值x=5600,则5600就是总体均值的估计值statistics统计学——第八章参数估计总体参数符号表示样本统计量均值μx比例πp方差σ2S2表8-2样本统计量和总体参数符号对应关系statistics统计学——第八章参数估计(二)点估计与区间估计1.点估计根据样本统计量直接估计出总体参数θ的值,称为参数的点估计。常用的方法有两种:矩估计法和极大似然估计法。2.区间估计在点估计的基础上,给出总体参数估计的一个范围。图8-1给出了区间估计的示意图:statistics统计学——第八章参数估计图8-1区间估计的图示statistics统计学——第八章参数估计3.在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间,其中区间的最小值称为置信下限,最大值称为置信上限。4.置信水平:如果将构造置信区间的步骤重复多次,置信区间包含总体参数真值的次数所占的比率。5.比较常用的置信水平及正态分布曲线下的右侧面积为时的值(即临界值Zα/2)。statistics统计学——第八章参数估计表8-3常用置信水平的值statistics统计学——第八章参数估计图8-3重复构造出置信水平95%,的20个置信区间点估计值statistics统计学——第八章参数估计三、评估估计量的标准无偏性:估计量抽样分布的数学期望等于被估计的总体参数。P()BA无偏有偏图8-4有偏和无偏估计量的例子statistics统计学——第八章参数估计一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。AB较小的样本容量较大的样本容量P()图8-5两个不同容量样本统计量的抽样分布statistics统计学——第八章参数估计有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效。AB的抽样分布的抽样分布P()图8-6两个无偏点估计量的抽样分布statistics统计学——第八章参数估计第二节单总体参数的区间估计statistics统计学——第八章参数估计一、总体均值的区间估计(一)大样本的估计方法1.样本均值经过标准化以后的随机变量则服从正态分布,2.总体均值所在(1-α)置信水平下的置信区间为:xμZ~N(01)σn即,nσx2αZnσx2αZ称为置信下限,nσx2αZ称为置信上限。statistics统计学——第八章参数估计例1:一家食品生产企业以生产袋装食品为主,为对产量质量进行监测,企业质检部门经常要进行抽检,以分析每袋重量是否符合要求。现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如表8-3所示。已知产品重量的分布服从正态分布,且总体标准差为10g。试估计该批产品平均重量的置信区间,置信水平为95%。112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.0108.8101.6108.698.4100.5115.6102.2105.093.3表8-325袋食品的重量单位:gstatistics统计学——第八章参数估计解:已知总体服从正态分布,且标准差为σ=10,n=25,置信水平为1-α=95%,查标准正态分布表得:2Z=1.96根据样本计算均值,得x=105.36g于是有:.28101.44,1093.92105.3625101.96105.36nσx2αZ即该批食品平均重量95%的置信区间为101.44~109.28g。statistics统计学——第八章参数估计利用Excel来计算置信区间•1.将样本数据输入Excel工作表中A1︰E5statistics统计学——第八章参数估计•2.计算样本均值。点击粘贴函数“fx”,选择“统计”下的“AVERAGE”函数。在出现的“函数参数”对话框中,“Number1”一栏填入样本数据所在区域A1︰E5,然后“确定”,在输出区域内(本例放置在F1)得结果105.36,此即样本均值。xstatistics统计学——第八章参数估计•3.计算样本标准差,选择的函数为“统计”下的“STDEV”函数。本例放在G1,得结果9.6545。statistics统计学——第八章参数估计•4.计算允许误差。选择“统计”下的“CONFIDENCE”函数,在出现的“函数参数”对话框中,“Alpha”一栏填入显著性水平“0.05”,“Standard_dev”一栏填入总体标准差“G1”(大样本情况下,可用样本标准差代替),“Size”一栏填入样本容量“25”,然后“确定”,在输出区域内得允许误差“3.784490”(取近似值3.78)。statistics统计学——第八章参数估计•5.置信下限为105.36-3.78=101.58,置信上限为105.36+3.78=109.14,即置信区间为(101.58,109.14)g。statistics统计学——第八章参数估计(二)小样本的估计方法总体方差σ2未知,而且是在小样本的情况下,则需要用样本方差S2代替σ2,这时样本均值经过标准化以后的随机变量则服从自由度为(n-1)的t分布,即:1)t(n~nSμxtstatistics统计学——第八章参数估计t分布是类似正态分布的一种对称分布,它通常要比正态分布平坦和分散。一个特定的分布依赖于称之为自由度的参数。随着自由度的增大,分布也逐渐趋于正态分布,如图8-7和图8-8所示:图8-7t分布与标准正态分布的比较图8-8不同自由度的t分布statistics统计学——第八章参数估计•总体均值在1-置信水平下的置信区间为:nStx2α式中:tα/2是自由度为n-1时,t分布中上侧面积为α/2时的临界值,该值可通过t分布表查得。statistics统计学——第八章参数估计利用Excel中的TINV统计函数计算t分布临界值•t分布临界值可通过Excel中的TINV统计函数来计算。点击粘贴函数“fx”,选择“统计”下的“TINV”函数。在对话框中,“Probability”一栏填入显著性水平(本例为0.05),“Deg_freedom”填入自由度(本例为15),然后“确定”。得结果“2.13145”,此即t分布的临界值。statistics统计学——第八章参数估计例2:已知某种灯泡的寿命服从正态分布,现从一批灯泡中随机抽取16只,测得其使用寿命如表8-5所示。建立该批灯泡平均使用寿命95%的置信区间。1510145014801460152014801490146014801510153014701500152015101470表8-516只灯泡使用寿命数据单位:h解:根据样本数据,计算样本均值=1490h,样本方差S=24.77h根据α=0.05查t分布表得(n-1)=t0.025(15)=2.131于是,平均使用寿命的置信区间为:α224.77xt14902.131n16149013.21476.81503.2S,即全部灯泡的平均使用寿命,在置信水平1-α=0.95下的置信区间为(1476.8,1503.2)h。statistics统计学——第八章参数估计总结:总体分布样本容量σ已知σ未知大样本(n≥30)nσZx2αnSZx2α正态分布小样本(n30)nσtx2αnStx2α非正态分布大样本(n≥30)nσZx2αnSZx2α表8-6总体均值的区间估计statistics统计学——第八章参数估计二、总体比例的区间估计1.样本比例经标准化后的随机变量则服从正态分布,即:N(0,1)~nπ)π(1πpZ2.总体比例在1-置信水平下的置信区间为:np)-p(1zp2α式中,1-α称为置信水平;是标准正态分布上侧面积为α/2时的临界值;是估计总体比例时的允许误差。2Znp)-p(1Z2αstatistics统计学——第八章参数估计例3:为了解某城市家庭电脑的普及情况,随机抽取了100户家庭,其中有60户有电脑。试以95%的置信水平估计该城市家庭中拥有电脑比例的置信区间。解:已知n=100,n1=60,则样本比例为:p=60%由于1-=95%,查标准正态分布表可知,Zα/2=1.96。于是即该城市家庭中,拥有电脑的比例在置信水平95%下的置信区间为:(50.396%,69.604%)。α2p(1p)pzn60%(160%)60%1.9610060%9.604%50.396%69.604%,statistics统计学——第八章参数估计三、总体方差的区间估计总体方差在(1-α)置信水平下的置信区间为:22222α21α2n1n1σχn1χn1SSstatistics统计学——第八章参数估计例4:一家食品生产企业以生产袋装食品为主,现从某天生产的一批食品中随机抽取了25袋,测得每袋重量如下表所示。已知产品重量的分布服从正态分布。以95%的置信水平建立该种食品重量方差的置信区间。表8-725袋食品重量statistics统计学——第八章参数估计解:根据样本数据计算样本方差:S2=93.21;已知n=25,1-=95%,查χ2分布表可得临界值为:总体方差2置信水平为95%的置信区间为:即:总体方差的置信区间为(56.83,180.39)。相应地,企业生产的食品总体重量标准差的的置信区间为7.54g~13.43g。39.3641(24)χ1)(nχ20.02522α12.4011(24)χ1)(nχ20.975212α225193.2125193.2139.364112.4011statistics统计学——第八章参数估计第三节样本容量的确定statistics统计学——第八章参数估计一、估计总体均值时样本容量的确定一旦确定了置信水平(1-α),Zα/2的值就确定了,对于给定的的值和总体标准差σ,就可以确定任一希望的允许误差所需要的样本容量。令E代表所希望达到的允许误差,即:nσzE2α由此可以推到出确定样本容量的公式如下:2222αEσ)(znstatistics统计学——第八章参数估计例5:拥有MBA学位的研究生年薪的标准差大约为4000元,假定想要估计年薪95%的置信区间,希望允许误差为10000元,应抽取多大的样本容量?解:已知=4000,E=1000,1-=95%,Zα/2=1.96,所以,应抽取的样本容量为:即应抽取62人作为样本。6261.4710004000(1.96)Eσ)(zn2222222αstatistics统计学——第八章参数估计二、估计总体比例时样本容量的确定一旦确定了置信水平(1-α),Zα/2的值就确定了。由于总体比例的值是固定的,所以允许误差由样本容量来确定,样本容量
本文标题:统计学基础(第八章)
链接地址:https://www.777doc.com/doc-4476000 .html