您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 人大版_贾俊平_第五版_统计学_第7章_参数估计
第7章参数估计7.1参数估计的基本原理7.1.1估计量与估计值参数估计就是用样本统计量去估计总体参数。用于估计总体参数的统计量称为估计量,根据样本计算出来的估计量的数值称为估计值。总体参数符号表示用于估计的样本统计量一个总体均值比例方差两个总体均值之差比例之差方差比21212PP2212xˆp2s12xx12ˆˆpp2212ssP被估计的总体参数7.1.2点估计与区间估计1.点估计用样本统计量的某个取值直接作为总体参数的估计值。例如:用样本均值x作为总体未知均值的估计值就是一个点估计点估计没有给出估计值接近总体未知参数程度的信息样本统计量(点估计)置信区间置信下限置信上限2.区间估计在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。对样本统计量与总体参数的接近程度给出一个概率度量。例如:总体均值落在50~70之间,置信度为95%x_XX=Zx95%的样本-1.96x+1.96x99%的样本-2.58x+2.58x90%的样本-1.65x+1.65x置信水平:1.置信区间中包含总体参数真值的次数所占比例2.表示为(1-–为显著性水平,是总体参数未在区间内的概率3.常用的显著性水平值有99%,95%,90%–相应的为0.01,0.05,0.10区间与置信水平均值的抽样分布(1-)%区间包含了%的区间未包含x1-/2/2xXP(X)XCA无偏有偏7.1.3评价估计量的标准1.无偏性估计量抽样分布的数学期望等于被估计的总体参数,E。则称为的无偏估计量。2,,xps分别是2,,的无偏估计量2.有效性对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。与其他估计量相比,样本均值是一个更有效的估计量AB中位数的抽样分布均值的抽样分布XP(X)3.一致性随着样本量的增大,点估计量的值越来越接近被估总体参数。AB较小的样本容量较大的样本容量P(X)X7.2一个总体参数的区间估计7.2.1总体均值的区间估计1.正态总体、方差已知,或非正态总体、大样本总体服从正态分布,且总体方差(2)已知如果不是正态分布,可以由正态分布来近似(n≥30)使用正态分布统计量~0,1xzNn进行估计总体均值在1-置信水平下的置信区间为2xZn;如果方差未知,或总体不服从正态分布的情况下,只要满足大样本条件,可以用样本方差代替总体方差,即2sxZn【例】某种零件长度服从正态分布,从该批产品中随机抽取9件,测得其平均长度为21.4mm。已知总体标准差0.15mm,试建立该种零件平均长度的置信区间,给定置信水平为0.95。解:已知X~N(,0.152),x=2.14,n=9,1-=0.95,Z/2=1.96总体均值的置信区间为22,0.150.1521.41.96,21.41.969921.302,21.498xZxZnn【例】某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36小时)解:已知x=26,=6,n=100,1-=0.95,Zα/2=1.96176.27,824.24100696.126,100696.126,22nZxnZx2.正态总体、方差未知、小样本用样本方差代替总体方差,这时用t统计量进行估计。~1xttnsn总体均值在1-置信水平下的置信区间1122,nnssxtxtnn【例】从一个正态总体中抽取一个随机样本,n=25,其均值x=50,标准差s=8。建立总体均值的95%的置信区间。解:已知X~N(,2),x=50,s=8,n=25,1-=0.95,t/2=2.0639。3.53,69.462580639.250,2580639.250,1212nstxnstxnn7.2.2总体比例的区间估计总体服从二项分布,样本量足够大,样本比例的抽样分布可用正态分布近似时,对总体比例的区间估计,使用统计量~0,11pzNn,总体比例p的置信区间为21pppZn【例】某企业在一项关于职工流动原因的研究中,从该企业前职工的总体中随机选取了200人组成一个样本。在对其进行访问时,有140人说他们离开该企业是由于同管理人员不能融洽相处。试对由于这种原因而离开该企业的人员的真正比例构造95%的置信区间。解:已知n=200,=0.7,n=1405,n(1-)=605,=0.95,Z/2=1.96pp2ˆˆ(1)ˆ0.7(10.7)0.71.962000.636,0.764pppZn7.2.3总体方差的区间估计对于正态总体方差的估计,可以用22221=~1nsn统计量进行估计总体方差在1-α置信水平下的置信区间为222221211,nsns【例】对某种金属的10个样品组成的一个随机样本作抗拉强度试验。从实验数据算出的方差为4。试求2的95%的置信区间。解:已知n=10,s2=4,1-=95%2置信度为95%的置信区间为3314.13,8925.17004.24110,0228.1941107.3两个总体参数的区间估计7.3.1两个总体均值之差的区间估计11总体122总体2抽取简单随机样样本容量n1计算X1抽取简单随机样样本容量n2计算X2计算每一对样本的X1-X2所有可能样本的X1-X212抽样分布1.两个总体均值之差的估计:独立样本如果两个样本是从两个总体中独立抽取的,即一个样本中的元素与另一个样本中的元素相互独立,则称为独立样本(1)大样本的估计如果两个都是正态分布,或两个都是大样本(n≥30),则有1212221212~0,1xxzNnn当两个总体的方差已知时,两个总体均值之差在1-α置信水平下的置信区间为:221212212xxznn当两个总体的方差未知时,两个总体均值之差在1-α置信水平下的置信区间为:221212212ssxxznn某地区教育管理部门想估计两所中学的学生高考时的英语平均分数之差,为此在两所学校独立抽取两个随机样本,有关数据如下:121212463386785.87.2nnxxss建立两所学校高考英语平均分之差95%的置信区间221212212220.0255.87.28678463381.961.52ssxxznnz(2)小样本的估计在两个样本都是小样本的情况下,为估计两个总体的均值之差,需要做出以下假定两个总体都服从正态分布两个随机样本独立的分别抽自两个总体则两个样本均值之差必定服从正态分布1)总体方差已知使用正态分布统计量Z两个总体均值之差1-2在1-置信水平下的置信区间为)1,0(~)()(2221212121NnnXXZ222121221)(nnZxx【例】一个银行负责人想知道储户存入两家银行的钱数。他从两家银行各抽取了一个由25个储户组成的随机样本,样本均值如下:银行A:4500元;银行B:3250元。设已知两个总体服从方差分别为A2=2500和B2=3600的正态分布。试求A-B的区间估计(1)置信度为95%(2)置信度为99%解:已知XA~N(A,2500)XB~N(B,3600)xA=4500,xB=3250,A2=2500B2=3600nA=nB=25(1)A-B置信度为95%的置信区间为25003600(45003250)1.962525=1219.78,1280.62(2)A-B置信度为99%的置信区间为25003600(45003250)2.582525=1209.7,1290.32)总体方差未知但相等使用t分布统计量两个总体均值之差1-2在1-置信水平下的置信区间为12121212211pxxttnnsnn221122212112pnsnssnn2121221112nnsnntxxp【例】为比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员随机安排了10位顾客,并记录下为每位顾客办理账单所需的时间(单位:分钟),相应的样本均值和方差分别为:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位职员办理账单所需时间均服从正态分布,且方差相等。试求两位职员办理账单的服务时间之差的95%的区间估计。解:已知X1~N(1,2)X2~N(2,2)x1=22.2,x2=28.5,s12=16.63s22=18.92n1=n2=1012=121-2置信度为95%的置信区间为2.42101092.1811036.1611021121222211nnsnsnsp)4.2,2.10(101101)2.4)(1.2(5.282.223)当两个总体方差未知且不相等使用的统计量为1212221212()()~()XXttvssnn2221212222211221112ssnnvsnsnnn两个总体均值之差1-2在1-置信水平下的置信区间为221212212()ssxxtvnn【例】为比较两位银行职员为新顾客办理个人结算账目的平均时间长度,分别给两位职员随机安排了10位顾客,并记录下了为每位顾客办理账单所需的时间(单位:分钟),相应的样本均值和方差分别为:x1=22.2,s12=16.63,x2=28.5,s22=18.92。假定每位职员办理账单所需时间均服从正态分布,但方差不相等。试求两位职员办理账单的服务时间之差的95%的区间估计。自由度f为1-2置信度为95%的置信区间为189.179121092.189121036.1621092.181036.16f)35.2,25.10(1092.181036.161009.25.282.22解:已知X1~N(1,2)X2~N(2,2)x1=22.2,x2=28.5,s12=16.63s22=18.92n1=n2=1012122.两个总体均值之差的估计:匹配样本匹配样本:一个样本中的数据与另一个样本中的数据相对应,可以消除样本指定的不公平(1)大样本两个总体均值之差1-2在1-置信水平下的置信区间为2ddzn其中:d表示两个匹配样本对应数据的差值d表示各差值的均值d表示各差值的标准差,当总体d未知时,可以用样本差值的标准差ds代替(2)小样本假定两个总体个观察之的配对差服从正态分布,两个总体均值之差1-2在1-置信水平下的置信区间为21dsdtnn7.3.2两个总体比例之差的区间估计1.假定条件两个总体是独立的两个总体服从二项分布可以用正态分布来近似2.两个总体比例之差P1-P2在1-置信水平下的置信区间为222111221)1()1(ˆˆnppnppZpp【例】某饮料公司对其所做的报纸广告在两个城市的效果进行了比较,它们从两个城市中分别随机地调查了1000个成年人,其中看过广告的比例分别为p1=0.18和p2=0.14。试求两城市成年人中看过广告的比例之差的95%的置信区间。P1-P2置
本文标题:人大版_贾俊平_第五版_统计学_第7章_参数估计
链接地址:https://www.777doc.com/doc-2703640 .html