您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 抽样技术6二阶及多阶抽样
第六章二阶及多阶抽样•初级单元大小相等时的二阶抽样•初级单元大小不等时的二阶抽样•样本量的确定和多阶段抽样的问题8.1概述一.什么是多阶段抽样1.概念:设总体由N个初级单元组成,每个初级单元又由若干次级单元组成,若在总体中按一定方法抽取n个初级单元,对每个被抽中的初级单元再抽取若干次级单元进行调查,这种抽样称为二阶抽样,或二级抽样(two-stagesampling)。一些记号:初级单元(PSU)----PrimarySamplingUnit二级单元(SSU)----Second-stageSamplingUnit三级单元(TSU)----Third-stageSamplingUnit最终单元(USU)----UltimateSamplingUnit2.实施步骤:(1)从总体中抽初级单元,称为第一阶抽样;(2)从每个被抽中的初级单元中抽二级单元,称为第二阶抽样,以此类推。3.与其他几种抽样方法的关系:整群抽样可以看成是二阶抽样的特殊情形,即最后一阶抽样是100%的抽样;分层抽样也可看作是多阶抽样的特例,每个初级单元即是层,第一阶抽样是100%抽样,而层内抽样则是第二阶抽样。4.抽样方法:多阶抽样中每一个阶段的抽样可以相同,也可以不同,它通常与分层抽样、整群抽样、系统抽样结合使用。一般来说,当初级单元大小相同时,第一阶段的抽样采用简单随机抽样;当初级单元大小不同时,第一阶段的抽样采用不等概抽样。二、多阶段抽样特点1.构造抽样框相对容易。分级准备抽样框,即每次只需要对被抽中的单元准备下一级抽样单元的抽样框;2.节省人力、物力。3.行政上便于组织。4.可用于散料的抽样。所谓“散料”,是指连续松散的、不易区分的个体或抽样单元的材料。例如一堆土,一车水泥和粮食等。对于散料,抽样单元可以人为划分,也可以取其自然的单位。进行散料抽样时,例:对土壤中有机磷的测定,一级单元是自然或人为划分的分装(例如10份土样),二级单元则是从分装中抽取一定数量(如一千克)的份样作调查。5.划分阶段不宜过多。例:某个新开发区拥有相同户型的15个单元的楼盘,居民已经陆续搬入新居,每个单元住有12户居民,为调查家庭装潢情况,准备利用二阶段抽样法,从180户居民户抽取20户进行调查。初级单位有15个,每个初级单元拥有的二级单元为12个,先从初级单元简单随机抽5个单元,然后在每个单元中简单随机抽取4户。(属于等概抽样?)编号单元房号1*A座12*3*4*5678910*11122B座1234567891011123C座1234567891011124D座1234567891011125E座1234567891011126*F座1*23456*789*1011*127G座1234567891011128H座1234567891011129*I座12345*67*8*910*111210J座12345678910111211K座12345678910111212*L座12345*67*8*91011*1213*M座1234*56*7*891011*1214N座12345678910111215H座123456789101112初级单元大小相等时的二阶抽样一、总体均值的估计量:假定总体由N个初级单元组成,每个初级单元都含有M个次级单元,简称初级单元规模相等的两阶段抽样。否则称为初级单元规模不相等的两阶段抽样。现对第一种情况:从N个初级单元中按简单随机抽样抽取n个初级单元,再从每个被抽中的初级单元中按简单随机抽样抽取m个次级单元。二、常用符号总体样本初级单元(psu)个数Nn初级单元拥有的二级单元个数Mm第i个psu中的第j个二级单元值Yijyij第i个初级单元按二级单元的平均值按二级单元的平均值初级单元(psu)均值间的方差第i个psu内ssu间的方差第一阶段抽样比第二阶段11MiijjYYM11miijjyym11NiiYYN11niiyyn22111()1NiiSYYN22111()1niisyyn2221()(1)MiijijSYYM22211()(1)miijijsyym1/fnN2/fmM)ˆ(EE)ˆ(E)1(21)ˆ(VE)ˆ(EV)ˆ(V)2(2121性质l:对于两阶抽样,有式中,E2,V2为在固定初级单元时对第二阶抽样求均值和方差;E1,V1为对第一阶抽样求均值和方差。两阶段抽样估计量的均值和方差推导过程记ˆ()E,ˆ()V2ˆ()E212ˆ()EE22ˆ()E22ˆ()E22ˆ2()E22ˆ()E2ˆ()V22ˆ2()E对两边求1E,得ˆ()V212ˆ()EE12ˆ()EV212ˆ()EE12ˆ()VE12ˆ()EV三、估计量及其性质(一)总体均值的估计:对于初级单元大小相等的二阶抽样,如果两个阶段都是简单随机抽样,且对每个初级单元,第二阶抽样是相互独立进行的,则对总体均值的无偏估计为:Y11111nnmiijiijyyynnm其方差为:22221111)(SnmfSnfyV的无偏估计为:21122211((1))fvffyssnnm)(yVy222123112123(1)1(1)()ffffffysssnnmnmk类似的,可以构造三阶抽样的估计方差22112222211122112121()111()(1)1()(1)niinnmiijiiijsyynssyynnmfvyfssnnmf其中,证明:22N1i2i2n1i2i21n1iM1j2iij1n1im1j2iij21n1im1j2iij21222122SSN1Sn1E)YY(1M1n1E)yy(1m1En1E)yy()1m(n1EE)s(EE)s(E22112121(1)(3)()()fffVyvyssnmn的无偏估计为.Ssmf1sSˆSmf1S)s(EE)s(E.Ss212222121222212121212222的无偏估计是的无偏估计是)的无偏估计。(是yVsmn)f1(fsnf1)y(v2221211例:某部门欲研究某农药在叶面上的残留量,第一步先从一块棉田1000株里简单随机抽取4株,然后从每株上简单随机抽取4片叶子(假定每株共200片叶子),数据如下表,试估计每片叶子农药的平均残留量,并计算抽样误差。植株各叶片上农药的残留量13.283.093.033.033.110.0140323.523.483.383.383.440.0050732.882.82.812.762.810.00249243.343.383.233.263.300.0048iy2is11(3.113.442.813.3)/43.165()niiyyn解单位:22111()113niisyyn22222[(3.11-3.165)+(3.44-3.165)+(2.81-3.165)+(3.3-3.165)]=0.07403(单位)42222110.00664iiss22112121(1)()10.0040.0040.074030.00664440.01850.0000016170.01851617fffvyssnmn(1-0.02)例:欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这三天的流水帐。调查结果如下:对5家企业的调查结果样本企业第一日第二日第三日12345573851486259416053556450634954要求根据这些数据推算100家企业该指标的总量,并给出估计的95%的置信区间。解:利用二阶抽样,首先将企业作为初级单元,将每一天看作二级单元,每个企业在调查月内都拥有30天(即拥有30个二级单元)。•在这个问题中,调查人员首先在初级单元中抽取了一个n=5的简单随机样本,然后对每个样本单元的二级单元分别独立抽取了一个m=3的简单随机样本,这就是初级单元大小相等的二阶抽样问题。由题意,N=100,M=30,n=5,m=31250.0510030.130nfNmfM首先计算样本初级单元的均值iy、方差22is样本企业iy22is123456043585057133939719于是得到:6.53)5750584360(5111niiyny3.49)(111221niiyyns,4.23112222niisns4372.94.2335)1.01(05.03.49505.01)1(1)(ˆ2221211smnffsnfyV11222221(1)10.050.05(10.1)ˆ()9.4372553147.923.Sa4s3bwbwfffVynmnssmss可利用的方差分析直接给出,的结果。计算)ˆ(ˆˆYVY及:ˆ1003053.6160800YNMy2222ˆˆˆ()()100309.437284934800VYNMVyYˆ的标准差为:ˆˆˆ()()84934800sYVY=9216在置信度95%的条件下,对应的t=1.96,因此,Yˆ的置信区间为:1608001.969216•方差估计式中,第一项是主要的,第二项要小得多,这是因为第二项的分母是第一项的m倍,而且它还要乘以小于1的f1。影响精度的主要是初级单元,所以抽样设计的原则:在经费一定时,多抽一些初级单元,少抽一些二级单元比较好。•如果第一阶的抽样比f1可以忽略,则方差估计式可以简单为如下的结果:•这个结果在实际工作中非常有用,因为第二阶抽样采用等距抽样或某些复杂抽样时,方差的无偏估计很难得到,当f1可以忽略时,只需要初级单元指标按次级单元的平均值就可以得到方差的估计。221121222211111(1)111()1niifffvyssnmnfssyynnnn说明:若两阶段的抽样都是不放回简单随机的,则总体比例P的无偏估计量为111ˆP,NNniiiipPppn其方差为22121211()ffVpSSnmn2、总体比例的估计22111()1niisppn2211(1)1niiimsppnm,,221121222112121(1)()()1(1)()fffVyvyssnmnfffvpssnmn对照:的无偏估计为故:V(P)的无偏估计为:无偏估计为:niiiniiqpmnffppnnfpv1221121)1()1()()1(1)()(pV例:欲调查某个新小区居民户家庭装修聘请专业公司的比例。在15个单元中随机抽取了5个单元,在每个单元都是12户,从中分别抽取4户,对这20户的调查结果如下:样本单元第一户第二户第三户第四户1栋A座YYNN2栋C座NYNN3栋C座NNNY4栋C座NNNN5栋B座YNNN根据上面的信息推算居民家庭装潢聘请专业装潢公司的比例。解:记请专业装潢公司的居民记为“1”,否则记为“0”,这里N=15,M=12,n=5,m=4,f1=5/15,f2=4/12因此,聘请专业装潢公司的比例为:121221111(21101)0.2554(1)()(1)0.00657()()0.081950.251.960.081iniinniiiianmffpppqnmspvp
本文标题:抽样技术6二阶及多阶抽样
链接地址:https://www.777doc.com/doc-418265 .html