您好,欢迎访问三七文档
第六章整群与多阶抽样第一节概述1.二阶抽样•设总体由N个初级单元组成,每个初级单元又由若干个二级(次级)单元,若在总体中按一定方法抽取m个初级单元,对每个被抽中的初级单元再抽取若干二级单元进行调查,则这种抽样称为二阶抽样,或二级抽样(two-stagesampling)。2.多阶抽样•每个二级单元又由更小的三级单元组成,那么在第二阶抽样后,若对每个被抽中的二级单元中的三级单元再进行抽样,则这种抽样称为三阶抽样,或三级抽样。•二阶整群抽样•多阶抽样(multi-stagesampling)或多阶整群抽样(multi-stageclustersampling)。多阶样本图示多阶抽样的分类•群大小相等的单阶整群•群大小不等的单阶整群•单元大小相等的多阶抽样•单元大小不等的多阶抽样二、多阶抽样的特点和应用•1.多阶抽样的特点•(1)优点:•样本点相对集中,实施方便,每个基本单元调查费用低,充分发挥抽样的效率。•抽样框可分级准备,应用方便。•(2)缺点:抽样阶数越多,抽样误差越大。2.多阶抽样的应用•(1)基本单位数多且分散的总体,编制抽样框较困难或难以直接抽取到所需样本单元。•(2)需要掌握各级单位情况的情形•(3)散料的抽样•3.多阶抽样可以根据各阶单位的不同情况,灵活采用不同的抽样方法与组织形式。026.100008495.000008716.0)()(00008495.03996.06004.0279999104.0)1(11)(pvpvdeffppnmfpvsrssrs(3)设计效应nm=2800,f=f1f2=0.00896,则:第二节整群抽样概述一、整群抽样的概念1.整群抽样:•如果总体中所有较小的基本单元可以某种形式组成数量较少但规模较大的单元——初级抽样单元,这样,在总体中按一定方式抽取若干初级单元,调查每个被抽中的初级单元中所包含的全部次级单元,则这种抽样称为整群抽样,也称集团抽样。•这里的初级单元就是群(cluster)。整群样本图示•2.群的划分•3.整群抽样的分类•(1)等群抽样:•(2)不等群抽样:二、整群抽样的特点及使用场合•(一)特点•1.整群抽样的随机性•2.误差取决于群间差异•3.优点是便于组织实施,节省人力、时间等;缺点是相同样本量下抽样误差较大•4.整群抽样一般抽取每个基本单元花费低、但方差较大,统计分析花费较高。•(二)适用场合•1.编制抽样框上的便利•2.总体基本单位分布广泛•3.调查目的本身需求第三节群大小相等情形,对群进行简单随机抽样时的估计量及其方差一、记号Yij为总体第i群中的第j个小单元的指标值i=1,2,…,N;j=1,2,…,M。yij为样本中第i群中的第j个小单元的指标值,i=1,2,…,n;j=1,2,…,M。f=n/N为抽样比。MjijiMjijiyyYY11,MyyMYYiiii,2.总体(样本)群平均数:1.总体(样本)群和:.1,111niiiNiiynyYNNYY3.总体(样本)平均群和:nyMynMyyMYNYNMYYniiniMjijNiMjNiiij111111,4.总体(样本)均值:.)(11,)(1111221122niMjijNiMjijyynMsYYNMS5.总体(样本)总方差:.)(1,)(1212122yynMsYYNMSniibNiib.)()1(1,)()1(111221122niMjiijwNiMjiijwyyMnsYYMNS7.总体(样本)群内方差6.总体(样本)群间方差二、估计量及其性质1.估计量及其性质的无偏估计。是即则:YyY)yE(.11yMynynii(1)样本平均群和是总体平均群和的无偏估计总体(样本)均值:的无偏估计。是即YyYYM1)yE(M1)yE(MyEMynMyyNYNMYYniMjijNiMjiij1111,(2)样本均值是总体均值的无偏估计21)(bSnMfyV211222211)(111)()(11)()(,)(111)(bNiiNiiiiNiiSnMfYYNnfyVYYNMnfyVMyVYMYMYYYYNnfyV2.估计量的方差样本群间方差是总体群间方差的无偏估计若将群平均数i=Yi/M作为群指标值,样本方差是总体方差的无偏估计。∵E(sb2/M)=Sb2/M.∴E(sb2)=Sb2.Y21)(bsnMfyv所以,估计量方差的无偏估计为:3.估计量方差的估计4.总体方差的估计(1)样本群间方差是总体群间方差的无偏估计(2)样本群内方差是总体群内方差的无偏估计])1()1[(11)1()1()()()1(22222112122wbwbNiMjiijNiiSMNSNNMSSMNSNYYYYMSNM])1()1[(11222wbsMnsnnMs总体的总离差平方和可以分解为两部分:而样本方差也可以表示为:(3)样本总方差不是总体总方差的无偏估计])1()1[(11ˆ222wbsMNsNNMS])1([1ˆ222wbsMsMS(5)总体总和Y=NM的估计量及其方差可由上述结果直接推出。如果N很大,则:Y(4)总体总方差的无偏估计为iyiyijsi123456789101112240,187,162,185,206,197,154,173210,192,184,148,186,175,169,180149,168,145,130,170,144,125,167202,187,166,232,205,263,198,210210,285,308,198,264,275,183,231394,256,192,280,267,334,216,289192,121,172,165,152,224,195,241230,205,187,176,212,253,189,240274,208,195,307,264,258,210,309232,187,150,182,175,212,169,222342,294,267,309,258,198,244,286228,294,182,312,267,254,232,298188.00180.50149.75207.875244.25278.50182.75211.50253.125191.125274.75258.37527.1917.9817.3229.1745.2063.8738.7727.4844.5228.2943.7043.5212个楼层96户居民人均月食品消费额资料(单位:元)解:N=512,n=12,M=8,f=0.02344元)。元,(即:的置信限为:置信度为元)元)92.41283.194013.1296.1375.218%95(013.12)()(3089.14418.1418681202344.011)(18.1418619506118])375.218375.258()375.21800.188[(1128)(1(375.218125.2620121222122121YYyvyssnMfyvyynMsyybniibii三、群内相关系数与设计效应•1.群内相关系数:•(1)群内相关系数的定义及定义式:•同一群内不同小单元的指标值对总体均值的离差乘积的期望值与总体中所有小单元指标值对总体均值离差平方的期望值之比,即:2)())((YYEYYYYEijikijc(2)群内相关系数的计算式:用群间方差和群内方差表示的群内相关系数22222222)1()1()1()1(wbwbwbwbCSMSSSSMNSNNSSN群内相关系数的无偏估计。即:2222)1(ˆwbwbCsMsss(3)群内相关系数的估计])1(1[1])1(1[)1(11)(111)(222212cciNiMSnMfMSNMNMnfYYNnMfyV则:2.如何用群内相关系数估计和表示估计量方差(1)若按简单随机抽样直接从总体中抽取nM个单元,则样本均值的估计量方差3.设计效应deff21)(SnMfyVsrs21)(bSnMfyV(3)设计效应CbsrsMSSyVyVdeff)1(1)()(22(2)整群抽样的总体均值的估计量方差为(1)设计效应deff≈(2)群内相关系数的取值范围CCM)1(14.群内相关系数的取值与设计效应若Sw2=0,则:=1若群内方差=群间方差=总方差,则:=1/(1-NM)≈0若群内方差大于总方差,取值为负,0当群间方差为零时,Sb2=0,极小值为:=所以,的取值范围为[,1]。CCC11M11MCCC当0≤1,deff1当≤0,deff1C11MC(3)群内相关系数的取值与设计效应四、整群抽样效率分析例:N=512,n=12,M=8,f=0.0234412个楼层96户居民人均月食品消费额资料(单位:元)iyiyijsi123456789101112240,187,162,185,206,197,154,173210,192,184,148,186,175,169,180149,168,145,130,170,144,125,167202,187,166,232,205,263,198,210210,285,308,198,264,275,183,231394,256,192,280,267,334,216,289192,121,172,165,152,224,195,241230,205,187,176,212,253,189,240274,208,195,307,264,258,210,309232,187,150,182,175,212,169,222342,294,267,309,258,198,244,286228,294,182,312,267,254,232,298188.00180.50149.75207.875244.25278.50182.75211.50253.125191.125274.75258.37527.1917.9817.3229.1745.2063.8738.7727.4844.5228.2943.7043.52689.4527.0)18(1ˆ)1(1527.094.2420750.1275468.1431)18(18.1418668.143118.14186)1(ˆ68.143112163.17180)52.4398.1719.17(1211)()1(118.14186)(12222121122212cwbwbcniiniMjiijwniibMdeffsMssssnyyMnsyynMs解:第四节估计总体比例的整群抽样一、群大小相等情形1.估计量:简单估计样本均值:niiniianMpnp1111样本均值是总体均值的无偏估计。E(p)=PNiiPPNnfpV12)(111)(niippnnfpv12)()1(1)(3.估计量方差的估计估计量方差的一个无偏估计为:2.估计量的方差:NiisrssrsPPNPQMpVpVdeffMPQnfnMPQNMnMNMpV12)()()(11)(4.设计效应:例:同前例,对该居民小区也进行了电话拥有情况的调查,资料如下,试对该小区的电话拥有率进行估计。iaipiiaipi1234564356340.50.3750.6250.750.3750.57891011125264350.6
本文标题:整群和多阶抽样
链接地址:https://www.777doc.com/doc-419006 .html