您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > z-CH9多阶段抽样-第1、2节
2019/8/20统计学专业必修课3学分1CH9多阶段抽样MS:Multi-stageSampling(4-5课时)2019/8/20统计学专业必修课3学分2MSMS在抽选样本单元时不是一次直接从总体中抽取总体基本单元BU,而是分两个或两个以上的阶段来抽样比如,城市住户调查中全国范围内→调查市县→住户(2S)全国范围内→调查市县→街道办事处→居委会→住户(MS)一阶/初级单元Primaryunit基本单元Baseunit二阶单元三阶单元等Secondaryunit2019/8/20统计学专业必修课3学分3MS方法的意义实践中,大规模的抽样调查项目往往都采用MSMS由CL发展而来(CL是单阶段抽样向多阶段抽样的过渡)MS可以看作对样本群内的单元实施再抽样的一种方法与CL类似:当某阶单元大小(群规模)相等时,则该阶的抽样采用等概抽样但是,实践中,大多数情况单元大小不等,此时,可以:等概抽样,加权估计不等概抽样,HH估计构造自加权样本,达到简化估计量及其方差形式的目的,此时估计精度也很不错2019/8/20统计学专业必修课3学分4MS中自加权样本的构造模式……第1阶第2阶第n阶各阶单元大小相等等概抽样各阶单元大小不等PPS抽样等概抽样自加权样本各阶样本量相等前几阶采用PPS抽样,最后一阶(针对BU)采用等概率抽样,并且,从第二阶开始,各阶单元的下层样本量都相同2019/8/20统计学专业必修课3学分5CH9内容体系§9.1抽样方式介绍MS的基本概念、优点及抽样推断原理§9.2PU大小相等的2S抽样均值和比例估计量及其性质两个阶段都实施等概抽样srs§9.3PU大小不等的2S抽样均值估计量及其性质等概抽样,加权估计不等概抽样,HH估计自加权样本的构造§9.4进一步讨论的问题2S条件下样本容量的确定和最优配置三阶段抽样估计,尤其是如何构造自加权样本2019/8/20统计学专业必修课3学分6§9.1抽样方式MS抽样的基本概念MS抽样的优点MS抽样估计推断原理2019/8/20统计学专业必修课3学分7一、MS的基本概念MS在抽选样本单元时并不是一次直接从总体中抽取BU,而是分两个或两个以上的阶段来进行比如,城市住户调查中全国范围内→调查市县→住户(2S)全国范围内→调查市县→街道办事处→居委会→住户(MS)一阶单元Primaryunit基本单元Baseunit二阶单元三阶单元等Secondaryunit阶段的多少视具体情况确定2019/8/20统计学专业必修课3学分8二、MS的优点MS来自于对CL的校正,所以MS具备CL的优点,同时也避免了CL的缺点(?)CL的优点:样本比较集中,便于组织抽样和调查、节约费用等;对于特殊结构的总体,CL往往效果好CL的缺陷:由于群内单元的相似性,CL的误差通常较大;另外,若群规模较大,群内实施全面调查难以体现抽样调查的优势MS的优点:保持了CL样本比较集中,便于调查、节约费用等优点,同时又避免了对小单元过多调查造成的浪费,从而充分发挥抽样调查的优点MS不需要编制所有BU的抽样框,从而可以简化抽样框的编制工作2019/8/20统计学专业必修课3学分9MS的优点(P189)1、简化抽样框的编制工作,便于组织抽样对范围较大、分布较广、单元数多的目标总体,实施MS,按现有的行政区划(或地理区域)划分各阶段抽样单元,从而简化抽样框的编制工作,便于样本单元的抽取2、可以使抽样方式更加灵活和多样MS中,各阶段可根据具体情况分别设计和采用不同的抽样组织方式(MS经常与st、cl、sy、PPS等相结合),从而充分发挥各种抽样方式的优势同时,各阶段也可以自行采用不同的估计方法2019/8/20统计学专业必修课3学分10MS的优点(续)3、能够提高估计精度与CL相比,相同的n,MS的样本在总体中的分布更广,因而也更具代表性同时,MS可以通过对方差较大的阶段设定高一点的抽样比,来进一步提高样本的代表性,从而提高抽样估计精度4、可以提高抽样的经济效益与CL相比,MS虽然看起来抽样过程更为复杂,但实际上操作起来非常简便(可操作性强),组织管理和实测调查的工作量也不大,因此MS的费用将更节省,经济效益更高5、可以为各级机构提供相应的信息MS可以满足各阶段(不同层次)的需要,这与st有些类似比如,中国城镇居民住户调查2019/8/20统计学专业必修课3学分11三、MS抽样推断原理(延展性内容)从理论上分析MS条件下估计量的期望和方差的基本公式本章各种形式的估计量的无偏性的证明和方差形式的推导都是依据的这个原理1、2S(P191-194))ˆ()ˆ(21EEE)]ˆ([)]ˆ([)ˆ(2121VEEVV其中E2、V2——固定PU时对第二阶抽样求均值和方差E1、V1——对第一阶抽样求均值和方差2019/8/20统计学专业必修课3学分12的说明)ˆ(EE)ˆ(E21)ˆ()ˆ(21EEE两个阶段抽取的所有可能样本估计量的期望对某一固定的第一阶段样本中,所有可能抽出的二阶样本的估计量的期望所有可能抽出的第一阶样本的估计量的期望2019/8/20统计学专业必修课3学分13举例说明总体包含3个PU,每个PU包含2个BU现:第一阶段srs抽取2个PU,第二阶段从每个抽中的PU中srs抽取1个BU比如,总体分3个学习小组,每个学习小组包括2名同学。现在先srs抽2个学习小组,再从抽中的学习小组中抽1名同学,进行某项成绩测试所有可能的样本共——C32×C21×C21=12个求这12个样本的估计量的数学期望可能的抽样结果)ˆ()ˆ(21EEEPUABCBU(a,b)(c,d)(e,f)2个1个PU(A,B)(B,C)(A,C)(a,c)(a,d)(b,c)(b,d)BU(c,e)(c,f)(d,e)(d,f)(a,e)(a,f)(b,e)(b,f)总体ˆˆˆˆ)ˆ(2Eˆˆˆˆ)ˆ(2Eˆˆˆˆ)ˆ(2E)ˆ(21EE2019/8/20统计学专业必修课3学分15的说明)]ˆ(V[E)]ˆ(E[V)ˆ(V2121定性理解:两个阶段的随机抽样均可能带来抽样误差∴2S的方差由两部分构成:一部分是第一阶段的方差V1;另一部分是第二阶段方差的均值22)]ˆ([)ˆ()ˆ(EEV证明:221221)]ˆ([)ˆ(EEEE)ˆ()ˆ(2121VEEV})]ˆ([)ˆ({)ˆ(2222121EEEEV)}ˆ()]ˆ([{)ˆ(21221221EVEEEE)ˆ(VE212019/8/20统计学专业必修课3学分16说明这不仅是2S抽样的估计推断原理,而是所有两步抽样的估计推断原理,比如,二重抽样、再抽样等方法都遵循这一原理2019/8/20统计学专业必修课3学分172、MS以上关于2S的估计推断原理可以推广至MS比如,3S)ˆ()ˆ(321EEEE)]ˆ([)]ˆ([)]ˆ([)ˆ(321321321VEEEVEEEVV2019/8/20统计学专业必修课3学分18§9.1的重点掌握:MS的基本概念MS的优点理解:2S与st和CL的关系2S的估计推断原理的理解2019/8/20统计学专业必修课3学分192S与CL和st的关系(开拓思路)共同特点:都是首先将总体分为若干的群(或初级单位)区别抽样方式不同抽样误差的来源不同2019/8/20统计学专业必修课3学分202S与CL和st的关系(续)①2S来源于对CL的校正在CL中,如果抽中群所含的次级单元数很多,此时对群内所有单元一一进行调查难度较大;尤其当群内单元标志值差别不大时,没必要这样做。这时,从中选群包含的BU中抽部分进行调查,就形成了2S②CL是一种特殊的2S,第一阶段抽部分PU,第二阶段是100%抽样,其误差来源于第一阶段:群间方差③st是一种特殊的2S,第一阶段100%抽PU(层),第二阶段抽层内的部分单元,其误差来源于第二阶段:层内方差④MS是st和CL的结合物,两个阶段都是抽取部分单元,都会产生误差2019/8/20统计学专业必修课3学分21三种抽样方法的比较组织形式PUBU精度(n相同时)提高精度的办法st抽全部抽部分高于srs缩小层内差异,扩大层间差异CL抽部分抽全部低于srs缩小群间差异,扩大群内差异增加群数2S抽部分抽部分介于CL和srs间减少PU间的差异尽量多抽PU§9.1结束2019/8/20统计学专业必修课3学分22§9.2PU大小相等的二阶段抽样一、符号说明二、均值估计量及其性质三、比例估计量及其性质2019/8/20统计学专业必修课3学分23意义PU大小相等指的是:总体中所有的PU中包含的二级单元数(BU数)都相等PU大小严格相等的情况实践中很少见,但是对它的讨论是MS的基础,同时也具有现实意义,主要体现在:1、有时,PU规模差异不明显,可近似为PU大小相等2、有时,对于PU大小不等的情况,可通过分层,将大小近似的PU分到一层,则层内的2S就可以按PU大小相等的情况讨论所以,本节的讨论很有理论和实践意义2019/8/20统计学专业必修课3学分24讨论的前提A个PUsrsa个PUM个BUM个BUM个BU……srsm个BUm个BUm个BU……每个PU相互独立地抽取等容量的BU数Aaf1Mmf2总体单元数=AM,样本单元数=am2019/8/20统计学专业必修课3学分25一、符号说明两个抽样比两个层次的均值两个方差Aaf1Mmf2基本符号(Yij,i=1,2,…,A;j=1,2,…,M)(yij,i=1,2,…,a;j=1,2,…,m)含义总体样本第i个PU的个体均值总的个体均值PU间方差PU内方差AiMjijAiiYAMYAY11111mjijiymy11aimjijaiiyamyay11111MjijiYMY11AiiYYAS1221)(11aiiyyas1221)(11AiMjiijAiMjiijYYMAYYMAS11211222])(11[1)()1(1aimjiijaimjiijyymayymas11211222])(11[1)()1(122iSAiiSAS12222122is2019/8/20统计学专业必修课3学分27二、均值估计量及其性质2019/8/20统计学专业必修课3学分28均值估计量及其性质的基本结论yYˆaimjijyam111aiiya1122221111)(SamfSafyV2221211)1(1)(samffsafyv是无偏估计第一阶抽样误差,是误差的主要组成部分am一定时,提高a而减少m会有效提高估计的精度2019/8/20统计学专业必修课3学分29无偏性的证明)ˆ()ˆ(21EEEY])(1[121aiiyEaE)]([)(21yEEyEAiiYA11]1[11aiiYaE对称性论证法aiiyay112019/8/20统计学专业必修课3学分30方差形式的证明(P1929.4-9.10))]ˆ([)]ˆ([)ˆ(2121VEEVV)]1([)]([12121aiiyaEVyEV]1[11aiiYaVAiiYYAaf121)(1112111Saf看作一个变量2019/8/20统计学专业必修课3学分31方差形式的证明}])(111[1{112221aiMjiijYYMmfaE}]1[1{122221aiiSmfaE)]ˆ([)]ˆ([)ˆ(2121VEEVV)]1([)]([12121aiiyaVEyVE])(1[1221aiiyVaEAiiSAamf122211)1(1
本文标题:z-CH9多阶段抽样-第1、2节
链接地址:https://www.777doc.com/doc-417583 .html