您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > z-CH9多阶段抽样-第3、4节-简
2019/8/21统计学专业必修课3学分1§9.3PU大小不等的2S抽样与群规模不等的CL对照着来理解本节的方法体系自加权样本的构造模式及估计方法(计算的重点)2019/8/21统计学专业必修课3学分2PU大小不等时解决问题的思路思路一:PU大小不等的问题可以转化为PU大小相等来讨论,比如分层,将大小近似的PU分到一层,则层内的2S抽样就可以按PU大小相等的方法来处理思路二:如果做不到上述转化,PU大小不等的处理就要复杂得多,复杂性体现在两个方面:抽样方法:PU的抽取是否考虑PU不等的因素估计方法:选择估计方法是否要考虑PU规模不等的因素2019/8/21统计学专业必修课3学分3§9.3方法体系类似于CL群规模不等的估计(一)对PU进行srs1、加权估计2、比率估计(二)对PU进行PPS抽样(WR)1、H-H估计2、构造自加权样本2019/8/21统计学专业必修课3学分4一、符号说明两个抽样比两个均值两个方差2019/8/21统计学专业必修课3学分5讨论的前提Aaf1ijY01MMAiiA个PUa个PUM1个BUM2个BUMa个BU……m1个BUm2个BUma个BU……每个PU相互独立地抽取相应的BU数iiiMmf2ijy01mmaii基本符号(Yij,i=1,2,…,A;j=1,2,…,Mi)(yij,i=1,2,…,a;j=1,2,…,mi)含义总体样本第i个PU的个体均值总的个体均值PU间方差第i个PU内BU间的方差AiMjijiYMY1101imjijiiymy11aimjijiymy1101iMjijiiYMY11AiiYYAS1221)(11aiiyyas1221)(11iMjiijiiYYMS1222)(11imjiijiiyyms1222)(11不需要再进一步综合2019/8/21统计学专业必修课3学分7二、均值估计量及其性质2019/8/21统计学专业必修课3学分8(一)对PU进行srs抽样方法的选择上没有考虑PU规模不等的因素估计方法的选择是否考虑PU规模不等的因素呢?2019/8/21统计学专业必修课3学分9讨论的前提A个PUsrsa个PUM1个BUM2个BUMa个BU……srsm1个BUm2个BUma个BU……每个PU相互独立地抽取相应的BU数Aaf1AiMmfiii,...,2,12ijY01MMAiiijy01mmaii2019/8/21统计学专业必修课3学分10等概抽样的加权估计量(P1989.28-9.31)适应性:一般用于Mi相差不大的情况是个无偏估计imjijiiymy11的平均值按个—样本中第—BUPUiiyaimjijiiAaiAiiiymMMaMyMay11111AMMA02019/8/21统计学专业必修课3学分11(二)对PU进行放回的不等概抽样抽样方法的选择上考虑了PU规模不等的因素选择与之配套的估计方法:H-H估计2019/8/21统计学专业必修课3学分121、抽选方法说明A个PUPPSa个PUM1个BUM2个BUMa个BU……m1个BUm2个BUma个BU……每个PU相互独立地抽取相应的BU数01MMMMZiAiiiiiiiMmf2PPS抽样结果有可能重复。如果某PU被重复抽到,比如被抽到2次,则分别独立的进行2次BU的抽取。对样本单元实施调查,相同的单元记录2次?2019/8/21统计学专业必修课3学分132、H-H估计量及其性质iiiyMYˆimjijiiymy11HHYˆaiiizYa1ˆ1由H-H估计量的性质可知,这是无偏估计量方差AiiiAiiiiHHZYVaYZYZaYV112)ˆ(1)(1)ˆ(aiHHiiHHYzYaaYv12)ˆˆ(111)ˆ(0ˆMYyaiiizYaM10ˆ1(P1999.36)(P2009.38)2019/8/21统计学专业必修课3学分14说明估计量方差的估计式仅与第一阶段有关,与第二阶段无关所以,一般对第二阶段抽样方法不做特别的规定2019/8/21统计学专业必修课3学分153、构造自加权估计量①理论上,要想构造自加权估计量,必须——将估计量形式表示成关于样本观测值之和的常数倍aimjijiyk11iiiyMYˆimjijiiymy11HHYˆaiiizYa1ˆ1aimjijiiiHHiymzMaY111ˆ0MMZiimmi令iiimaZMkf01iiiiamMmMMaMkf00012019/8/21统计学专业必修课3学分16关于f0含义的理解iiiiaZfMmf02相当于总体中任一BU被抽中的概率如果f0事先确定,则iiimaZMkf01iiiMmaZf02019/8/21统计学专业必修课3学分17②总结:实践中自加权样本的构造模式在2S中,自加权样本按如下模式构造:第一阶段对PU实施与规模成比例的PPS抽样第二阶段对BU按srs抽取,且mi=m这时,总值的估计量及方差的估计为:aiiPPSyyaaMYv1220)()1()ˆ(aimjijHHyamMyMY1100ˆ2019/8/21统计学专业必修课3学分18补例某小区拥有10座高层建筑,每座高层建筑拥有的楼层数如下表:用二阶抽样方法抽出10个楼层进行调查,第一阶抽样为放回的、按与每座建筑拥有的楼层数成比例的PPS抽样抽取5座建筑,第二阶按srs对每座建筑抽取2个楼层。对10个楼层居民人数的调查结果如下表。估计小区的总居民数,并给出估计的精度。高层建筑ABCDEFGHIJ合计楼层12121615101610181620145一阶样本序号12345合计居民数18,1215,1819,1316,1016,11148yi1516.5161313.514.8y2019/8/21统计学专业必修课3学分19解答2S自加权样本的模式构造:第一阶段对PU实施与规模成比例的PPS抽样第二阶段对BU按srs抽取,且mi=m本例的做法:用2S方法抽出10个楼层进行调查,第一阶抽样为放回的、按与每座建筑拥有的楼层数成比例的PPS抽样抽取5座建筑,第二阶按srs对每座建筑抽取2个楼层这时,总值的估计量及方差的估计为:aiiyyaaMYv1220)()1()ˆ(aimjijyamMyMY1100ˆ2019/8/21统计学专业必修课3学分20解答自加权的构造模式a=5,m=2,M0=1452146ˆ10110aiiaimjijyaMyamMY8.141452146ˆ0MYy625.9776)()1()ˆ(1220aiiyyaaMYv%9214688.9896.1ˆ)ˆ(YYstr2019/8/21统计学专业必修课3学分21补充习题某公司欲了解职工上班交通所需时间,该公司共有5个部门,根据每个部门的人数采用PPS抽样抽出2个部门,并在2个部门中采用srs分别抽出5名职工,调查的结果如下:试估计该公司职工上班交通平均所需时间,并给出估计的标准差。部门i职工人数Mi时间yij(分钟)12040,10,20,30,4023560,30,20,60,30§9.3结束2019/8/21统计学专业必修课3学分22§9.4其他问题一、3S抽样二、2S总样本量及最优样本量的配置2019/8/21统计学专业必修课3学分23一、3S及MS抽样2019/8/21统计学专业必修课3学分24(一)各阶单元大小相等的MS(以3S为例)1、含义总体包含A个PU,每个PU含M个二级单元,每个二级单元含G个BU分别srs抽取a个PU、m个二级单元、g个BUAaPUsrsMm二阶单元srsGgBUsrs2019/8/21统计学专业必修课3学分252、估计量及其性质(P1949.46-9.48)实践中,对于更高阶的情况,估计量的方差一般只需计算到第二或第三阶就可以了aimjguijuyamgy1111是无偏估计233222211111)(SamgfSamfSafyV233212221211)1()1(1)(samgfffsamffsafyv这是误差的主要组成部分amg一定时,提高a而减少m、g会有效提高估计的精度方差的无偏估计2019/8/21统计学专业必修课3学分26(二)各阶单元大小不等的MS(不要求)以总值Y的估计为例来说明通常有两种方法1、各阶抽样采用PPS抽样2、构造自加权样本重点掌握:样本为自加权的条件2019/8/21统计学专业必修课3学分27构造自加权样本(样本为自加权的条件)2019/8/21统计学专业必修课3学分28①抽样方法前两个阶段PPS抽样,最后一个阶段srs从第二阶开始,每一阶各下级样本单元数都相等则,样本是自加权的AaPUPPSMim二级单元PPSGijgBUsrs2019/8/21统计学专业必修课3学分29②估计量与方差估计yMyamgMYaimjguiju01110ˆaiiyyaaMYv1220)()1()ˆ(mjguijuiymgy1112019/8/21统计学专业必修课3学分303阶以上的MS自加权样本的构造类似地,对于更高阶的情况,除了最后一阶采用srs(wor或wr都行),前几阶均采用PPS抽样;并且,从第二阶开始,每一阶的样本量都相同,则样本是自加权的自加权样本的好处估计量的形式及方差的估计都非常简单抽样估计效果一般也不错2019/8/21统计学专业必修课3学分31二、2S总样本量及最优样本量的配置讨论的前提:PU大小相等的2S背景说明每个PU均包含M个BU两个阶段均采用srsA→a,M→m各PU相互独立地抽取BU2019/8/21统计学专业必修课3学分32(一)(am)的确定两种思路:1、费用2、n2S=nsrs×DeffDeff的确定是关键实践中,一般,MS的Deff在1.3~3之间2019/8/21统计学专业必修课3学分33(二)最优样本量的配置前提:1、PU大小相等2、(am)一定的前提下,合理分配a和m的大小相当于确定最优抽样比f1=a/A、f2=m/M2019/8/21统计学专业必修课3学分341、基本思想①怎样算是最优配置最优设计、最优分配C一定的前提下,使估计精度最高在一定精度的要求下,使C最省2S费用函数形式:C=c0+c1a+c2am②实践中的基本原则2019/8/21统计学专业必修课3学分35②实践中的基本原则a尽量大一些,m尽量小一些两个阶段方差的大小如果:PU间的方差S12大,PU内BU间的方差S22小——则,a大一点,m小一点如果:S12小,S22大——则,a小一点,m大一点两个阶段单位调查费用如果:PU的单位调查费用c1大,BU的单位调查费用c2小——则,a小一点,m大一点如果:c1小,c2大——则a多一点,m小一点22221111)(SamfSafyV2019/8/21统计学专业必修课3学分362、求a、m的最优分配法(P2029.56)结论:212ccSSmuoptMSSSu22212其中:将mopt代入V公式,可求得V给定的情况下,使C→min的aopt(9.58)将mopt代入C公式,可求得C限定的情况下,使V→min的aopt(9.57)问题:如何确定aopt?2019/8/21统计学专业必修课3学分37来历有两种方法可以确定以上m的最优分配公式①拉格朗日乘子法②柯西——施瓦兹不等式基本思想:——借助方差函数和费用函数构造损失函数,求使得损失函数达极小值的m2019/8/21统计学专业必修课3学分38构造损失函数利用方差函数和费用函数构造损失函数2S的方差函数为
本文标题:z-CH9多阶段抽样-第3、4节-简
链接地址:https://www.777doc.com/doc-417587 .html