您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 多阶段抽样(抽样技术__蒋妍)
抽样调查原理与方法Chapter8Multi--Stagesampling抽样调查原理与方法第一节概述一.什么是多阶段抽样分多个阶段抽到最终接受调查的样本。初级单元(PSU)----PrimarySamplingUnit二级单元(SSU)----Second-stageSamplingUnit三级单元(TSU)----Third-stageSamplingUnit最终单元(USU)----UltimateSamplingUnit抽样调查原理与方法二、多阶段抽样特点1.构造抽样框相对容易2.节省人力、物力3.行政上便于组织4.某些条件可满足各级需要5.可用于散料的抽样6.划分阶段不宜过多抽样调查原理与方法多阶段抽样推断原理以单位大小相同的二阶段抽样为例EEE()[()]12VVEEV()[()][()]1212抽样调查原理与方法推导过程记ˆ()E,ˆ()V2ˆ()E212ˆ()EE22ˆ()E22ˆ()E22ˆ2()E22ˆ()E2ˆ()V22ˆ2()E对两边求1E,得ˆ()V212ˆ()EE12ˆ()EV212ˆ()EE12ˆ()VE12ˆ()EV抽样调查原理与方法第二节初级单元大小相等时的二阶抽样采用srs,从N中抽n个初级单元采用srs从每个中选初级单元中抽取m个次级单元一、符号ijY,总体中第i个初级单元中第j个次级单元指标值i=1,2,….N,j=1,2,….Mijy,样本中第i个初级单元中第j个次级单元观测值i=1,2,…n,j=1,2,….m抽样调查原理与方法MmfNnf21,MYYyyYYiimijiMiji抽样调查原理与方法NiiiNYYmyyninyy抽样调查原理与方法221)(11YYNSNi221)(11yynsni2221()(1)NMijiSYYNM222)()1(1inijmyymns与整群抽样比较一下抽样调查原理与方法二、Y估计量的性质YyEynmynyYnmijni)(11ˆ抽样调查原理与方法nininiYYnEyEnEynEEyE]1[)](1[)1()(12121抽样调查原理与方法估计量方差一般公式为:于是有:)ˆ()ˆ()ˆ(2121VEEVV22221111)(SmnfSnfyV(1)抽样调查原理与方法假定n=1,第二阶段抽取m个单位用估计,误差大小取决于和m,即其次,用推断时,第二次推断误差大小取决于和n,当n=1时,,这时若以n个的均值推断,其方差为再考虑fpc,则(1)式成立。iyiY22SmSyVi222)(iYY21S211)(SYVimSSyV2221)(iyyYnmSnSyV2221)(抽样调查原理与方法22121211ffVySSnnm121211111nniiiiVEyVEyVYnn2211111111111nNiiiiffVYYYSnnNn12121221111nniiiiEVyEVyEVynn222211222111111111nMnijiiijiffEYYESnmMnm22222212221111111nNiiiifffESSSnmnnmNnm抽样调查原理与方法的无偏估计为)(yV2221211)1(1)(snmffsnfyv证明:(2)即是的无偏估计2222)(SsE22s22S但niyyns221)(11不是NiYYNS221)(11的无偏估计计算时不受二阶抽样影响,计算的则不然。21SiY21siy即:抽样调查原理与方法222212212111()(1)nmijiijEsEEsEEyynm2121111()1nmijiijEEyynm22112111111()1nMnijiiijiEYYESnMn222211NiiSSN抽样调查原理与方法222221222111nniiiiEnsEyyEynEy2222221niiiEyVynEyVy22222222111111nnniiiiiiiffYSnYSmnnm记11nniiYYn,(注意nYY),则22222222122111111nnniniiiiiffEnsYnYSSmnm222211(1)(1)nniniiinfYYSnm22222112111211111()1nniiiifEsEEsEYYESnmn222121fSSm抽样调查原理与方法所以21S的无偏估计为22221211ˆsmfsS将(2)、(3)式结合,得到2221211)1(1)(snmffsnfy(3)抽样调查原理与方法类似的,可以构造三阶抽样y的估计方差233212221211)1()1(1)(snmkfffsnmffsnfy抽样调查原理与方法【例8.1】欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水帐,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水帐。调查的结果如下:抽样调查原理与方法要求根据这些数据推算100家企业该指标的总量,并给出估计的95%置信区间。样本企业第一日第二日第三日15759642384150351606344853495625554抽样调查原理与方法iy22is样本企业16013243393583945075571905.010051Nnf230.1030mfM抽样调查原理与方法111(6043585057)53.65niiyyn2221211)1(1snmffsnfyv9.36700.07029.4372ˆ1003053.6160800YNMy2222ˆ100309.437284934800vYNMvy1608001.969216ˆ849348009216.0078vYˆsY抽样调查原理与方法方差估计式中,第一项是主要的,第二项要小得多,这是因为第二项的分母是第一项的m倍,而且它还要乘以小于1的f1如果第一阶的抽样比f1可以忽略,则方差估计式可以简单为如下的结果:这个结果在实际工作中非常有用,因为第二阶抽样采用等距抽样或某些复杂抽样时,方差的无偏估计很难得到,当f1可以忽略时,只需要初级单元的均值就可以得到方差的估计。221111()1niisvyyynnn抽样调查原理与方法三、总体比例的估计ai,第i个初级单元中具有某特征的次级单元数。11nnmiippannmiNiNiQPMNMnmfPPNnfPV)1(1)(111)(221抽样调查原理与方法ininiqpmnffppnnfpv)1()1()()1(1)(22121四、最优样本量m与n的确定目标:CT给定条件下,如何确定m与n,从而使)(yV最小。抽样调查原理与方法二阶抽样费用函数nmCnCCCT21022221111)(SmnfSnfyVNSmnSMSSnSMmnSNn212222212221)(1)11(1)11((4)(5)抽样调查原理与方法极小化))(()]()[())(1(2122221222221021mCCmSSmCCmSMSSCCSNVT其中:MSSS22212抽样调查原理与方法使上式达到极小的充要条件是mCCmSS212从而mopt满足212CCSSmopt抽样调查原理与方法由上式看出,m与,成正比,与,成反比。求出m后,利用(4),(5)式,即可求出n.22S1C21S2C抽样调查原理与方法分层二阶段抽样时的估计第一阶段:分层抽样,同一层内初级单元大小相等总体均值的估计ˆhhhhsthhhhhhNMyyWyNM222121211()hhsthhhhhhhffVyWSSnnm222112121(1)()hhhsthhhhhhhfffvyWssnnm抽样调查原理与方法第三节初级单元大小不等时的二阶抽样一、一般说明几种处理方法*先分层,再抽样*不等概抽样必要符号补充NiMMM00:抽样调查原理与方法iiiiMmff22:222)(11iMijiiYYMSi抽样调查原理与方法二、Y的估计入选概率1,NiiZZ估计过程先估计iY,然后利用iYˆ估计Y汉森—赫维茨估计量抽样调查原理与方法niiHHZYnYˆ1ˆNiiiiNiHHZYVYZYZnYV)ˆ()([1)ˆ(22)ˆ(HHYV的无偏估计量为:YYEHH)ˆ(抽样调查原理与方法2)ˆˆ()1(1)ˆ(HHniiHHYZYnnY若二阶抽样采用srs,即iiiyMYˆ是Yi的无偏估计而:2222222)1()()ˆ(iiiiiiiSfmMyVMYV抽样调查原理与方法于是有niiiHHZyMnY1ˆ22222)1(1)(1)ˆ(iiiiiiiNiHHSZmfMnYZYZnYV2)ˆ()1(1)ˆ(HHniiiHHYZyMnnY抽样调查原理与方法三、初级单元的PPS抽样由前知:niiiHHZyMnY1ˆ在PPS抽样中0MMZii,代入上式,得niPPSynMY0ˆ抽样调查原理与方法若进一步令mi=m,这时估计量是自加权的。自加权含义:各最终单元入选样本的概率相同,如果一个估计量可以表达为样本观测值的常倍数,则称这种估计量是自加权的。对汉森—赫维茨估计量而言nmijiiiniiiHHiymZMnZyMnY11ˆ抽样调查原理与方法所以,它成为自加权估计量的条件是00.,1fMmZnfmnZMiiiiii或第二阶段抽样比iiiMmf2inZf00f为常数抽样调查原理与方法在自加权条件下ninmijPPSynymnyyMY11ˆ0抽样调查原理与方法)ˆ(PPSYV与)(yV的无偏估计为:220)()1()ˆ(yynnMYniPPS2)()1(1)(yynnyni抽样调查原理与方法按简单随机抽样抽取初级单元简单估计量自加权条件:第二阶(段)抽样比为一个常数11ˆˆnnuiiiiiNNYMyYnn222212211()11ˆ()1NiNiiiiuiiYYNfMfSNVYnNnm222212211ˆˆ()11ˆ()1niuniiiiuiiYYNfMfsNvYnnnm11ˆˆnuiiYYn22iiimffM111112ˆiimmnnniuiiijijiijijiMNNNYMyyynnmfn抽样调查原理与方法比率估计量110011ˆˆnniiiiiRnniiii
本文标题:多阶段抽样(抽样技术__蒋妍)
链接地址:https://www.777doc.com/doc-418016 .html