您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 抽样调查不等概率抽样
简单随机抽样的特点:总体中每个个体被抽中入样的概率都相同。对于各单元所处地位几乎“平等”的总体,这种抽样原则既公正又方便。不等概率抽样:但在许多社会经济活动中并非所有单元地位相同。使得“大”单元入样概率大,“小”单元入样概率小,这里的“大”、“小”与我们所关心的调查指标有着密切的关系。第三章不等概抽样例如,要了解上海地区钢铁企业的景气状况,总体有上钢一厂、三厂、五厂……等等,再加上宝钢。由于宝钢规模极大,它是否景气对整个上海地区钢铁工业起着至关重要的作用。而在抽样中将它与其它规模较小的单位处于同等地位就会既不公正又使抽样推断结果有较大可能发生大的偏差。§3.1PPS抽样PPS抽样:抽取概率正比于规模测度。——SamplingwithProbabilityProportionaltoSize.M.iii0MY于单元被抽取的概率正比在抽取样本单元时,各规模测度总体单元。中的单元再作下次抽取一次抽取后,放回被抽,正比于被抽中的概率单元取,第概率抽样方案。每次抽抽样是常见的一种不等有放回MMpiPPS1iNjjiiiiiMMMpY不等概率抽样有放回不等概率抽样(PPS)ps无放回不等概率抽样()PS一、实现方法(1)累积和法或代码法它适合于N不太大的情形。假定所有的为整数,倘若在实际中存在不是整数的话,则可以乘以一个倍数使其为整数。见下表。iMiM单元i单元大小iM代码数12N12NMMM11101111,2,,NNNiiiNiiiMMMMM11,2,,M11121,2,,MMMM表3—1pps抽样时各单元的代码数每次抽样前,先在整数里面随机等可能的选取一个整数,设为m,若代码m属于第j个单元拥有的代码数,则第j个单元入样。整个过程重复n次,得到n个单元入样(当然存在重复的可能性)构成pps样本。01,2,,M例3.1设某总体共有N=8个单元,相应及代码如表所示iM12345678iiM2/51/22/34/38/53/52/3130iM1215204048182030累计12274787135153173203代码1~1213~2728~4748~8788~135136~153154~173174~2030203M假设第个单元在n次抽样中被抽中次,则是一个随机向量,其联合分布为:iit12(,,,)Nttt这是我们熟悉的多项分布,多项抽样其名正出于此。121212!!!!NtttNNnZZZttt1Niitn(3.1)多项分布(3.1)具有如下性质:()()(1)1,2,,(,)iiiiiijijEtnZVartnZZiNCovttnZZij倘若单元有一个数值度量其大小,诸如职工人数、工厂产值商店销售额等,或者感兴趣的调查指标在上一次普查时的数据也可以作为其单元大小的一种度量。记为第个单元的“大小”,并记iMi01NMiiM若取n=3,在1~203中随机有放回地产生3个随机整数,不妨设为45、89、101,则第3个单元入样一次,第5个单元入样2次。(2)最大规模法或Lahiri(拉希里)方法当N相当大时,累计的将很大,给代码法的实施带来很多不方便。Lahiri提出下列方法:令每次抽取1~N中一个随机整数及1~内一个随机整数,如果,则第个单元入样;若,则按前面步骤重抽,显然,第个单元的入样与否受到的影响,只有时它才入样,因此第个单元入样的概率与的大小成正比,此时*1max{}iiNMMiiii(,)im*MmiMmiMmiMmiM0iiZMM0Mm定理3.1.1在有放回PPS抽样下,二、估值法PPS抽样法的估值法的理论依据niiipyˆ1PPSn1Y.iYYN1i的无偏估计是总体总数.)p(ii单元对应的抽取概率总体中第时的抽取概率,而不是个样本单元为第iyi估计的均方偏差为:.)Ypy(p)ˆniiii21PPSn1YV(证明考虑随机变量Z,P,p}pYZ{iii212111n12n111E111E1E)YpY(pnp))z(pY(n)zvar(n)zvar(n)zvar()Yˆ(V,Y)z(n)Yˆ(E,YppY)z(NiiiiiNiiiiiPPSiiPPSiNiiii的独立同分布样本,故是随机变量则ZyiipZ定理3.1.2在有放回PPS抽样下,]Yˆn)py([)n(n)Yˆpy()n(n)Yˆ(vPPSniiiPPSniiiPPS221211111).Yv(N1)Yv(;YYN1YYPPS2PPSPPSPPSˆ)(ˆˆ;ˆ和为其均方误差的估计分别估计总体平均值用估计总体总数可用注:果园序号12345678规模测度X503065801404420100例一村庄有8个果园,分别由果树50,30,65,80,140,44,20,100棵,要调查该村庄水果产量,以正比于果树棵树的概率取3个果园作样本.如果实地调查得第5、第8、第3号三个果园的产量分别为15,12,7,求该村八个果园的总产量估计.解:.59.04])52965(7)529100(12)529140(15[31n1Y1PPSniiipyˆ这一估计的均方偏差的估计为9341121.)Yˆpy()n(n)Yˆ(vPPSniiiPPS2、Hansen-Hurwitz(汉森—赫维茨)估计量若是按为入样概率的多项抽样而得的样本数据,它们相应的值自然记为,则对总体总和,Hansen-Hurwitz给出了如下的估计量:12,,,nyyy12,,,nzzziZiZ11niHHiiyynz且,即是总体总和的无偏估计。()HHEyYHHyY211()()NiHHiiiYVaryZYnZ()HHVary的无偏估计为211()()(1)niHHHHiiyvyynnz有放回不等概率抽样:从实施上还是从估计计算以及精度估计都显得十分方便。但一个单元被抽中两次以上总会使样本的代表性打折扣,从而引起抽样误差的增加。实际调查工作者一般倾向于使用不放回形式。问题:最简单的不放回不等概率抽样方式自然会想到逐一抽样这在第一次抽样时不会发生问题,但在抽第二个样本时面临的情况与有放回时大不相同,余下的(N-1)个单元以什么样的概率参与第二次抽样就是个问题;再在抽第三个样本时又面临新问题。一是抽样实施的复杂;二是估计量及其方差计算的复杂。在本节讨论:(1)n固定,尤其是n=2时的情形。(2)总体中每个单元的入样概率严格地与其“大小”成比例,即抽样。ps§3.2不等概抽样PS几种严格的不放回抽样方法ps(1)Brewer(布鲁尔)抽样方法(1963)个样本单元。抽取第第二步:以概率放回;个单元入样,取出后不设第单元,的概率抽取第一个样本第一步:以正比于且记其中令2-p1pippp21p1ppXpjN1iiii1)ji()(;X,XXiiiiNiiii前面已经指出,所谓“严格不放回”是指样本容量n固定,严格不放回、的抽样。仅介绍n=2的情形。psinpi1.对这种抽样,总体中个体单元i的入样概率为2.设计好第一次抽取的概率,第二次抽取的概率与成正比,使总的入样概率正比于.)p)(p()pp(Dpp,pjijijiijii2121122ipiX特点:(2)Durbin(德宾)方法(1967).)(2Dp211p211pp2pippjiiiiii个样本单元。抽取第第二步:以概率放回;个单元入样,取出后不设第单元,的概率抽取第一个样本第一步:以1.对这种抽样,总体中个体单元i的入样概率为.)p)(p()pp(Dpp,pjijijiijii21211222.第一次抽取的概率与成正比,第二次抽取的概率使总的入样概率正比于.ipiX特点:Durbin方法中的与Brewer方法中的完全一样这表明两种不等概率抽样方法其实是等价的。,iij,iij(3)Sen-Midzuno抽样方法.个单元的样本本单元,组成个样无放回抽取个单元中,以简单随机第二步:从剩下的元,取出后不放回;概率抽取第一个样本单第一步:以n1n1-Npi.pNf),N)pp(N(Nn,NnpNnijii近似正比于很小时,当抽样比分别为和同时入样概率对应的入样概率iijiijin22-n22-n11111-N(4)Horvitz—Thompson(霍维茨—汤普森)HT估计量对于不放回不等概率抽样,常用HT估计。总体总数Y的无偏估计量为:niiiHTyYˆ1该估计量的均方偏差为:.YY)(Y)()Yˆ(VjiNiNijjijiijNiiiiHT11j121HT估计的均方偏差的两个无偏估计量为.)yy()()Yˆ(v,yy)(y)()Yˆ(vjjiiNinijijijjiHTjiNinijijjijiijiniiiHT2121212121注:两估计量均有可能取负值,通过模拟比较,v2较稳定且较少取负值。§3.3Rao-Hartley-Cochran随机分群抽样拉奥-哈特利-科克伦(1962)作为样本单元。一个单元于规模测度的概率抽取在每一个群中,以正比个个体单元;个群有个个体单元,个群有其中个群将总体随机分成设总体个体单元总数2Mn1kn10knMN.kM.)nk(.XZ,ZXittiti的和群中全体单元规模测度为其中群;不属于,当群,属于当的概率为群中,抽中单元在第tti0tipit在随机分群抽样下,记第t群抽出的样本单元为,其对应的抽取概率为,则估计量tiytipntitˆ1iRHCpyYt为总体总数Y的无偏估计。该估计量的均方偏差为:.XXp,)YpY(pˆNiiiiiiNii121RHCn1]1)-N(Nk)-k(n1-N1-n-[1)YV(其中.XXpyp,)ˆpy(XZ)kn(k)n(NNn)kn(kNˆˆNiiiiiiiiNittttttt12RHC122RHCRHCY1)Yv()YV(即模测度的概率,对应的总体中正比于规是样本单元其中的无偏估计计的均方偏差在随机分群抽样下,估
本文标题:抽样调查不等概率抽样
链接地址:https://www.777doc.com/doc-2373357 .html