您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 述职报告 > 永久随机数法样本轮换1
永久随机数法样本轮换初探StudyofSamplingRotationusingPermanentRandomNumbers金勇进①栾文英②摘要本文系统介绍了永久随机数法样本轮换理论,讨论了在等概率、不等概率抽样条件下永久随机数法样本轮换的具体应用,并将其与传统的子样本轮换方法进行比较,希望能够促进永久随机数法样本轮换在经常性抽样调查中的应用和推广。关键词永久随机数样本轮换Poisson抽样AbstractThisarticleintroducesthetheoryofsamplingrotationusingpermanentrandomnumbersanddiscussestheusesofsamplingrotationusingpermanentrandomnumbersinsamplingwithequalprobabilitiesandunequalprobabilities.Italsocomparessamplingrotationusingpermanentrandomnumberswithtraditionalmethodofsamplingrotation.Ithopestopromotetheuseofsamplingrotationusingpermanentrandomnumbersinregularitysurveys.KeyWordsPermanentRandomNumbersSamplingRotationPoissonSampling对于经常性的抽样调查(如我国的城市住户调查、农村抽样调查、全国的电视收视率调查、规模以下工业抽样调查等),样本的合理更新是保证调查效率、提高估计精度的重要问题,样本轮换是样本更新最为合理的方法,它是指在定期抽样调查中,将上期样本的一部分单位抛除,同时用过去未被抽中的一部分单位代替它们,与上期样本中保留下来的单位拼配成现期样本进行调查估计。样本轮换可以解决固定样本容易产生的“老化”问题,同时兼顾调查资料的连续性和可比性。传统的子样本轮换在工作中逐渐暴露出其本身固有的弱点,本文对永久随机数法样本轮换进行系统介绍,讨论了在等概率、不等概率抽样条件下永久随机数法样本轮换的具体应用,并将其与传统的子样本轮换方法进行比较,希望能够促进永久随机数法样本轮换在经常性抽样调查中的应用和推广。一、永久随机数法抽样技术简介永久随机数(PermanentRandomNumbers)法抽样技术在调查中的应用近几年蓬勃兴起,主要集中在农业调查以及能源调查方面。永久随机数法抽样技术是一种有序抽样技术。在这一抽样技术中,抽样框的每个单位都被赋予从区间(0,1)产生的随机数,并保留下来,不再改变。抽样框的所有单位按照随机数的大小排序,随机数具有某一特征的单位将入样。因为随机数被保存下来,因此称之为永久随机数(PRNs)。永久随机数法强调随机数与调查单位的唯一确定性。如果有新调查单位产生,则随即产生与之相对应的新的随机数,并参与到总体排序中;如果有旧①金勇进,中国人民大学统计学系教授,博士生导师。②栾文英,中国人民大学统计学系博士生。的单位消亡则将随机数与单位一起从总体中删除。因而能够实现抽样框的维护。这一过程可以看成将总体各单位赋予随机数,均匀分布在(0,1)之间,于是可以实现抽样的随机性。Ohlsson(1995)曾详细证明这一过程是随机抽样。利用永久随机数进行样本轮换主要是基于随机数的永久性,即随机数赋予单位之后不再改变。永久随机数抽样技术是有序抽样,这种排序实际上是对总体多主题无关标志排序,所以可以实现多主题抽样。样本轮换在永久随机数抽样技术里转化为随机数区间的移动。永久随机数抽样技术在抽取样本时可以抽取随机数最小的n个单位作为样本,也可以抽取随机数落在某一区间的单位作为样本。抽取样本的随机数起点可以不是0,而是0与1之间的任何一个随机数,这是因为(0,1)区间可以看作一个循环系统,当随机数区间的终点(起点加上抽样区间)大于1时,将其减掉1得到的新的数值就会重新落入(0,1)区间。这就是永久随机数法样本轮换的基本原理。当然永久随机数抽样技术还有许多其他的抽样方法,如下面将要谈到的Poisson抽样,这里不再一一介绍。二、等概率抽样中的样本轮换对于等概率抽样,Breweretal.(1972)给出了利用PRNs进行样本轮换的常数平移法,只要在抽样的过程中将起点和终点移动一个特定距离即可。要注意的是,对同一项调查,年度间平移的距离必需为一个常数,否则会破坏样本轮换的一致性。为更形象地阐述样本轮换的原理,下面结合例子予以说明。由20个单位构成的总体当中,抽取50%的单位作为样本,每年轮换50%。将总体按照永久随机数排序,可抽取已有总体的前50%样本单位,或者抽取永久随机数小于50%的单位;此时抽样区间是(0,0.5),样本轮换时,将区间的上下限根据样本轮换率平移,如轮换50%的样本,则第二年抽取随机数在(0.25,0.75)之间的样本单位,第三年抽取永久随机数在(0.5,1.0)的样本单位。抽样及样本轮换结果如表1所示。表1中★表示抽中。由表1不难看出在等概率抽样中,永久随机数法能有效实现样本轮换。表1样本单位12345678910永久随机数0.040.090.140.190.240.290.340.390.440.49第一年★★★★★★★★★★第二年★★★★★第三年样本单位11121314151617181920永久随机数0.540.590.640.690.740.790.840.890.940.99第一年第二年★★★★★第三年★★★★★★★★★★三、不等概率抽样中的样本轮换在调查单位的规模有较大差异或者调查单位在总体中所占的地位不一致的情况下,通常采用不等概率抽样调查方法。在永久随机数抽样技术中,通常采用的Poisson抽样来实现不等概率抽样。Poisson抽样的规则是如果iiprn(其中i为入样概率,iprn为永久随机数),则抽中第i个样本单位。在不等概率抽样,继续采用上述常数平移的做法会不可避免的将入样概率小的单位轮换出样本,而保留了入样概率较大的调查单位。这是因为调查单位对应的永久随机数的产生是随机的,如果入样概率较大,则大于其对应的永久随机数的可能性要比入样概率较小的调查单位大。为了减少入样概率对样本轮换的影响,将调查单位的入样概率引入样本轮换中。设与前一年样本的重复率为,新样本的起点是重复率的函数。定义新样本的终点如下:iiiul其中,il下一年样本抽选区间的低限点,iu上一年样本抽选区间的高限点,i上一年第i个单位的抽样概率,=前后两年期望的样本重复率。iiilu或在1iil时,1iiilu其中,iu下一年样本抽样区间的高限点,il上面计算所得的抽样区间中下一年低限点,i下一年第i个单位的抽样概率,如果iiuPRNl,则抽中该单位。需要注意的是,i是第i个个体的入样概率,对第i个个体而言,i与其规模大小ip成正比,即iinp。在抽样比例较高时,会出现入样概率1i的情形,此时取1i,即该单位为必选单位或者确定性单位,这种单位不再离开样本,这符合目录抽样中某一规模以上的样本单位全部入样的原理。运用上述理论并结合上例中的数据,同样抽取50%的单位作为样本并每年轮换50%,考察在Poisson抽样中样本轮换的实现。表2是抽样及样本轮换结果。其中样本单位10、15、19时必选样本。需要说明的是Poisson抽样产生的样本量不是确定的量,而是以事先确定的样本量为期望的随机变量。因此在本例中,计划抽取50%的单位,即抽取10个单位作为样本,而实际抽取结果第一年抽到9个单位,第二年抽到9个单位,第三年抽到10个单位,这符合Poisson抽样的特点。由表2不难看出,在Poisson抽样条件下,确定性样本始终保留在样本中,非确定性样本能够有效地实现样本轮换。表2样本单位12345678910永久随机数0.040.090.140.190.240.290.340.390.440.49入样概率0.270.130.640.130.080.320.130.150.461.00第一年★★★★★★第二年★★★★★第三年★★★★样本单位11121314151617181920永久随机数0.540.590.640.690.740.790.840.890.940.99入样概率0.790.250.420.151.000.770.520.321.000.19第一年★★★第二年★★★★第三年★★★★★★四、永久随机数法样本轮换方法述评相对于传统的子样本轮换,永久随机数法样本轮换的主要优点在于能有效实行抽样框的维护。子样本轮换无法实现抽样框的维护。子样本轮换通常是首先确定轮换组,因而新增样本无法纳入轮换组中,对于消亡的单位,也无法及时从轮换组中剔除。也有人曾提出对于新增样本单位单独列层以实现抽样框的维护,笔者认为这种做法欠妥,因为新增样本的具体情况是随机的,无法事先确定,新增样本层的抽样及轮换方法就无从实现。而永久随机数法样本轮换能有效实现抽样框更新。由于随机数与样本单位有唯一确定性,即随着样本单位的产生而产生,随着样本单位的消亡而消亡,而且各个样本单位独立存在,在样本轮换过程中,只要将新增的单位列入到抽样框中,将消亡的单位与其随机数一并删除,按照前述理论就可以实现样本轮换。需要注意的是,在抽样框发生变动时,要重新计算样本单位的入样概率,以保证对总体估计的精度和可靠性。只有采用永久随机数法抽样技术,才能够有效地维护抽样框,从而为样本轮换提供相对完备的抽样框。永久随机数法抽样技术不仅能有效地实现抽样框维护和样本轮换,而且能有效实现多主题调查,并且永久随机数法还能解决满足分级管理需要的问题,这对我国现行体制下的抽样调查体系有非常重要的意义。在我国连续抽样调查中值得大规模推广。主要参考文献1.Cochran,W.G.(1977).SamplingTechniques,thethirdedition.2.E.E.GburandR.L.Sielken,Jr.TexasA&MUniversity,RotationSamplingDesign,ProceedingsoftheSurveyResearchMethodsSection,ASA,1982,522-524.3.CraigH.McLarenandDavidG.Steel,UniversityofWollongong,NSWAustralia,TheEffectofDifferentRotationPatternsontheSamplingVarianceofSeasonalandTrendFilters,ProceedingsoftheSurveyResearchMethodsSection,ASA,1997,790-795.4.DavidG.SteelandCraigH.McLaren1,TheEffectofDifferentRotationPatternsontheRevisionsofTrendEstimates,JournalofOfficialStatistics,Vol.16,No.1,2000,pp.61-76.5.YouSungPark,KeeWhanKim,KoreaUniversity,andJaiWonChoi,U.S.NationalCenterforHealthStatistics,GenerlizedSemione-levelRotationSampling,ProceedingsoftheSurveyResearchMethodsSection,ASA,1998,823-828.6.PedroJ.Saavedra,MacroInternationalInc.andPaulaWeir,EnergyInformationAdministration,ImplicitStratificationandSampleRotationUsingPermane
本文标题:永久随机数法样本轮换1
链接地址:https://www.777doc.com/doc-2279173 .html