您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第九章-多阶段抽样(新)a
02468101214161850-6070-8090-1000%5%10%15%20%25%30%35%`第九章多阶段抽样2本章要点本章介绍多阶段抽样的方式、优点和初级单位大小相等或不等时的两阶段抽样的估计量及其性质,并对相关一些问题进行讨论。具体要求:①正确理解多阶段抽样的科学涵义,对多阶段抽样的性质及优点有初步的认识;②掌握初级单位大小相等时两阶段抽样的估计量及其性质和初级单位大小不等时两阶段抽样的估计量及其性质;③了解有关多阶段抽样的其它相关问题。3第一节抽样方式4假设总体中的每个单位本身就很大,我们可以先在总体各单位(初级单位)中抽取样本单位,在抽中的初级单位中再抽取若干个第二级单位(SecondarySamplingUnits),在抽中的第二级单位中再抽取若干个第三级单位(TertiarySamplingUnits)……,直至从最后一级单位中抽取所要调查的基本单位的抽样组织形式,就叫做多阶段抽样。因此,对于一个阶段数为L(L=1,2,3……)的多阶段抽样,最终可以抽出L级样本单位,实际调查也是落在这第L阶段也即最末阶段的抽样单位上。这种抽样的过程,相当于从一棵树的主干到树叶的过程,其中树叶就是所要调查的基本单位,各条粗粗细细的杆、枝就是各级抽样单位。一、多阶段抽样的概念5多阶段抽样中最简单的是两阶段抽样,即在整群抽样的基础上,对抽中的群不是全面调查,而是只抽取部分单位进行调查。也即总体抽群,群抽单位。较复杂些的则是三阶段抽样、四阶段抽样甚至五阶段抽样、六阶段抽样等。例如,我国1984年不颁发的农产量抽样调查方案实行的是五阶段抽样方式,即为:省抽县,县抽乡,乡抽村,村抽地块,地块中抽实测样本,即定义全国的省为初级单位,县为二阶单位,乡镇为三级单位,自然村为四级单位,地块为五级单位。6二、多阶段抽样的优点(一)便于组织抽样。(二)可以使抽样方式更加灵活和多样化。(三)能够提高估计精度。(四)可以提高抽样的经济效益。(五)可以为各级机构提供相应的信息。两阶段抽样的研究,是多阶段抽样研究的基础和出发点。多阶段抽样的性质和特点,在二阶段抽样中都已经体现出来。本书中主要研究二阶段抽样问题,对于三阶段以上的多阶段抽样,只做一般的介绍。7第二节初级单位大小相等的两阶段抽样8设总体划分为A个初级单位,每个初级单位含有M个二阶单位。为总体第i个初级单位中第j个二阶单位的标志值。1MiijjYY为总体i个初级单位中各二阶单位的标志总量。11MiijjYYM为总体第i个初级单位中各二阶单位的均值。11111AAMiijiijYYYAAM为总体均值。ijY一、问题的基本提法9从A个初级单位中等概率地抽取a个初级单位,称为初级样本单位,并由每个初级样本单位中抽取m个二阶单位(称为二阶样本单位)组成样本。第i个初级样本单位中的第j个二阶样本单位的标志值。ijy1miijjyy为第i个初级样本单位中各二阶样本单位的标志总量。11miijjyym11111namiijiijyyyaam为二阶段抽样的样本均值。10二、估计量及其性质(一)总体均值的估计在初级单位大小相等的两阶段抽样中,总体均值的无偏估计量就是二级段抽样的样本均值,即:111ˆ//()aamiijiijYyyayam11(二)样本均值的方差2211()/(1)AiiSYYA为初级单位间的方差。22211()/(1)AMijiijSYYAM为初级单位内的方差。根据方差的性质和两阶段抽样的特点,有:2212()()()VyEyYEEyY其中2222222()()()2()EyYEyVyYEyY所以221212()()()VyEEyYEVy又因为12()EEyY1212()()VEyEVy12式中:2122()MmEVySamM2121()AaVEySAa故2212()AaMmVySSAaaMm如果令1afA2mfM则22121211()ffVySSaam13(三)估计量方差的样本估计两阶段抽样条件下样本均值方差的样本估计量为:22112121(1)()fffvyssaam可以证明:是的无偏估计。()vy()Vy由此可得两阶段抽样的抽样标准误的估计为:22112121(1)()fffseyssaam14【例9.1】欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每月填写流水帐,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水帐。调查的结果如表9.1所示。表9.1对5家企业的调查结果样本企业第一日第二日第三日15759642384150351606344853495625554要求根据这些数据推算100家企业该指标的总量,并给出估计的95%置信区间。15解:对这个问题,我们可以利用两阶段的思路解决。首先将企业作为初级单位,将每一天看作二级单位,每个企业在调查月内都拥有30天(即拥有30个二级单位)。在这个问题中,调查人员首先在初级单位中抽取了一个n=5的简单随机样本,然后对每个样本的二级单位分别独立抽取了一个m=3的简单随机样本,这就是初级单位大小相等的两阶段问题。由题意,A=100,M=30,a=5,m=3150.05100afA230.1030mfM1153.6aiiyya2211149.31aiisyya1622221123.4aiissa12221121()9.34721fffvyssaam1003053.6160800YAMy2222()()100309.437284934800VYAMvy()()849348009216.0078SEYVY在置信度95%的条件下,对应的t=1.96,因此,置信区间为:60800±9216.0078,或者说在142736.6~178863.4之间。17三、总体比例及其估计量方差初级单位大小相等的两阶段抽样的总体比例及其方差问题在均值估计的基础上是比较容易理解的。1MijjY为总体第i个初级单位中具有某种属性的二级单位数11MiijjPYM为总体第i个初级单位中各二级单位的比例则总体比例为:11111AMAijiijPYPAMA而二阶段抽样的样本比例为:11111amaijiijpypama显然,样本比例p是总体比例P的无偏估计。18样本比例的方差为:22121211()ffVpSSaam其中:2211()/(1)AiSPPA2222122/(1)/(1)AiiiiSSASMPPM同理,样本比例方差的样本估计为:222112112122111(1)1(1)()()(1)(1)(1)aaiiiffffffvpssppppaamaaam21122111(1)()()(1)(1)(1)aaiiifffsepppppaaam样本比例的抽样标准误的估计为:19第三节初级单位大小不等的两阶段抽样20在两阶段抽样中,总体各初级单位所包含的二阶段单位数,有相等和不相等这两种情况。严格地说,前者在实际抽样调查中一般是不存在的,因而它主要具有理论上的意义。这里本书来讨论其具有普遍意义的后者。初级单位大小不等的两阶段抽样估计,较之与初级单位大小相等的两阶段抽样估计要复杂得多。首先,在抽样时就要考虑采用等概率还是不等概率抽样;其次,在抽取初级样本单位内时各二阶样本时,要考虑各二阶样本得样本容量的分配问题;最后,在等概率抽样条件下,样本指标和抽样方差的估计,又有简单估计、加权估算等方法的不同。这样就构成了许多种不同得抽样估计方法。在这些方法中,有些是有偏的估计,有些是无偏的估计。这里,我们只介绍其中两种无偏估计方法。21一、等概率抽样的加权估计方法设总体划分为A个初级单位,各初级单位中所包含得二阶段单位数为:(i=1,2,…,A)。iM01AiiMM为总体所包含得二阶段单位总数。AoAMM为各初级单位中所包含的二阶单位数的均值。0011111//iMAAAiijiiiijAMYYMMYMYAM=为二阶段抽样的总体均值。类似于不等群体等概率整群抽样的加权估计,二阶段抽样的样本均值为:11111imaaiiiijijAAiMMyyyaMaMm22可以证明,这个估计是无偏的,即:12()()EyEEyY=估计量y的方差为:22221211(1)11()()()(1)AAiiiiiAAiMMffVyYYSaAMAaMm估计量方差的样本估计为:222212211(1)11()()()(1)aaiiiiiAAiMMffvyyysaaMaMm23对于初级单位大小不等的两阶段抽样,其总体比例为:0011111//iMAAAiijiiiijAMPYMMPMPAM=初级单位大小不等的两阶段抽样的样本比例为:11111imaaiiiijijAAiMMppyaMaMm=可以证明:12()()EpEEpP24估计量p的方差为:222111(1)11()()()(1)(1)AAiiiiiiAAiMMffVpPPPPaAMAaMm估计量方差的样本估计为:2221211(1)11()()()(1)(1)aaiiiiiiAAiMMffvpppppaaMaMm25二、不等概率抽样的加权估计方法不等概率的两阶段抽样方法在用不等概率方法抽取初级样本单位时,与整群抽样完全相同,但两阶段抽样在被抽中的那些初级单位即初级样本单位中,还要抽取二阶样本。对此,按所选择的确定不等概率的标志不同,其抽样估计方法有所差异,关于用以确定不等概率的标志不同,最常用且较为简单的是以各初级单位所包含的二阶单位数在总体全部二阶单位数中所占的比重来确定的。26全部二级单位的总体均值的无偏估计量为:101aiiiMyyaM该估计量的方差为:2222221100(1)11()()AAiiiiiiiiiMYMfVyYSaMaMm估计量方差的无偏样本估计为:2101()()(1)aiiiMyvyyaaM27第四节进一步讨论的问题28三阶段抽样估计的原理和两阶段抽样估计相同,只是第三阶段的抽样是对被抽中的二级单位中的三阶单位再抽样,从中抽出样本三阶段(接受调查的最终单位)。三阶段的估计量的方差可由两阶段抽样估计直接推广。(其余的多阶段抽样均可类推)设总体可划分为A个初级单位,并作第一阶段抽样,采用重复或不重复、等概率或不等概率的方法,抽取其中的a个初级单位或称初级样本单位;在第二阶段抽样中,本文将个初级单位可划分为M个二阶单位,并从第初级段所抽取的各初级单位中,采用重复或不重复、等概率或不等概率的方法,抽取其中的m个二阶单位或称二阶样本单位;再设各二阶单位可继续划分为G个三阶单位,并进行第三阶段的抽样,即采用重复或不重复、等概率或不等概率的方法,分别从各三阶样本单位中,抽取其中的g个单位作为三阶样本单位。一、三阶段抽样29ijuY为从总体第i个初级单位第j个二阶单位内所抽出的第u个三阶段单位。1/GijijuuYYG为二级单位内的均值。111/()/MGMiijuijjuiYYMGYM为初级单位内的均值。1111/()/AMGAijuiijuYYAMGYA为总体均值。在简单随机抽样下,单位大小相同的三阶段抽样的总体均值的无偏估计量为:ayamyamgyyaimjaiijaimjguiju/)/()/(111111
本文标题:第九章-多阶段抽样(新)a
链接地址:https://www.777doc.com/doc-4620424 .html