您好,欢迎访问三七文档
第十章二重抽样第一节二重抽样的定义和作用第二节为分层的二重抽样第三节为比率估计的二重抽样第四节为回归估计的二重抽样第一节二重抽样的定义和作用一、定义二、二重抽样与两阶段抽样三、二重抽样的作用一、定义二重抽样也称二相抽样或两相抽样,是指在抽样时分两步抽取样本。一般情况下,先从总体N中抽取一个较大的样本,称为第一重(相)样本,对之进行调查以获取总体的某些辅助信息,为下一步的抽样估计提供条件;然后进行第二重(相)抽样。第二重抽样所抽的样本n相对较小,但是第二重抽样调查才是主调查。一般地,第二重样本是从第一重样本样本中抽取的,也就是第一重样本的子样本,但有时也可以从总体中独立地抽取。由于样本是分两次抽取的,因此称作二重抽样。n在抽样调查中,经常要求事先了解总体的某些信息。比如,分层抽样中各层的权重,回归估计中辅助变量的情况等。但在实际工作中往往不能事先掌握这些情况,即这些抽样条件往往不容易满足。这就需要先花费一些费用抽取一个大的初步样本,单独对这些条件进行计量,以便掌握抽样条件的信息。需要指出的是,在抽取第一重样本时需要增加一定的费用,只有当利用这些信息进行分层抽样,在比率估计和回归估计时提高精度的得益大于所增加的费用时,采用二重抽样才是合算的。二重抽样和两阶段抽样,在名称很容易引起混淆。虽然二者都可被视为一种分段抽样方法,但是二重抽样和二阶段抽样的差异还是很显著的。二、作用1:用于抽样中的分层和进行比估计和回归估计2:用于筛选主调查对象(有些调查,调查对象只是总体的一部分,且与其他单位不易区分)3:节约调查费用(大规模的多指标调查,有时不需要相同的样本量)4:降低无回答偏倚(对最初的无回答再进行一次抽样,对子样本获取数据,最后用两次样本数据进行加权估计)此外,还可以用于了解陌生总体的内在结构或其分布的大致情况。第二节为分层的二重抽样一、二重分层抽样概述二、估计量及其性质在分层抽样中,我们要求总体各层的层权应事先已知,如果层权未知或不能事先确定,则分层抽样在精度上的得益可能会在很大程度上被抵消掉,此时,选择二重分层抽样可以较好地解决层权问题。一、二重分层抽样概述符号说明:总体第h层的单元数:第一重样本第h层的单元数:第二重样本第h层的单元数:总体单元第h层的权重:第一重样本第h层的权重:第二重样本第h层的抽样比:第二重样本第h层j单元的观测值8hNhnhnhhNWNhhnnhhhnfnhjy:第二重样本第h层样本单元的平均值:总体方差:第h层的总体方差:第一重样本第h层方差:第二重样本第h层方差911hnhhjjhyyn2S2hS2hs2211()1hnhhjhjhsyyn二、估计量及其性质(一)均值估计量在讨论二重分层抽样估计量及其性质之前,我们先给出二重抽样中对估计量求均值与方差的一般公式如下:其中,、为第一重抽样结果条件下对第二重抽样的均值及方差,、则是对第一重抽样的均值与方差。)]ˆ([)]ˆ([)ˆ()],ˆ([)ˆ(212121VEEVVEEE2E2V1E1V据此,可以构造出二重分层抽样的总体均值估计量为:其中为第一重样本第层均值的无偏估计。1LstDstDhhhYywyhnjhjhhyny11h(二)估计量的性质性质1估计量是总体均值的无偏估计量。性质2若第一重样本为简单随机样本,第二重样本为第一重的随机子样本,则的方差为:性质3方差的近似无偏估计量为stDystDYstDy112221221ˆ()(')[()]''(1)(1)''111()(1)''stDLhhhhhLhhhhVYVyEVySnSnwnNnnwSSnNnf22211ˆ1111ˆ()()()()'LLstDhhstDhhhhhhVYwyywsnNnn第三节为比率估计的二重抽样一、引言二、二重抽样的比率估计及其性质一、引言二、估计量及其性质性质2当两重样本均为简单随机样本时,二重比估计的方差为性质3第四节为回归估计的二重抽样一、二重抽样回归估计的抽样方法二、二重抽样回归估计量及其性质三、二重分层估计、比估计和回归估计的比较一、二重抽样回归估计的抽样方法在使用回归估计量时,需要掌握有关辅助变量的资料,当其未知时,一个可行的办法是采用二重抽样加以估计。二重回归估计的基本思路是先在总体中抽第一重样本作简单测试以估计辅助变量的总体资料;再在第一重样本中抽取第二重样本用以对调查变量的总体指标进行估计。第一步:从总体的中随机抽取第一重样本,对于第一重样本,仅观测辅助变量信息,用辅助变量的样本均值估计其总体均值。第二步:从第一重样本中随机抽取出第二重样本,对于第二重样本,观测目标变量与辅助变量,并计算样本回归系数,构造回归估计。二重回归估计可以采用多种形式,我们这里只涉及一元线性回归估计。二、估计量及其性质对总体均值的二重回归估计可采用以下形式和第一重样本和第二重样本中辅助变量的平均数;为根据第二重样本计算的目标变量的样本平均数,为根据第二重样本计算的回归系数。)'(ˆxXbyYlrD'Xxybniiniiixxyyxxb121)())((性质1:是一个有偏估计量,其偏倚随着样本量的增大而缩小。当地二重样本的样本量足够大时,是近似无偏估计量。即当n充分大时)'(ˆxXbyYlrDlrDYˆYYElrD)ˆ(YYElrD)ˆ(性质2若n′和n均为简单随机样本,则估计量的方差为性质3当时,估计量的方差可按以下形式进行估计其中NSnSnSYVyyylrD22222')1()ˆ(N')1()ˆ(ˆ2222nsrnrsYVyylrD12211()()()()niiinniiiixxyyrxxyy三、二重分层估计、比估计和回归估计的比较1、在回归估计中,一般要求调查变量与辅助变量之间要有很高的相关关系,并且用于辅助资料的费用很低,实际中,这些条件常常难以满足。另外,回归估计的计算过程远比比估计和分层估计要复杂。2、比估计不是无偏的,一般比回归估计有较大的方差。3、如果调查变量与分层变量是线性相关的,则按比例分层的得益与回归估计基本一致。此时,使用分层方法还是回归估计法取决于回归方法的计算量带来的费用和分层方法的分层费用的多少。4、分层抽样常比回归和比率均值有特殊的优越性,特别是在调查变量与辅助变量为非线性关系时,按比例分层能得到更大的得益;若分层变量不是数值型时,分层方法仍然可以使用,而回归和比估计方法则不能用。5、如果辅助变量的总体均值是已知的,则回归和比估计可以在独立于辅助变量的n次抽选的样本上进行,而在分层抽样中,样本n必须是第一重样本n′的子样本。End!26
本文标题:二重分层抽样概述
链接地址:https://www.777doc.com/doc-6699965 .html