您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第3章 抽样实务及问题
1第三章抽样实务及问题SAMPLING根据实际环境来设计抽样方案,是抽样实务要解决的问题。本章首先介绍的是区域抽样方法,包括按户籍资料和按地图进行的区域抽样;然后介绍电话访问中的随机拨号技术;最后将讨论抽样中的非抽样误差问题,特别是针对流动人口的,提出一些解决方案。第一节第一节第一节第一节区域抽样区域抽样区域抽样区域抽样区域抽样是一种实用的抽样方法,它能为抽选居民住户提供很好的抽样方法。以往常用区域抽样方法,通常是按户籍资料进行PPS抽样。而按居民居住地的地图进行的抽样,是近年流行起来的一种区域抽样方法。一一一一、、、、按户籍资料按户籍资料按户籍资料按户籍资料PPS抽样抽样抽样抽样在实践中,分层多阶段区域抽样,是应用范围比较广泛的多阶段抽样方法。只要能以区域划分总体,就能够采用多阶段区域抽样,例如,利用街区划分一个城市,利用各级行政单位划分一个国家。下面是一个按行政区划和户籍资料,利用PPS方法进行分层多阶段区域抽样的实例。一一一一、、、、按户籍资料按户籍资料按户籍资料按户籍资料PPS抽样抽样抽样抽样假设某省一个调查研究中心计划进行一次全省范围的抽样调查,希望利用调查数据进行社会结构研究。根据最近的普查,该省共有家庭户17699115户,计划用PPS方法从中抽取4000户作为样本。步骤如下:2㈠㈠㈠㈠计算总的抽样比计算总的抽样比计算总的抽样比计算总的抽样比即在全省范围内从每4425户中抽取一户。44251000226.0176991154000================Nnf㈡㈡㈡㈡确定各级抽样单位和计划样本规模确定各级抽样单位和计划样本规模确定各级抽样单位和计划样本规模确定各级抽样单位和计划样本规模设此次抽样为4级抽样,各级抽样单位依次为:县、乡、村、户。计划在全省共抽取40个县,每个县抽取2个乡,每个乡抽取2个村,每个村抽取25户,即a=40,b=2,c=2,d=25,b×c×d=100(每个县计划抽取100户),由此产生类似下表的结果:400040××××2××××2××××2540××××2××××240××××240样本合计样本合计样本合计样本合计户的数目户的数目户的数目户的数目村的数目村的数目村的数目村的数目乡的数目乡的数目乡的数目乡的数目县的数目县的数目县的数目县的数目㈢㈢㈢㈢对对对对PSU分层和确定层内计划样本规模分层和确定层内计划样本规模分层和确定层内计划样本规模分层和确定层内计划样本规模由于该省社会经济发展水平由南至北逐渐下降,故结合各县的地理位置,由南至北将所有PSU划分为四个层。假设某一层的规模为1935851户,采用按比例分配样本,因此层抽样比ffffbbbb等于总抽样比ffff,层内计划样本规模可由ffffbbbb=ffff求出:1935851×0.000226=437.5(户)㈢㈢㈢㈢对对对对PSU分层和确定层内计划样本规模分层和确定层内计划样本规模分层和确定层内计划样本规模分层和确定层内计划样本规模由此看出,各层内子样本规模不一定是100的整数倍,即不同层的PSU内的子样本规模并不一定是完全相等的,而是大致为100户。这样在此层可取aaaakkkk=4,则此层的每个PSU内计划子样本户数为109.4户,同样可以得出乡、村的子样本数目,由此产生类似下表的结果:54.7÷÷÷÷2=27.35109.4÷÷÷÷2=54.7437.5÷÷÷÷4=109.41935851××××0.000226=437.5村的子样本村的子样本村的子样本村的子样本户数户数户数户数乡的子样本乡的子样本乡的子样本乡的子样本户数户数户数户数县的子样本县的子样本县的子样本县的子样本户数户数户数户数层的子样本户数层的子样本户数层的子样本户数层的子样本户数㈣㈣㈣㈣在层内抽取在层内抽取在层内抽取在层内抽取PSU从普查资料或其他资料取得PSU的规模测量值,将层内PSU排列起来,如按人均收入大小排列。按层内PSU的排列顺序,将规模测量值累加。采用系统抽样,先计算抽样间距k=1935851/4≈483963,然后在1~k范围内抽取一个随机数r作为起点,如r=268042.92,最后,抽出4个PSU。㈤㈤㈤㈤在在在在PSU内抽次级抽样单位内抽次级抽样单位内抽次级抽样单位内抽次级抽样单位第二、三级抽样分别用PPS方法,从每个样本县中抽选出2个样本乡,从每个样本乡中抽选出2个样本村。第四级抽样,从每个样本村内抽取样本户。计划样本户数为27.35户,实际抽取户数为户户户户实际规模测量值实际规模测量值实际规模测量值实际规模测量值====规模测量值规模测量值规模测量值规模测量值计划样本数计划样本数计划样本数计划样本数2939737435.27≈≈≈≈××××××××====d3㈥㈥㈥㈥对对对对PPS抽样过程的说明抽样过程的说明抽样过程的说明抽样过程的说明在确定各级抽样单位数目时,需考虑两方面因素:一是需要考虑各阶段抽样总体的异质性程度。二是所拥有的人力和经费。除了例子中列出的分层法外,还可以使用另一种分层方法,即将总体A个PSU划分为a/2个大小相近似的层,每层抽取2个PSU。对于抽样单位规模大于抽样间距的,有可能会被选中两次,有两种处理方法。有些最后一级群的规模测量值小于计划从中抽取的样本数,可规定村子的规模下限。二二二二、、、、从住户中抽取被访者从住户中抽取被访者从住户中抽取被访者从住户中抽取被访者多阶段抽样设计的最后一级抽样单位是居民住户,在实际调查中,要从住户成员中按一定规则抽取一位成年人作为调查对象,即为户内抽样。可采用Kish表抽样法来进行户内抽样。Kish表抽样法是通过附在问卷的第一页上的一份抽样页来进行的,抽样页内包括被访住户的地址、家庭成员情况登录表和抽样表等内容。㈠㈠㈠㈠填写住户成员情况填写住户成员情况填写住户成员情况填写住户成员情况访问员要先询问住户成员的基本情况,包括性别、年龄和与户主关系。然后,将成员进行排序并对符合被访问条件的成员编号,然后依次填入住户家庭成员情况登录表中。㈡㈡㈡㈡根据抽样表抽取被访者根据抽样表抽取被访者根据抽样表抽取被访者根据抽样表抽取被访者每份问卷抽样页中的抽样表包括以下内容:抽样表的编号、住户中成年成员数目和抽取成年住户成员的号码。其中抽样表的编号分为A1、B1、B2、C、D、E1、E2和F8种,即有8种抽样表。每种抽样表占抽样表总数的比例分别为1/6、1/12、1/12、1/6、1/6、1/12、1/12和1/6。每一份问卷的抽样也都有一种抽样表,问卷也因此被分为8类。调查时根据抽样表访问的住户成员号码即可。1、调查表编号。表数量(N)表编号1/61/121/121/61/61/121/121/6FE2E1DCB2B1A2.印制选择卡,给每个调查员发一套(八张)具体做法具体做法具体做法具体做法::::Kish选择表11116666或或或或以上以上以上以上1111555511114444111133331111222211111111被抽选人的序号为如果家庭户中18岁以上人口数为AAAA式选择表66666666或或或或以上以上以上以上5555555544444444333333332222222211111111被抽选人的序号为如果家庭户中18岁以上人口数为FFFF式选择表43.给抽中家庭每个成年人进行编号并排序。方法是男性在前、年龄大的在前。最年幼的女性…次年长的女性最年长的女性最年幼的男性…次年长的男性最年长的男性年龄和性别特征n+m…n+2n+1n…21序号女儿27岁5妈妈48岁4奶奶70岁3儿子23岁2爸爸50岁1成员特征序号4.根据调查表上的编号找出编号相同的那种“选择表”查出中选个体的序号,进行调查。66666666或或或或以上以上以上以上5555555544444444333333332222222211111111被抽选人的序号为如果家庭户中18岁以上人口数为FFFF式选择表女儿27岁5妈妈48岁4奶奶70岁3儿子23岁2爸爸50岁1成员特征序号㈡㈡㈡㈡根据抽样表抽取被访者根据抽样表抽取被访者根据抽样表抽取被访者根据抽样表抽取被访者户内抽样的其他方法:生日相近法,即在问卷里页印制一个《家庭成员登记表》,只需设计“家庭成员编号”、“与户主关系”、“性别”、“出生年月日”、“备注”等几个栏目。调查员入户后首先填写该表格,然后,选择出生日期与调查日期最接近的家庭成员作为回答人。㈡㈡㈡㈡根据抽样表抽取被访者根据抽样表抽取被访者根据抽样表抽取被访者根据抽样表抽取被访者户内抽样的其他方法:男女老少法,即在调查设计时,除规定回答人必须具备的条件外,把回答人的性别和年龄分为4类:“最大年龄男性”、“最大年龄女性”、“最小年龄男性”、“最小年龄女性”,并按各占25%的比例设计和印制在问卷首页上。调查员入户后,就按照问卷首页上关于性别和年龄的规定,选择符合规定的家庭成员作为回答人。三三三三、、、、按居住地地图法抽样按居住地地图法抽样按居住地地图法抽样按居住地地图法抽样在区域抽样中,抽取居民户仍需要一份详细的居民户名单抽样框,通常这是根据户籍资料编制的。在没有现成的户籍资料,或已有的户籍资料不完备、过时了的情况下,可采用地图法直接从居住地抽取居民户。三三三三、、、、按居住地地图法抽样按居住地地图法抽样按居住地地图法抽样按居住地地图法抽样㈠㈠㈠㈠对抽样区域分层对抽样区域分层对抽样区域分层对抽样区域分层对将要进行抽样的各城镇乡村等行政区域按适当的准则进行分层,分层数目可根据需求而定,然后在各个层内抽取实际进行抽样的行政区域。㈡㈡㈡㈡选定进行抽样的地图选定进行抽样的地图选定进行抽样的地图选定进行抽样的地图选择地图要考虑几个因素:一是地图出版的时间,二是注意地图的比例尺。㈢㈢㈢㈢选出地图上的坐标点选出地图上的坐标点选出地图上的坐标点选出地图上的坐标点先在选定的地图上绘制二维网格,然后从地图上按照某种概率规则抽取出一些二维坐标点。5三三三三、、、、按居住地地图法抽样按居住地地图法抽样按居住地地图法抽样按居住地地图法抽样㈣㈣㈣㈣训练访问员训练访问员训练访问员训练访问员先让访问员通过地图熟悉他将要访问的坐标点及周围的标志性建筑,然后借助地图比例尺,帮助访问员建立起坐标点与周围标志性建筑之间距离的初步印象。另外,要对访问员进行“步测训练”。㈤㈤㈤㈤访问员实地确定坐标点访问员实地确定坐标点访问员实地确定坐标点访问员实地确定坐标点实地坐标点的访问顺序,应由电脑或其他方法随机决定,访问员必须按事先确定的顺序依次访问。三三三三、、、、按居住地地图法抽样按居住地地图法抽样按居住地地图法抽样按居住地地图法抽样㈥㈥㈥㈥抽取居民住户抽取居民住户抽取居民住户抽取居民住户每个坐标点对应一个“样本户”,如果位于坐标点实地上的是一栋楼房,则用随机数法确定该楼的某一住户为坐标点所对应的“样本户”。除了对坐标点对应的每一“户”进行调查外,还可以采用整群抽样,这时各坐标点所对应的户称为群的首户。从首户开始,按门牌号码自然排列顺序,将相邻的若干户一同列为一个群。第二节第二节第二节第二节随机数字拨号抽样随机数字拨号抽样随机数字拨号抽样随机数字拨号抽样由于当面访问的费用很高,入户调查困难,电话访谈正越来越普遍地取代访问员访谈。在电话访问中获得一份完整的电话号码资料很困难,而随机数字拨号可以部分解决未登录产生的样本代表性问题。随机数字拨号随机数字拨号随机数字拨号随机数字拨号是一组几率抽样的技术,它最大优点是在抽样时,并不一定要具备一个描述完整的抽样框;而它最大的缺点是会遗漏未装电话的家户单位。随机数字拨号可以使用人工或电脑的方式来完成。一一一一、、、、搜集相关信息搜集相关信息搜集相关信息搜集相关信息在进行随机数字拨号抽样时,首先要搜集与电话号码相关的一些信息,包括中心电话局的编码、每个编码下面所涵盖的电话线路数量,并确认无效号码的范围。这些信息能最大限度地减少无效拨打电话的数量,提高抽样效率。㈠㈠㈠㈠搜集电话局编码搜集电话局编码搜集电话局编码搜集电话局编码在抽样区域的地理范围内,无遗漏地搜集电话号码字冠字冠字冠字冠的清单
本文标题:第3章 抽样实务及问题
链接地址:https://www.777doc.com/doc-419366 .html