您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 抽样调查步骤及要点简介
抽样调查步骤及要点简介抽样调查步骤及要点简介张祖明(江苏调查总队副总队长,高级统计师)王成(江苏调查总队主任科员、高级统计师)南京市中山北路283号10号楼邮政编码:210003抽样调查是指从研究对象的总体中随机抽取一部分个体作为样本进行调查,据此推断总体的数字特征。抽样调查是社会经济调查中最常用的调查方法。目前研究者对抽样调查方法和原理研究得较多,但对抽样调查的实施过程及其中需要注意的要点则很少谈及。本文将侧重具体的操作对抽样调查过程步骤作一简单的介绍。首先要明确研究的目的和研究对象。抽样调查总是为满足某一个或多个目的而开展的;为达到研究目的,需要选择合适的对象加以研究。其次要制定调查计划(方案)。调查能否取得成功,取决于许多因素,甚至完美的计划也不能确保调查成功,但不周到的计划肯定导致失败。调查计划(方案)包括调查内容的确定,制表的准备,时间安排,总体范围,抽样框的选择,成本估计,样本设计,调查问卷设计,试调查,根据试调查的情况对问卷再行修改和完善,调查表、调查指导手册和其他培训资料的印刷,确定调查对象,调查员和调查对象报酬的安排,培训调查员,调查质量控制和数据处理等等步骤。各环节的顺序并非必须,如问卷设计可以在抽样设计前,调查对象的确定也可以和放在抽样设计之后紧接着开展。出于内容上的考虑,每个过程不一定都详加讨论,下文将选择其中需要注意的重点加以说明。一、总体范围的确定和调查设计ⅰ调查设计要有所取舍。从所接触到的高校科研等一些研究机构设计的调查项目存在的局限性看,调查设计中值得关注的是调查的设计者必须检查或考虑所需要的内容是否可通过调查对象的回答得到正确的答案,不管数据是否需要,如果在可接受的精度内调查对象的回答可能性不大的话,就没有必要选择,要果断地加以删除,如果数据是必须的,最好采取其他的途径来取得。比如离婚情况的调查,出于隐私,面对面访问的效果就很难保证,这时候抽样调查反而不如到民政部门调取数据。ⅱ选择合适的调查类型。连续性调查和一次性调查。当对一个特殊的问题需要立即调查时,往往采用一次性调查。一次性调查时效快、成本低,但不能提供连续的时间序列数据,同时调查是一次性的,调查人员不能固定,很难有机会发展改进调查技术现场工作,也很难积累经验和吸收新的知识来提高调查效益。调查计划中的一个重要内容就是调查内容在连续性调查和一次性调查中的组织与分配。要尽早确定哪些主题是要通过连续性调查取得,哪些主题应单独调查。在连续性调查中,最好建立一个连接调查指标,这些调查指标在每一次调查中都得以保留,这样不同的主题可以进行交叉汇总。例如农村住户调查只对收支指标进行连续性调查,请求调查对象以日记帐形式对其日常生活的开支加以登记;而对调查对象的居住、人口及劳动力等情况开展一次性调查。单主题和多主题。单主题调查是通过一次调查或一个调查周期,只对单一的主题进行调查;同时对不同的主题开展调查则是多主题调查。多主题调查更节约成本、提高效率。现在的抽样技术已经可以将多个主题完美地结合在一起进行抽样而不失代表性。如粮食亩产调查是单主题调查,而播种面积则是将多个主要粮食品种结合在一起,在一套网点上开展的多主题调查。ⅲ调查的进度和时间安排。时间安排的一个重要考虑因素是调查访问时间是短时间内完成还是较长时间完成,并且跟需要招聘的访问员的性质也紧密相关。如访问员是老师或学生,最好在学校假日期间。另外是集中调查还是分散调查对时间的要求也不一样:集中调查能尽快取得调查资料,但需要更多的现场调查人员,对人员素质的要求较高,否则取得的调查资料不尽可靠;分散调查可以使用少量的调查人员,如农业调查,一个调查员可以调查同一地域内的不同季节的农业生产情况。ⅳ总体范围的确定。根据研究的目的,确定要研究的对象,研究对象的集合就是总体范围。对调查总体需要进行各种研判,例如,住户调查,总体中是否要包括一些孤立的人群(诸如无家可归的人)、是否要包括偏远的群体(诸位渔民)、是否包括军人等等,都需要仔细推敲,这些群体不仅调查成本较高,即便想纳入到总体中也非常困难。二、样本抽选ⅰ编制抽样框。理论上讲,抽样框是总体中带有标识资料的每个单位的集合,但一是往往很难得到总体中所有单位的资料;二是样本框还需要取舍修匀。即便取得了所有的资料,由于资料的两极(畸大畸小)通常呈严重偏离状态,比如收入,收入最高的可达数十亿,甚至几百亿,而收入最低的则负很多,这样的单位万一被抽中,不仅样本的代表性成问题,调查数据的前后起伏也将非常大,所以总体进入样本框后还涉及到取舍修匀的问题。三是实际操作中还要考虑工作是否便于开展。同样以农村住户抽样为例,样本框通常以存在调查机构的地区资料为依据,主要的考虑就是调查工作便于开展,当然这些调查机构在最初设立时已经过代表性等诸多方面的充分论证。因此样本框一般都不是总体的全部,而是部分。ⅱ样本容量的确定。确定样本容量的方法有2种,一种是理论方法,给出一定的调查精度,利用公式计算出满足条件的最小样本量;一种是在给定调查费用的情况下,按单位调查成本确定最大有效的样本量。而通常是两者结合起来,即如果满足给定调查精度的样本容量超过了经费、工作负担,在实际操作时,就必须采取折衷的办法。有时候也会按照逼近法的原理,得出样本容量。大体过程是在理论样本容量的基础上逐渐减少样本量,然后经过测算,如果给定的要求都能得到满足,效果很理想,但工作量仍难以承受,则可以继续减少样本量,直至最终的样本量在精度和可承受度方面取得平衡;反之,则增加样本数量,然后测算,如果给定的要求仍不能得到满足,则继续增加样本数量,直至精度和工作量之间取得平衡。ⅲ样本抽选。样本抽选的方法有简单随机抽样、等距抽样(简单等距、对称等距抽样)、类型抽样、整群抽样、多阶段抽样、MPPS抽样等方法,这里不作详细介绍。三、调查表的设计ⅰ调查表的问题要简单易懂。调查访问收集的信息完全取决于提什么问题和怎样提问,尤其要注意的是将复杂的概念通过简单的提问方式表达出来。同样地,提问的方式具体的比笼统的好,比如“本月(本周)你在哪个单位工作?”比“现在你的就业情况”更容易回答;提问还要避免模糊,如“上周你生过病和看过医生吗?”这种情况,生过病但没看过医生的就难以回答了。ⅱ调查问卷的设计还要考虑被调查者的负担——提问时间不能太长,太多的问题会使被调查者产生不愿合作的厌烦情绪。但这个问题往往受到需求的影响:很明显,在调查表里增添一些调查内容比重新开展调查要节省许多。而且如果被调查者对调查感兴趣的话,他们更乐于回答提问,比如给的调查礼品较具诱惑,这样调查内容稍多也应可接受。ⅲ调查表设计时,势必要涉及到回忆以前的行为,回忆时间的长短也需要注意。根据经验,短期回忆比长期回忆更可靠,在同一时间间隔,重大事件的回忆比次要事件的回忆更容易。所以重大事件的回忆时间可以长一些,如美国消费调查中,有关衣着类的调查要求回忆最近一个季度内的支出情况,购买家具则要求回忆半年内的支出,汽车等大件物品则可以回忆1到2年内的情况,低值易耗品及其他小物件的支出情况则要通过日记帐来反映。ⅳ提问的顺序也要注意。通常是这样排列的:一般性的问题放在具体问题之前提问;同一个主题的问题或关于同一事件的类似问题放在一起提问。如国家统计局开展的农民工监测调查首先是从被调查者的身份特征的问题开始,家庭住址、户主姓名等;接着提问其他家庭成员的特征;最后才提出有关调查内容的详细问题,如就业、生活等细节性的问题。ⅴ不同的主题最好分为不同的模块。调查表设计的最后一点建议就是不同的主题分为不同的模块,这对数据处理可能有些不便,但对调查员和调查对象来说,都能够清楚地识别该如何填写。四、试调查之所以把试调查环节单独拿出来强调,是因为这一环节对调查表的完善至关重要。问卷设计好后,设计者本人应该亲自参加试调查,试调查可以在设计者所在地或就近地区开展。一般地,试调查都会发现一些在最初设计时被忽视的地方,比如所提的问题是不是会引起被调查者的反感、访问员是不是对所提的问题觉得难堪、一些问题是不是容易引起误解、用于记录调查数据的空间是不是足够等等。根据试调查中了解的情况再行修改完善调查表。五、现场调查ⅰ选择谁来回答问题。选择回答对象不仅影响到调查成本,更关键的是影响数据质量。如国家统计局开展的农民工监测调查,是选择户主一人回答整个家庭的信息还是调查每一个家庭成员本人,结果是远不一样的。若只选择一个家庭成员来回答所有问题,调查时间和调查成本通常要少得多,但得到的信息可能不太准确;而调查所有家庭成员不仅时间长,还可能面临找不到人的尴尬。在实际调查中采取的是折中的办法:入户访问时分别调查每个在场的家庭成员,对于不在场的人员信息,则从在场人员中了解得到,这样既节省了调查时间和成本,收集的数据又相对可靠。ⅱ不回答的解决。在调查中往往会出现找不到人或拒绝回答的现象。解决的办法通常有替代法和权数调整等办法。替代法:可在每个最终样本群选出一个或多个额外的样本,保留待用。如果群中的一个样本在作了种种努力后,仍是一个不回答者,则把额外的预先保留的替换样本用上去。权数调整法:由于接近的样本之间通常具有一定的相似性,对不回答的调整更可靠的方法就是在群内进行,改变群内其他样本原来的权数。例如,在群内的10个调查户中,如果有1户不能被调查,则从被访问的就近住户中抽选一户,计数2次,即在估计时,给这一户双倍的权数。替代法的优点在于样本的稳定性稍强些,因为有效样本的数量要大些,没有哪个单位在估计中被分配了较大的权数。但要承担一些额外的费用。此外,如果调查员知道了尚有替代的资源可用,他们也许就不会努力去做被调查者的工作。所以,在实际调查中,替代法的使用往往是受限制的。六、数据质量评估在抽样调查中,现在越来越注意和重视对数据的质量进行评估。通过评估,一方面可以检测出调查工作的需要注意和改进的地方,另一方面可以让数据使用者了解数据本身的局限性。比如农民收入调查,在使用数据时需要说清楚调查范围涵盖了哪些群体,没有涵盖哪些群体,对平均数的代表性如何以及对其中的结构到底具不具备代表性等等诸如此类的问题。通过主动评估调查结果,常常能把那些不满足调查结果的无理批评自动压制下去,而无须数据发布后再行解释。ⅰ调查误差。过去,大部分精力都放在减少抽样误差上。抽样误差的减少是有必要的,但是,只要我们的抽样过程遵循了等概率的原则,抽样误差都要远小于调查误差。同时,在样本数量和使用的抽样方法确定后,抽样误差就已经无法再改变了,但是调查误差的大小却是可控的,它跟调查员的责任心,对调查指标的理解熟悉程度紧密相关。因此,调查误差才是抽样调查中更需要关注和解决的问题。调查误差通常包括范围误差、回答误差、数据处理中出现的失误等多种误差。范围误差:因为没有把研究的总体中所有组成部分包含进去而产生的误差,例如农民收入调查如果没有把在外上学的大学生列入为家庭常住人口,就很可能造成农民人均纯收入计算的偏差。回答误差:被访问者在回答问题时,可能因为种种原因而产生失误,造成其答案和实际情况相悖。不恰当的概念或提问,概念错误或解释的不准确及用词不当都会引起严重的回答误差。调查表中调查内容安排不当或现场指导混乱也可能带来类似的后果。数据处理中出现的错误:在数据处理中可能会出现多种错误,格式错误、编码错误、录入错误等等。ⅱ调查误差的计算。有许多方法来测算各种类型的调查误差,其中有些测量方法需要作专门的调查研究,有些方法则可以在调查实施的过程中进行相关计算,下面侧重介绍操作性强的2类测量方法。(a)不回答误差的测定。不回答误差测定一种方法就是对不回答者进行跟踪调查来测定,跟踪全部不回答这通常成本太高,可以选出一部分以便能较为集中地进行一次跟踪来获得部分调查结果。这些跟踪结果连同在前期调查过程中对不回答者进行的调整所做的推算值一起,计算出因不回答而引起的误差。第二种方法是将不回答者的情况与最近的普查相对照,计算不回答误差。第三种方法是把回答者中是经过很大努力(比如找其领导、村委会(居委会)主任帮忙说服才勉强同意接受调查的住户)得来的调查结果和那些在第一次访问时就很乐意接受调查的结果相对比计算不回答误差,经
本文标题:抽样调查步骤及要点简介
链接地址:https://www.777doc.com/doc-7204435 .html