您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 调查研究方法+-+抽样及应用
1调查研究方法:抽样调查与应用中南财经政法大学统计与数学学院张海波2020/2/10一、抽样调查的基本理论2概念分类特点作用2020/2/10(一)抽样调查的含义3含义抽样调查是从所研究总体的所有单元中,按一定程序选择一部分单元作为样本进行调查,并根据样本的特征对总体做出估计与推断的一种调查方式。用场当不可能、不必要、不经济、来不及进行全面调查时,抽样调查是最好的办法注意:要区别抽样单元、调查单元要区别随机抽样(概率抽样)与(非概率抽样)要注意抽样框(抽样单元目录性清单)的使用抽样框可以以名单、手册、地图、数据包等形式出现。2020/2/10(二)抽样调查的基本分类4按是否遵守随机原则分概率抽样非概率抽样按是否将抽中单元放回分重复抽样不重复抽样2020/2/101、概率抽样及其类别5定义概率抽样是按照一定的概率,从构成总体的所有单元中随机选择一部分单元进入样本的抽样方法。其目的是对总体进行概率推断。特点:以随机原则抽样对每个可能的样本都有一个确定的被抽中个概率从样本数据估计总体特征时,需要考虑该样本被抽中的概率类别:简单随机抽样分层抽样整群抽样系统抽样多阶段抽样2020/2/10(1)简单随机抽样6定义简单随机抽样法,又称纯随机抽样,它是按随机原则直接从总体N个单位中抽取n个单位作样本,这种抽样方式能使总体中每一个单位有同等机会被抽中,这种方式是抽样中最基本的,也是最简单的方式。具体方法直接抽选法抽签法随机数字表法适用场合总体内部个体之间差异较小对总体情况完全未知总体范围有限,能够编制完整的抽样框2020/2/10(2)分层抽样7定义分层抽样法,也叫类型抽样法。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。各类型之间视情况可以等比例抽样,也可以不等比例抽样适用场合总体内部个体之间差异较大总体情况复杂总体单位较多2020/2/10(3)系统抽样8定义系统抽样法,也叫等距抽样法。就是将总体单位按某种秩序排列,在规定范围内抽取一个初始单位,然后按相同间隔机械地抽取其他样本单位。特点实施简便,有时并不需要完整的抽样框样本单位在总体中的分布比较均匀对估计精度的估计比较困难适用场合总体中个体本身以一定的秩序出现对总体单位能够进行排序2020/2/10(4)整群抽样9定义整体抽样又称聚类取样,即按照某一标准将总体单位分成“群”或“组”,从中抽选“群”或“组”,然后把被抽出的“群”或“组”所包含的个体合在一起作为样本。抽取“群”或“组”可以采用随机方式或分类方式,也可以采用等距方式来确定;而“群”或“组内的调查则采用普查的方式进行。特点整群抽样的优点是实施方便、节省经费整群抽样的缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。适用场合总体中个体本身以一定的批次出现总体单位往往以群的状态存在不必要或难以以最小单元抽取时2020/2/10(5)多阶段抽样10定义多阶段抽样是根据总体结构特征,将总体划分为多级抽样单元,从初级单元至末级单元逐级抽选,直至抽出调查单元。特点样本比较集中,调查方便抽样框的编制相对比较方便估计量方差的估计很复杂适用场合总体范围过大,如全国性调查难以一次性抽得调查单元以调查单元为单位编制完整的抽样框有困难时2020/2/102、非概率抽样及其类别11含义非概率抽样是指抽样时不遵循随机原则,而是按照研究人员主观判断或仅按方便原则或任由受访者自愿进入样本的抽样方法。类别方便抽样判断抽样配额抽样雪球抽样自愿样本专门调查(典型调查、重点调查)作用非概率抽样可以为调查设计提供研究的初步探索结果可以检验调查方案的可行性用于对总体情况的大致了解,但不能对总体进行概率推断2020/2/10(1)方便抽样12定义也称为偶遇抽样、随意抽样,根据调查者的方便与否来抽取样本的一种方法。最典型的方法是拦截式调查。特点操作简便,费用节省,但样本代表性一般较差。不能据以推断总体。应用不适合描述性研究和因果关系研究。适合于探索性研究,通过调查产生想法和假设。也可用于正式调查前的预调查。2020/2/10(2)判断抽样13定义也称为目的抽样。研究人员凭主观经验,从总体中选择具有代表性样本进行调查。该方法的应用前提是研究者必须对总体的有关特征有相当深入的了解特点在样本量小及样本不能分门别类挑选时有较大的优越性判断抽样的目的多在于了解总体的数量特征和对问题的深入分析,而不是利用调查结果对总体参数进行估计。调查结果与研究者的判断水平、解释能力等相关,结果往往受到怀疑应用选择最能代表普遍情况的调查对象,常以平均型或多数型为标准利用总体全面资料,按一定标准主观选择样本。(如典型单位)2020/2/10(3)配额抽样14定义先将总体分类,后在每类中用方便抽样或判断抽样方法选取样本单位。特点适用于调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。容易掩盖不可忽略的偏差。应用配额的方式有独立控制与交叉控制两种独立控制配额抽样只用一个变量进行配额,交叉控制配额抽样采用多个变量进行配额2020/2/10------独立控制配额15某项调查确定样本量为200人,其中:男性70%,女性30%。请对抽样进行配额。性别比例人数男70%140女30%60合计100%2002020/2/10----交叉控制配额16某项调查确定样本量为200人,其中男性70%,女性30%;农村20%,城市80%。请对抽样进行配额。性别男性比例(70%)男性人数女性比例(30%)女性人数地区农村(20%)14%286%12城市(80%)56%11224%48合计70%14030%602020/2/10(4)滚雪球抽样17定义从是指先根据某种线索选择一些被访者并对其实施访问,再请他们提供另外一些属于所研究目标总体的调查对象,根据所形成的线索选择此后的调查单位。特点滚雪球抽样以若干个具有所需特征的人为最初的调查对象,然后依靠他们提供认识的合格的调查对象,再由这些人提供第三批调查对象,依次类推,样本如同滚雪球般由小变大。这种抽样中有些份子最后仍无法找到,有些份子被提供者漏而不提,两者都可能造成误差。应用调查客体为某一特殊群体,调查客体往往不容易取得时滚雪球抽样多用于总体单位的信息不足或观察性研究的情况。2020/2/10(5)自愿“抽样”18定义自愿“抽样”是由自愿接受调查的单位所组成的样本。例如酒店房间中的顾客调查表,是由顾客自愿填答的;飞机上乘务员发放的乘客调查表,由乘客自愿参与调查。网络调查也是自愿参与的。特点自愿样本集中于某些特定的群体,只有能够接触到调查活动的人才有机会参与调查;构成样本的单位往往是对调查内容感兴趣的那一部分。导致样本的代表性较差。组织方便,成本低廉。应用适合于了解特定群体的意见与看法。2020/2/10二、抽样调查中的误差19抽样中的误差包括抽样误差与非抽样误差。抽样误差是抽样的随机性造成的。一般用估计量的方差或标准差加以描述。概率抽样中的抽样误差是可以估计和控制的。非抽样误差是指除抽样误差以外,其他原因引起的样本统计量与总体真值之间的差异。非抽样误差产生的原因主要是:ˆ()Vˆ()S非抽样误差抽样框误差无回答误差调查人员误差受访者误差理解记忆有意隐瞒其他误差2020/2/10三、抽样设计中的有关问题20抽样精度的问题抽样框误差的问题样本容量的确定问题抽样方式的确定问题样本轮换问题无回答问题敏感性问题2020/2/10211、抽样精度的问题抽样的精度由抽样误差、估计量的标准差等指标来衡量。精度是相对的,是概率事件,没有绝对的准确。一项调查,需了解的指标有多项,故在考虑精度时,应多元化思考,对于比率值可以统一使用精度要求,对于均值则不同均值有不同精度要求。影响精度的因素有多种总体变异度样本量大小样本设计与估计量调查的回答率2020/2/10222、抽样框误差的问题抽样框中包含的抽样单元与目标总体中包括的单元不能完全一一对应时将会产生抽样框误差。抽样框误差形成的原因主要是:丢失目标总体中的单位包含非目标总体单位复合联结(目标总体中的一个调查单位与抽样框中的多个抽样单位相联结)不正确的辅助信息及抽样框陈旧总体与抽样框之间的差异很小时,可以不考虑抽样框误差。若要处理抽样框误差,则可按下列办法进行:按现有的抽样框重新定义总体用加权的方法调整所搜集的资料2020/2/10233、样本容量的确定问题在随机抽样中,样本量的确定有规定的方法。在非随机抽样中,样本量一般根据经验和调查经费的多少,主观加以确定。增加样本量可以提高精度,但会增加费用。样本量的确定要兼顾精度与费用。基本原则是,在精度一定的条件下,费用最省;或在费用一定的条件下,精度最高。2020/2/10244、抽样方式的确定问题考虑多种因素来确定方式,可以多方式相结合。抽样方式的确定,主要应该考虑的因素是:对抽样误差大小的要求调查对象本身的特点人力、物力、经费和时间要求2020/2/10255、样本轮换问题样本老化、长期调查被调查者的合作态度受影响,长期调查可能会影响被调查者的行为,此时需要轮换样本。如何轮换,轮换多少,没有理论上的说法,主要根据经验、需要、经费、调查的组织实施等因素主观确定。2020/2/10266、无回答问题不遇被到调查者、被调查者因客观原因无法接受调查、被调查者拒绝调查等等,都导致无回答。对于由于随机因素导致的无回答,会导致估计量的方差增大。对于非随机因素导致的无回答,既可导致估计量的方差增大,也可导致估计偏差。对于无回答,可采用三种办法处理分清无回答原因,有针对性地进行多次调查。对调查结果进行估算;在无回答者中抽取样本进行再调查(二重抽样)2020/2/10277、敏感性问题敏感性问题是指在抽样调查中,被调查的问题是属于被调查人私人机密或不愿意如实回答的问题。如调查被调查者是否曾冒充顾客进商店行窃,是否吸毒,个人储蓄是多少等。这类涉及个人隐私或违法行为的敏感性问题,若采用直接问答的方式,被调查者往往会拒绝回答或故意作出错误的回答。这样就破坏了数据的真实性,而且其破坏程度的大小无法度量。2020/2/10288、随机化回答技术为了得到敏感性问题的可靠的样本数据,则必须采用随机化回答技术(RandomizedresponseTechnique,简称RRT)。随机化回答技术主要有以下特点:被调查者采取随机回答的方式,调查人员无法从被调查者的回答中得知对方是否具有某种特征。可以在一定程度上消除被调查者的顾虑,使他们参与调查,并提供真实情况。调查人员可以通过概率原理,运用随机化回答结果,对总体参数进行估计。2020/2/1029(1)沃纳随机化回答模型由美国统计学家沃纳(Warner)在20世纪60年代中期提出的。基本思想:为了调查某个敏感性问题,同时列出两个对立的问题,被调查者从中随机抽出一个来回答,回答只用“是”或“否”。调查人员并不知道其回答的是哪个问题,从而保护了被调查者的个人隐私,使其有可能提供真实回答。2020/2/1030(1)沃纳随机化回答模型某市场工商管理部门发现个体户中有漏税现象,欲对个体户漏税人数的比例进行抽样调查,考虑到漏税的个体户不愿意承认自己有漏税为,故采用随机化回答技术。运用沃纳随机化回答技术的过程如下:制作两叠卡片,分别为A类卡和B类卡A卡上写着:“我有过漏税行为”B卡上写着:“我没有漏税行为”A卡和B卡的数量不能相等
本文标题:调查研究方法+-+抽样及应用
链接地址:https://www.777doc.com/doc-3619088 .html