您好,欢迎访问三七文档
第五讲抽样和研究设计引言和问题在很多情况下,社会研究者希望对某一社会现象总体或某一类人的总体作出描述,但若对这些总体中的每一个元素(或个体)都进行研究,则往往是不现实的。因此,选择能够代表总体的一部分个体,成为研究者必须解决的问题之一。这种选择就是抽样。问题:1.我们为什么要抽样?2.如何抽样,抽样包括哪些类型?3.有哪些具体的抽样方法?4.如何做好一个研究设计?思考:央视调查显示有80%左右的观众对春晚满意,新浪网站调查现实只有20%的观众对春晚满意。一、抽样的意义和作用(一)抽样的优势:时间、成本和准确。在很多情况下,社会研究者希望对某一社会现象总体或某一类人的总体作出描述,但若对这些总体中的每一个元素(或个体)都进行研究,则往往是不现实的。因此,选择能够代表总体的一部分个体,成为研究者必须解决的问题之一。这种选择就是抽样。抽样能够节省时间和成本。同时,在研究结果的准确性上,认真抽样后所研究的结果,并不比研究总体中的每一个个体的结果差。(二)抽样的作用向人们提供一种实现“由部分认识总体”这一目标的途径和手段。案例:里根于1984年当选为美国新一任总统。(见:风笑天,2009,119页)对于任何类型的研究者来说,抽样都是个问题。我们不能、也不应该祈求研究自己感兴趣的每一个个案。每个科学计划都试着通过研究少数例子,发现能够被应用于所有事物的东西,这种研究的结果,按照我们的通常说法,是“通则化的”。——贝克尔,《交易的诡计》,67(四)抽样的两种类型:1.概率抽样:以数学上的概率理论为基础,按随机原则进行抽样。“大部分有关抽样的讨论来自定量研究者。他们的基本目标是获取一个有代表性的样本,或从一个较大的单位或个案的集合或总体中,获取一个小的单位或个案的集合,这样,研究者可以研究较小的群体,并对较大的群体进行精确的推论。研究者关注能产生较大代表性样本(即样本与总体非常相似)的特定技术。定量研究者倾向于使用以数学上的概率理论为基础的抽样类型(被称为概率抽样)”(纽曼2007:266)。2.非概率抽样:依据研究者的主观意愿、判断或是否方便等因素来抽样。“定性研究者不太关注样本的代表性和抽取一个概率样本的技术细节。相反,他们关注样本、小的单位、个案或行为的集合,是怎样展示社会生活的。抽样的基本目的是收集特殊的个案,事件和行动,以澄清和深化理解。定性研究这侧重的是发现个案,以提升研究者在特定内容方面对社会生活过程的认识。由于这个原因,定性研究者倾向于采用第二类的抽样:非概率抽样。”(纽曼2007:267)。3.这两种类型的抽样还可以细分出若干不同的形式。(见风笑天2009:120)三抽样的概念(风笑天,2009,116-118页)1、总体(population)(1)总体(population)是由构成它的所有元素所形成的集合。(2)元素(element)是构成总体的最基本单位。在社会研究中,最常见的总体是由社会中的某些个人组成的,这些个人便是这个总体的元素。案例一:要研究某省在校大学生的择业倾向。那么,该省所有在校大学生的集合就是我们研究的总体,而每一个在校大学生就是该总体的元素。案例二:要研究某城市居民的家庭生活质量。那么,该市所有居民家庭就是总体,而其中的每一户家庭就是该总体的要素。2.样本和抽样(1)样本(sample):从总体中按一定方式抽出的一部分元素的集合。或者说,一个样本是一个总体的一个子集。(2)抽样(sampling):从组成某个总体的所有元素的集合中,按一定的方式选择或抽出一部分元素的过程。3.抽样单位和抽样框(1)抽样单位(samplingunit):一次直接抽样所使用的基本单位。抽样单位与元素有时相同,有时不同。如:若从该省在校大学生总体(12.8万)中直接抽取1000名大学生,这些单个大学生同时是元素和抽样单位。若从该总体中抽取40个班级(这些班级的人数恰好是1000人),这时,班级就是抽样单位。(2)抽样框(samplingframe)又称抽样范围。是在一次直接抽样时,总体中所有抽样单位的名单。如案例一,在研究某省在校大学生的择业倾向时,直接抽取的1000名单个大学生的名单就是这次抽样的抽样框。而那40个班级的名单是另外一个抽样框。案例讨论:美国杂志《文学摘要》曾在1920年、1924年、1928年和1932年在美国总统选举的时候,从车主登记簿和电话簿挑选样本寄送明信片调查选举意向,被调查者把投票意向寄回,这四次预测全部正确。在1936年将样本增加到1000万人,预测兰登会大胜罗斯福,但结果是错误的。罗斯福当选了。分析:(1)原因在于抽样框错误,没有正确代表目标总体(所有选民),排除了没有电话或汽车的人,在1936年,这部分选民占很高百分比,这个框架排除了近65%的总体元素和倾向于偏好罗斯福的低收入选民。(2)前几次预测正确的原因:高收入和低收入人群的投票对象没有多大差异;另外在大恐慌之前,较多的低收入者可能也买得起电话和汽车。“好的抽样框是达到好的抽样的关键。抽样框与概念所界定的总体之间不吻合,可能是偏差的主要来源。正如变量的理论定义和操作定义之间的不匹配,会产生缺乏效度的测量,抽样框和总体之间的不匹配也会产生无效的抽样。研究者要尽力减少这种不匹配的情况”(纽曼2007:274)。4.参数值和统计值(1)参数值(parametre),也称总体值,关于总体中某一变量的综合描述,或者是,总体中所有元素的某种特征(变量)的综合数量表现。在统计中最常见的就是某一变量的平均值,如某市待业青年的平均年龄。(2)统计值(statistic),也称样本值。关于样本中某一变量的综合描述。或者是,样本中所有元素的某种特征(变量)的综合数量表现。样本值是从样本的所有元素中计算出来的,对于相应的总体来说,这只是一个估量值。5.抽样分布:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。它是一种根据概率原则而成立的理性分布。三、如何抽样:(一)非概率抽样非概率抽样不是按照等概率原则,而是按照人们的主观经验或其他条件来抽取样本。常常只在定性研究中使用。常见的几种方法如下。(一)偶遇抽样(accidentalsampling)又称方便抽样或自然抽样。研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或仅仅选择那些离得近、最容易找到的人作为对象。(二)定额抽样(quotasampling)又称作配额抽样。1、研究者对总体进行分类,然后决定在每一个类别中抽取的人数。2、可以保证样本具有总体的某些差异。(三)判断抽样(judgementalsampling)又称立意抽样(purposivesampling),研究者根据自己的研究目标和主观分析来选择和确定研究对象的方法。这种方法带有很大的主观性,其结果如何,往往与研究者的理论修养、实际经验以及对对象的熟悉程度有很大关系。“它借助专家的判断来选择个案,或者以心中特定的目的来选择个案”(纽曼2007:269)。1、使用它选择特别能提供信息的独特个案。2、研究者可能使用立意抽样来选取很难接近的特殊总体中的成员。3、研究者确认特殊个案类型,以便进行深入探究。(四)滚雪球抽样(snowballsampling)当我们无法了解总体的情况时,可先调查总体中的少数成员,向他们询问他们还知道哪些符合条件的人;再去调查那些人,并询问他们还知道哪些人符合条件。(风笑天2009:148)“社会研究者常对相互关联的人或者组织网络感兴趣。这种网络可以是全世界探讨相同问题的科学家、在一个中等规模城市中的精英分子、从事组织化犯罪的家庭的成员、出任重要银行和企业董事会的董事或在大学校园中彼此有性关系的人。其中的关键特征是每一个人或单位都和其他部分通过直接或间接的联系而联结起来。这并不意味着网络中每一个人会彼此直接认识、相互交往或是受对方的影响。相反的,这意味着,大部分的人和事物都会因直接或间接的关系,置身于一个具有相互关联的网络中”(纽曼2007:270)。(五)异常个案抽样“当研究者搜寻与主导模式不同,或与其他个案主要特征不同的个案时,会采用异常个案抽样法(也称为极端个案抽样法)。与立意抽样类似,研究者使用多种技术来确定具有某种特征的个案。而异常个案抽样与立意抽样不同之处在于,其目的是确定一个不平常、有差异或特殊的个案集合,并不要求它代表总体。之所以选中某些异常个案,是因为它们是不平常的,研究者希望通过考察那些落在一般模式之外的个案,或者说包含超出主流事件的东西,更多地了解社会生活。”(纽曼2007:271)(六)理论抽样“当研究者发展出扎根理论时,他会采用理论抽样,仔细地选择样本(例如,人群、局面、时间、时间段等)。不断增长的理论兴趣引导个案的选取。研究者根据对个案特点新的理解来选取个案。例如,实地研究者也许会在周末观察某个场景和一群人。理论上,它也许会问在其他时间、场景的其他方面改变后,人们的行为是否相同。于是研究者可能会在其他时间段(例如,夜晚和周末)进行抽样以获取更丰富的图像,了解重要的条件是否相同。”(纽曼2007:272)案例:关于微博现象的考察。II如何抽样(二):概率抽样(probobilitysampling)(一)定义1.概率抽样:以数学上的概率理论为基础,按随机原则进行抽样。2.随机(random)“随机一词在数学上有其特殊的意义,它指的是产生一种数学上所谓随机结果的过程。这就是说,选择过程讲求的是真正随机的方法,而且研究者能够计算出结果出现的概率。在真正的随机历程中,每一个元素都有同等大小被选取的概率”(纽曼2007:275)。3.案例讨论:美国杂志《文学摘要》曾在1920年、1924年、1928年和1932年在美国总统选举的时候,从车主登记簿和电话簿挑选样本寄送明信片调查选举意向,被调查者把投票意向寄回,这四次预测全部正确。在1936年将样本增加到1000万人,预测兰登会大胜罗斯福,但结果是错误的。罗斯福当选了。分析:(1)抽样框错误的原因,没有正确代表目标总体(所有选民),排除了没有电话或汽车的人,在1936年,这部分选民占很高百分比,这个框架排除了近65%的总体元素和倾向于偏好罗斯福的低收入选民。(2)前几次预测正确的原因:高收入和低收入人群的投票对象没有多大差异;另外在大恐慌之前,较多的低收入者可能也买得起电话和汽车。4.抽样分布:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。它是一种根据概率原则而成立的理性分布。(二)概率抽样的一般程序1.界定总体:在抽样前,对总体的范围与界限做明确的界定。2.制定抽样框:收集全部抽样单位的名单,并对名单统一编号。3.决定抽样方案:决定具体采用哪种抽样方法。4.实际抽取样本:到实地抽取样本。5.评估样本质量:根据研究者的抽样设计和抽样实施过程的质量进行评估。通常用比较法:将可得到的反应总体中某些重要特征及其分布的资料,与样本中的同类指标的资料进行对比。若二者之见差别小,则样本的质量较高;反之,则样本的质量较低。案例见风笑天2009:127.(三)抽样设计的原则:1.目的性原则。设计抽样方案时,要从所研究的问题、最有利于研究资料的获取、以及最符合研究目的等因素出发。2.可测性原则:能从样本自身计算出有效的估计值。3.可行性原则:抽样方案必须在实际中切实可行。4.经济性原则:抽样方案要与可得资源相适应。1.简单随机抽样(simplerandomsampling)又称纯随机抽样。按等概率原则直接从含有N个元素的总体中随机抽取n个元素,以此来组成样本,其中Nn。这类似于抽签。(1)最简单的随机样本,同时也是其它类型模仿的对象。(2)发展一个准确的抽样框,对抽样框内部的所有元素编号,根据数学随机数从抽样框中选取元素。中央极限定理:“随着抽样分布中不同的随机样本组数的不断增加,直至无限大时,样本的模式和总体参数将变得越来越可预测。在很多组随机样本下,抽样分布
本文标题:抽样和研究设计.
链接地址:https://www.777doc.com/doc-2373282 .html