您好,欢迎访问三七文档
第二章抽样设计第一节抽样概述第二节总体与抽样框第三节概率抽样第四节抽样误差与样本规模抽样是研究者选择对象的方法,与社会调查研究的其他议题相比,有关抽样的讨论更加严谨和精确。第一节抽样概述一、抽样的概念在社会调查研究中,研究者经常从一个规模很大的研究对象集合中,选出一部分作为研究对象,这个选取过程就是抽样(sampling)。1.总体:全体研究对象2.样本:被抽取元素的总和3.抽样的优点:经济、有效(准确度高)注:使用概率抽样时,应注意以下两点:1.抽样误差无法避免2.概率抽样并不具有普遍的适用性二、非概率抽样(一)方便抽样(二)配额抽样(三)判断抽样(四)雪球抽样三、概率抽样设计要点(一)编制抽样框(完整性和不重复性)(二)选择抽样方法(三)估计抽样误差(四)确定样本规模一、定义总体编制抽样框工作的第一步是定义总体,只有对总体构成及边界有一个清晰的认识,才能最大限度地使抽样框与总体保持一致。第二节总体与抽样框二、编制抽样框对于抽样而言,真正有操作意义的是确定抽样框,没有抽样框实际抽样就无法进行。1.界定总体2.抽样分层次进行一、简单随机抽样一般地,从元素个数为N的总体中不放回地逐个抽取数量为n的样本,如果每一次抽取时总体中的各个个体有相同的可能性被抽到,这种抽样方法叫做简单随机抽样,这样抽取到的样本,叫做简单随机样本第三节概率抽样简单随机抽样的特点(1)它要求被抽取的样本的个数有限,这样便于通过随机抽取的样本对总体进行分析。(2)它是从总体中逐个地进行抽取。这样便于在实践中进行操作。问题:下面的抽样方法是简单随机抽样吗?为什么?1.某班45名同学,指定个子最高的5名同学参加学校组织的运动会。2.从20个零件中一次性抽出3个进行质量检验。3.一儿童从玩具箱中的20件玩具中随意拿出一件来玩,玩后放回再拿下一件,连续玩了5件。4.从整数中抽出所有的偶数。(3)它是一种不放回抽样。由于抽样实践中多采用不放回抽样,使其具有较广泛的实用性,而且由于所抽取的样本中没有被重复抽取的个体,便于进行有关的分析和计算。(4)它每一次抽取时总体中的各个个体有相同的可能性被抽到,从而保证了这种抽样方法的公平性。(一)抽签法抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,记下号签上的号码,就得到一个容量为n的样本。抽签法的优点和缺点:优点:抽签法能够保证每个个体入选样本的机会均等。(得到的样本是简单随机样本)缺点:(1)当总体中的个数较多时,制作号签的成本将会增加,使得抽签法成本高(费时费力)(2)号签较多时,把它们“搅拌均匀”就比较困难,结果就很难保证每个个体入选样本的可能性相等抽签法适用于总体和样本个数比较少。例:某班有40个学生,为了了解学生各方面的情况,需要从中抽取一个容量为10的样本,用抽签法确定要抽取的学生。解:注意抽签法的要求和步骤S1将这40名学生按学号编号,分别为1,2…40;S2将这40个号码分别写在相同的40张纸片上;将这40个纸片放在一个盒子里搅拌均匀,抽出一张纸片,记下上面的号码,然后再搅拌军训,继续抽取第2张纸片,记下号码;重复这个过程,直到抽取到10个号码为止;于是和这10个号码对应的10个学生,就构成了一个简单随机样本。(二)随机数法随机数表由数字0,1,2…9,这10个数字组成,并且每个数字在表中各个位置上出现的机会一样。通过随机数表生成器,例如计算器或计算机的应用程序生成随机数的功能,可以生成一张随机数表。通过随机数表,根据实际需要和方便使用的原则,将几个数组合一组,然后抽取样本。用随机数表法抽取样本的步骤S1将总体中的所有个体编号,(每个号码位数一致)S2在随机数表中任选一个数作为开始S3从选定的数开始按一定的顺序读下去,得到的号码若不在编号中,则跳过。若在编号中则取出。得到的号码若在前面已经取出,也跳过。重复这个过程,直到取满为止。根据选定的号码抽取样本用随机数表法抽取样本的优点和缺点优点:简单易行。解决了抽签法的难题缺点:当总体中的个数很多,从而需要的样本容量很大时,用随机数表法抽取样本仍不方便,容易重复或读错行列。适用性:随机数表法适用于总体多但个体样本比较少。结合所学的知识,你认为用什么样的抽样方法更为方便?1.从1万个灯泡中抽取100个进行质量检验。2.要从汽车厂生产的30辆汽车中随机抽取3辆进行测试,请选择合适的抽样方法,写出抽样过程。二、系统抽样(一)复习1.简单随机抽样设一个总体的个体数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。[注]简单随机抽样有以下特点:(1)它要求被抽取样本的总体的个体数是有限的;(2)它是从总体中逐个地进行抽取;(3)它是一种不放回的抽样;(4)它是一种等概率抽样。(为什么?)简单随机抽样的方法:(1)抽签法步骤:①编号:②制签③搅匀:④抽签⑤取出样本(2)随机数表法步骤:①编号②定起点③取号④取样一般地,当总体中的个数较多时,采用简单随机抽样显得较为费事.这时可将总体分成几个数量相等的部分,然后按照预先定出的规则,从每一部分抽取一个体,得到所需要的样本,这种抽样叫做——系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样.探究:某学校为了了解高一年级学生的视力状况,打算从高一年级1000名学生中抽取100名进行调查,应该怎样抽样?①将这1000名学生从1开始编号;②按号码顺序以一定的间隔进行抽取,由于这个间隔定为10,即将编号按顺序每10个为一段,分成10段;③在第一段号码1~10中用简单随机抽样法抽出一个作为起始号码,如6;④然后从“6”开始,每隔10个号码抽取一个,得到6,16,26,36,…,996,这样我们就得到一个容量为100的样本。系统抽样的步骤:(1)先将总体的N个个体编号(2)确定分段间隔k,对编号进行分段。当N/n是整数时,取k=N/n;(当N/n不是整数时呢?)(3)在第一段用简单随机抽样确定第一个个体编号L(L≤k);(4)以L为起始号码,每间隔k个号码抽取,直到获取整个样本。练习1:从含有100个个体的总体中抽取20个样本,请用系统抽样法给出抽样过程。第一步:将100个个体编号,号码是001,002,…,100;第二步:由于100÷20=5,则将编号按顺序每5个一段,分成20段;第三步:在第一段001,002,…,005这五个编号中用简单随机抽样法抽出一个(如004)作为起始号码;第四步:将编号为004,009,014,019,024,029,034,039,044…094的个体抽出,组成样本。例:从某厂生产的802辆轿车中随机抽取80辆测试某项功能,请合理选择抽样方法,并写出过程。练习2从2004名同学中,抽取一个容量为20的样本,试叙述系统抽样的步骤.二、分层抽样问题:某校高一、高二、高三年级分别有学生1000、800和700名,为了了解全校学生的视力情况,欲从中抽取容量为100的样本,问怎样抽取较为合理?1、各年级应按比例抽取高一年级应抽取40名高二年级应抽取32名高三年级应抽取28名2、在各年级中按简单随机机抽样或系统抽样法分别抽取一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,我们常常将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比实施抽样,这种抽样方法叫做——分层抽样其中所分成的各部分称为“层”。分层的步骤(1)对总体进行分层。分层的原则是把性质相近的单位分为一层(2)确定各层抽取样本的数量。分为分层同比抽样和分层异比抽样(3)按照随机原则从各层次中抽取样本。自层内抽取样本时,通常采用的方法为简单随机抽样或等距随机抽样的方法。分层的标准:(1)以调查所要研究的主要问题或与其相关的问题作为分类标准。(家庭收入和受教育水平)(2)以能突出总体的内在结构作为分层标准。(干部、工人、技术员)(3)以已有的明显层次作为分层标准。(学生年级,年龄按老中青,城市按大中小等)分层随机抽样的优点:(1)同一层中每个单位间的差异较小,容易实现子样本与子总体的同构(2)由于分层,各种情况都包含在样本中,具有代表性(3)与简单随机抽样和等距随机抽样相比,分层抽样的抽样误差要小。适用范围:层间差异大,层内差异小的总体练习一:1.在下列问题中,各采用什么抽样方法抽取样本较为合适?(1)实验中学有180名教工,其中有专职教师144名,管理人员12名,后勤服务人员24人,今从中抽取一个容量15的样本。(一)整数抽样间距(二)非整数抽样间距(三)总体单位的排列三、分层抽样(一)样本规模在各层的分配(二)层的划分(三)分层抽取样本的方法四、整群抽样(一)群的性质(二)规模不等的群五、不等概率抽样(一)代码法(二)拉希里(Lahiri)法六、多阶段抽样(一)分层多阶段等概率抽样(二)多阶段PPS抽样(三)规模测量值一、简单随机抽样的抽样误差(一)放回简单随机抽样(二)不放回简单随机抽样(三)标准误差的意义第四节抽样误差与样本规模二、简单随机抽样的样本规模(一)影响样本规模的因素(二)样本规模的估算1.为什么要进行抽样?2.为什么说“街头拦人”不是随机抽样?3.判断抽样比较适合用于哪些场合?4.目标总体与抽样总体之间有哪些差异?复习思考题:5.简单随机抽样中,有哪几种方法可以产生随机数?彼此之间有何差异?6.为什么说等距抽样是一种准随机抽样方法?7.为什么系统抽样的代表性与总体单位的排列顺序有关?8.为什么分层抽样中,各层的样本规模要进行非比例分配?复习思考题:9.分层抽样中,层的数目要受到哪些因素的限制?10.群的划分原则与分层原则有什么不同之处?11.PPS抽样是如何保证大小不等的群中的元素以相等概率入样的?12.总体规模与样本规模之间是一种什么关系?复习思考题:
本文标题:第二章抽样设计
链接地址:https://www.777doc.com/doc-419783 .html