您好,欢迎访问三七文档
第七章抽样第一节抽样的意义与作用第二节非概率抽样方法第三节概率抽样的原理与程序第四节概率抽样方法第五节户内抽样与PPS抽样第六节样本规模与抽样误差抽样估计在统计方法中的地位统计方法描述统计推断统计抽样估计假设检验一、抽样的概念1.总体(population)2.样本(sample)3.抽样(sampling)4抽样单位(samplingunit)5.抽样框(samplingframe)6.参数值(parameter)7.统计值(statistic)•1.总体:总体通常与构成它的元素共同定义,总体是构成它的所有元素的集合,而元素则是构成总体的最基本单位。在社会研究中,最常见的总体是由社会中的某些个人组成的,这些个人便是构成总体的元素。•2.样本:就是从全体或总体中随机抽取出来并用来代表总体的那部分单位所构成的新的小总体。•3.抽样:指的是从组成某个总体的所有元素的集合中,按一定的方式选择和抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。总体与样本样本总体样本统计量例如:样本均值、比例、方差抽样框与抽样单位抽样单位:就是我们可以单独从总体中抽取出来的基本单位。一个理想的抽样框的要求是,它应该尽可能地与目标总体相一致。一般而言,如果总体中的每个元素在清单上分别只出现一次,且清单上又没有总体以外的其他元素出现,则该清单就是一个完备的抽样框。在完备的抽样框中,每个元素必须且只能同一个号码对应。抽样框:又称抽样范畴,是从中抽取样本的抽样单位名单。•6.参数值:关于总体中某一变量的综合指标,在统计中最常见的总体值是某一变量的平均值。•7.统计值:它是关于样本中某一变量的综合描述,它是相应的总体值的估计量。•8.抽样误差:总体的异质性和样本与总体范围的差异性,在用样本的统计值去推算总体的参数值时会有偏差,这种偏差就是抽样误差。•9.置信水平与置信区间:置信水平是指总体参数值落在样本统计值某一正负区间内的概率,而置信区间是指在某一置信水平下,样本统计值与总体参数值的误差范围。抽样的作用•1.现实生活中有些研究总体是不可能进行全面调查的,只可能调查其中的一部分。•2.节约人力、物力。•3.对其他调查方法所得到的资料的可信性的检验,尤其是对普查资料的修正与补充,必须进行抽样调查。抽样的优越性•1.调查费用较低。•2.速度快•3.应用范围广。•4.可获得内容丰富的资料。•5.准确度高。抽样技术非概率抽样概率抽样方便抽样判断抽样配额抽样滚雪球抽样简单随机抽样系统抽样分层抽样整群抽样多级抽样其他抽样技术按比例不按比例第二节非概率抽样•偶遇抽样•判断抽样•定额抽样•滚雪球抽样•空间抽样偶遇抽样•偶遇抽样又称做方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近的、最容易找到的人作为对象。常见的未经许可的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。•其优点就在于方便省力,速度快,可以用于那些需要迅速了解到信息的调查。但是样本的代表性差,带有很大的偶然性。举例说明:•为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车的人选作调查对象。其他类似的偶遇抽样还有:在街口拦住过往行人进行调查;在图书馆阅览室对当时正在阅读的读者进行调查;在商店门口、展览大厅、电影院等公众场所向进出往来的顾客、观众进行的调查;利用报刊杂志向读者进行调查;老师以他所教的班级的学生作为调查样本的调查等等。实例“都市里的吉卜赛人——对武汉市外来务工、经商人员的调查”,《青年研究》2001年第6期,作者:刘玉等•调查对象。本次调查以武汉市外来务工、经商人员为对象。具体做法如下:在武汉市外来务工、经商人员集中的地方(汉正街)的几条主街道发放调查问卷,由调查员按照非随机抽样中的偶遇抽样原则抽取一定的人员进行调查。•资料的收集方法。本次调查问卷由58个问题组成,主要询问了外来务工、经商人员的基本社会特征、工作、收入与支出、观念、社会交往以及对现有生活的满意度等方面的问题。实际发放问卷280份,回收有效问卷252份,有效回收率900%。问卷采用自填法,由被调查者当场填写回收,对一些没有上过学不识字的被调查者采取由调查员根据问卷的内容逐一访谈的方式完成。判断抽样•判断抽样又称立意抽样,它是研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法。这种抽样首先要确定抽样标准。•这种通过主观判断对样本的选择通常有两种方法,一是找“平均人”的方法,一是找异常个案的方法。小组座谈会调查属于判断抽样。•案例:我们要对学生抗议活动中的学生领袖进行研究。许多学生领袖是很容易找到的,但是却不大可能对所有的学生领袖的样本进行研究。为了对所有的或大多数样本进行研究,就必须根据研究目的来搜集资料,所运用的抽样方法就是判断抽样法。实例:“丹江口水库移民生活满意度的调查”,载《社会》2002年6月,作者:陆青华。•这次我们调查的对象是1978年前因丹江口水库工程而迁出的移民,着重是了解他们的生活状况以及对移民生活的满意程度,希望通过对移民们生活中这一敏感而又关键的问题的把握,为改善移民工作提供一些有价值的参考意见。•本次调查以湖北的宜城市和荆门市的部分乡镇的移民为总体,采用判断抽样方法选取调查对象。由于该项调查的指导者王茂福教授对宜城一带较熟悉且得到荆门地区移民局的热情支持,所以我们首选了这两个地区。此次调查总样本为427人。其中宜城市为328人,占总样本的55.7%,荆门市为189人,占总样本的44.3%。•资料收集方法:问卷法。定额抽样•定额抽样与分层抽样中的比例抽样相似,也是按调查对象的某种属性或特征将总体中所有个体分成若干类或层,然后在各层中抽样,样本中各层所占比例与他们在总体中所占的比例一样,但不同的是,分层抽样中各层样本是随机抽取的,而定额抽样中各层样本是非随机抽取的。•定额抽样假定:(1)只要类型划分较细,那么同一个类型中的每一个个体都是同质的,因而无需采用随机抽样。•(2)只要类型划分合理,且分配给各类的名额符合总体中各类人员的分布,那么,样本就可以准确地反映总体。•举例如下:1936年美国的盖洛普使用配额抽样的方法成功地预测了总统当选人,而同样的方法却也造成了他在1948年的错误预测。就像概率抽样一样,配额抽样所强调的也是样本的代表性,虽说二者所达到目的的方法不一样。表7-1年龄所得34岁以下35岁以上合计¥10,000以下21%27%48%¥10,101以上12%40%52%合计33%67%100%组合不同年龄与所得额可形成四种类型:(1)年龄在34岁以下,所得额在10000元以下;(2)年龄在34岁以下,所得额在10101以上;(3)年龄在35岁以上,所得额在10000元以下;(4)年龄在35岁以上,所得额在10101元以上;此时,研究者就根据研究目的从不同的格子里选择样本并搜集资料,而代表每一个格子出现的人,则按照这些格子相对于总体的比例,给予加权。当所有的样本的要素都被加权时,这样的资料就可以合理的代表整个总体了。同样,定额抽样的逻辑有时还可以有效地用于实地调查。定额抽样示例实例:“职业地位:社会分层的指示器———上海社会结构与社会分层研究”,仇立平,《社会学研究》•调查方法和样本:•研究总体是具有上海户籍的、年龄在35-60岁的上海职工(包括部分郊区农民)。由于根据研究框架设计的问卷涉及到许多个人隐私,如家庭财产、经济收入、重大生活事件、家庭出身或家庭成分等,因此抽样是采用判断抽样法,即要求访问员在自己的熟人范围里选择调查对象。考虑到样本的代表性,访问员在选择调查对象时要按照年龄、性别、职业等要求,按配额抽样方法选择样本。计划样本400个,有效样本391个,调查时间是1999年1月。根据调查结果,样本的基本情况如下:男性占593%,女性占407%;平均年龄为4625岁。大多数调查对象的教育程度在初中及以上(95%)。本人平均月收入约1030元,家庭平均月收入约2074元;家庭平均财产(包括不动产)为2329万(据《’99上海年鉴》,1998年职工月平均工资为1005元,2000年为1188元。《文汇报》,2000)。虽然样本的本人月收入较接近总体状况;但由于是非概率抽样,某些指标如性别、职业等与总体有较大差别,且样本较小,因此样本的资料按抽样理论是不能推论总体的,或者在推论时要谨慎。本调查的目的在于检验以“职业地位”作为社会分层标准的有效性和可行性,以及理论假设的内在逻辑性。配额抽样和分层抽样的区别•二者虽然都依据某些特征对总体进行分层,但二者的目的不同,抽样方法也不同。定额抽样之所以分层分类,其目的在于要抽选出一个总体的“模拟物”,其方法则是通过主观的分析来确定和选择组成这种模拟物的成员。也就是说,定额抽样注重的是样本与总体在结构比例上的表面一致性。而分层抽样进行分层,一方面是要提高各层间的异质性与同层中的同质性,另一方面也是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减小。而其抽样的方法则是完全根据概率原则,排除主观因素,客观地。等概率地到各层中进行抽样,这与定额抽样中那种“按事先规定地条件,有目的地寻找”的做法是完全不同的。滚雪球抽样•1.是先从几个适合的调查对象开始,然后通过他们得到更多的调查对象,这样一步步扩大样本范围。当调查总体中的个体信息不充分时,常采用这种方法。例如,某研究部门在调查某市劳务市场中的保姆问题时,先访问了7名保姆,然后请她们再提供其他保姆名单,逐步扩大到近百人。通过对这些保姆的调查,对保姆的来源地、从事工作的性质等状况就有了较全面的掌握。还有对政府工作人员心理素质的测试、家用健身器的应用状况、老人问题调查等等。•2.滚雪球抽样的主要优点:能够保证抽取的样本均具有某总特征,且抽样误差和成本都较小;这种由推荐获得的样本能够很好地满足抽样对样本的人口统计学和心理统计学的特征的要求,因为推荐人对这些特征比随机情景更熟悉。•3.滚雪球抽样的局限性:有许多个体无法找到,产生误差。实例:“城市非自愿离岗女性的社会支持系统——北京市个案研究”,载《妇女研究论从》2001年第1期,作者:张艳霞•这篇文章借鉴组织制度变迁理论、社会网理论和社会性别理论,通过分析北京市26位非自愿离岗者的个案访谈资料,阐述了城市非自愿离岗女性主要的社会支持需求,揭示了离岗女性的社会支持系统是一个由正式支持系统和非正式支持系统共同组成的多元化结构,并分析了在社会支持系统的具体构成和各组成部分的特点上,离岗女性与男性之间的性别差异。•这个研究主要采用个案深人访谈和定性分析方法。全国妇联妇女研究所课题组在1999至2000年进行了“北京市暂不在业女性的社会支持系统”调查研究,走访了30位非自愿离岗人员,其中女性22人,男性8人,对男性个案的调查研究,主要是为了补充丰富调查资料和进行男女两性的比较分析。这篇文章基于对其中20位女性、6位男性个案访谈材料的定性分析。在个案的选择上,这个研究使用的是滚雪球抽样方法,在选择调查对象时,尽量选择了有代表性的个案。值得一提的是,在文章最后,作者补充到由于采用非概率抽样,调查对象的代表性有一定局限。空间抽样•是针对一个变动的总体,如游行队伍、集会等进行抽样的方法,这种总体虽然是变动的,但在空间上是有限的。具体做法如下:同时派出若干名经过训练的调查人员,排成一排均匀地分布在群体的一侧,每个调查者以它所面对的人为第一个调查对象。然后按一定的步数间隔穿过聚集的群体,每一间隔停顿下来时碰到的人均为调查对象。当然,还可采用其他的方式进行。其他的非概率抽样方法•志愿者抽样:从与调查目标有关的志愿者中抽取样本,如医疗实验,媒体座谈讨论节目等只能从志愿者中抽选参与者。•修正的概率抽样:是概率抽样与非概率抽样的结合。在多阶段概率抽样中,前几个阶段均采用概率抽样,在最后阶段采用非概率抽样的方法。非概率抽样的缺点•非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其它条件来抽取样本。因而
本文标题:第七章_抽样
链接地址:https://www.777doc.com/doc-419651 .html