您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 社会调查与统计第四章抽样
选题概念操作化抽样研究设计问卷设计资料收集资料分析调查报告撰写社会调查步骤第四章抽样第四章抽样本章主要内容1.抽样的概念和类型2.非概率抽样方法4.概率抽样方法5.户内抽样和PPS抽样6.样本规模案例1——2004年美国大选主要民调样本数调查机构样本量福克斯新闻1200盖洛普1573全国广播公司/《华尔街日报》1014哥伦比亚广播公司/纽约时报939美国广播公司/华盛顿邮报939《新闻周刊》882当选的相对机会值日期奥巴马克里纳德尔差额福克斯新闻(1200LV)10/30-10/3146%48%1%克里+2盖洛普(1573LV)10/29-10/3149%49%1%持平全国广播公司/《华尔街日报》(1014LV*)10/29-10/3148%47%1%布什+1哥伦比亚广播公司/纽约时报(939LV)10/28-10/3049%46%1%布什+3美国广播公司/华盛顿邮报(939LV**)10/27-10/3048%48%0%持平《新闻周刊》(882LV)10/27-10/2950%44%1%布什+6最后结果11月2日51.34%48.31%0.35%布什+3.0351.34%48.31%2004年美国总统大选一周前民调结果案例2《文学文摘》抽样——理论依据《文学文摘》(literaryDigest)以邮寄明信片的方式进行民意测验,并且颇为准确预测出1916年、1920年、1924年、1928年和1932年的总统选举结果。该杂志所依据的理论是:“所询问的选民愈多,则结果愈可靠”。案例《文学文摘》——抽样框获得《文学文摘》通常会采用上千万个调查单位样本,而这些样本名单则是通过全美杂志订户、电话薄和汽车俱乐部会员名单收集到的。案例《文学文摘》——样本量当1936年总统大选来临时,杂志仍以同样的方式进行了民意测验,并从寄出的10000万份明信片中,回收了200多万份。案例《文学文摘》—预测结果候选人党派支持率兰登A·Landon共和党57%罗斯福F·Roosevelt民主党43%案例《文学文摘》抽样——选举结果两个星期之后,美国总统选举的结果罗斯福以61%的得票率获得第二任任期。相较于罗斯福的523张选举人票,兰登仅得到8张。案例《文学文摘》——失败原因《文学文摘》的民意测验失败是因为它的样本严重地偏向高收入群体。在当时条件下,收入较低或失业者家里通常没有电话,也没有汽车,因此,根据电话薄和汽车俱乐部会员名单选定的样本,主要涵盖的是经济地位较高的上层选民。案例《文学文摘》——失败原因当时下层选民是罗斯福社会及经济政策的主要受益者和支持者,而共和党候选人则更受上层选民的青睐。一、抽样的基本概念1.元素:等同于分析单位2.总体(population):元素的集合体N3.样本(sample)从总体中按一定的方式抽取出的一部分元素的集合。研究结论只能推及总体范围不反映总体的样本——农民为何常在民意调查中被忽略(中国青年报2005-03-04)中国人如何看美国,如何看美国人和中美关系?近期,《环球时报》在中国社会科学院美国研究所和专业调查公司的帮助下,就此进行了民意调查,并公布了调查结果。尽管该媒体发布的报道声称,他们这次是“做了一次严格意义上的民意调查”,但这次调查是否真称得上“严格意义”,值得商榷。实际上,他们调查的只是中国5大城市的部分居民,却根本没有调查过任何一位农民,而在当代中国,农村人口在全国人口总数中所占比例远远大于城市人口。所以,仅仅5个城市部分居民在调查中表达出来的民意,并不足以真正代表包括广大农村居民在内的“中国人”。值得注意的是,类似这种只调查部分城市居民、调查结果却被说成是整个“中国人”的民意调查,并不鲜见。例如,稍前,《解放日报》和复旦大学、神州调查公司等合作,开展了“今天我们怎样过春节”的全国30个城市抽样调查,也将农民排除在外。中国经济景气监测中心曾经发布的一项调查结果,本来只是显示有58.2%的中国城市居民对目前的收入水平感到满意,但某些媒体在报道时,则声称是“逾半中国人满意当前收入”。超过8亿的中国农民居然“人间蒸发”。零点调查公司曾经对京沪穗蓉宁等10个城市的4226名成年市民进行一项调查,旨在了解这些城市居民未来5年内最关心的事情,但媒体发布的调查结果,却是“中国人关注的十大焦点”。一项标榜为揭示“当代中国人世界观”的调查,实际调查的不过是京沪穗三市的部分居民。(一)与抽样有关的概念(续1)3.抽样:从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程。4.抽样单位(samplingunit)抽样单位就是一次直接的抽样所使用的基本单位。抽样单位与构成总体的元素有时是相同的,有时又是不同的。抽取1000个大学生。直接抽取先抽班级,在抽学生(一)与抽样有关的概念(续2)5.抽样框(sampleframe)又称作抽样范围,它指的是一次直接抽样时总体中所有抽样单位的名单。案例——抽样框从一所中学中,直接抽取200名学生作为样本。该中学的全体学生名单抽样框案例——抽样框如果抽取20个班级作为调查样本。抽样框该中学的所有班级名单(一)与抽样有关的概念(续3)6.参数值(parameter)也称为总体值,它是关于总体中某一变量的综合描述。7.统计值(statistic)也称为样本值,它是关于样本中某一变量的综合描述。基本作用:是人们从部分认识整体的关键环节必要性:研究人员难以做到任何研究都进行全面调查,而抽样误差可以控制到很小,因而抽样调查成为最常用的研究方法之一。二、抽样的作用三、抽样的一般程序界定总体制定抽样框决定抽样方案实际抽取样本评估样本质量四、抽样的方法判断抽样非概率抽样概率抽样配额抽样简单随机抽样系统抽样偶遇抽样整群抽样多阶段抽样雪球抽样抽样方法(一)非概率抽样方法非概率抽样:——依据研究者的主观意愿、判断或是否方便等因素来抽取对象的方法。1.偶遇抽样(accidentalsampling)——又称作方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。2.判断抽样(judgmentalsampling)——判断抽样又称作立意抽样,它是研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法。3.配额抽样(quotasampling)——配额抽样,又称作定额抽样。研究者要尽可能地依据那些有可能影响研究变量的因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例;然后依据这种划分以及各类成员的比例去选择对象,使样本中的成员在上述各种因素、各种特征方面的构成及其在样本中的比例尽可能接近总体。案例1——配额抽样假设某高校有4000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%、二年级、三年级、四年级学生分别占30%、20%、10%。现在用定额抽样方法依上述三个变数抽取一个规模为100人的样本。配额抽样结果案例2盖洛普1948年总体选举民调1936年,乔治·盖洛普(GeorgeGallup)准确地预测了罗斯福将会击败兰登。盖洛普成功是因为采用了配额抽样方法。采用同样的配额抽样方法,1948年盖洛普预测纽约市市长杜威(ThomasDewey)能击败当时在位的哈利·杜鲁门(HarryTruman)当选总统。这次预测却失败了。配额抽样的技术要求配额抽样技术要求研究者必须对总体的情况有所了解(所有投票者)。对于全国性大选的民意调查而言,这类信息主要来自人口普查资料。人口构成改变——然而,到1948年二战促成了大量农村人口涌入城市,在很大程度上改变了1940年人口普查资料显示的人口特征,而盖洛普的抽样依据的正是1940年的人口普查资料。城乡人口政治倾向——此外,由于城市居民更支持民主党,因此,在将乡村投票者的人数估计得多于实际的情形下,便相对低估了投票支持民主党的人数。4.雪球抽样(snowballsampling)——雪球抽样,当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找哪些人并询问他们知道的情况。如果滚雪球一样,我们可以得到越来越多具有相同性质的群体成员。线人(informants)华中某市高校同性恋者的个案研究访谈对象大致来自三个方面:(1)来自由华中科技大学生命科学与技术学院组织的“大学生同性恋亚文化研究”课题组提供的个案资料;(2)笔者在现实中认识的同性恋朋友;(3)由上述两组个案通过“滚雪球”方式认识的新的个案,即他们再介绍自己所认识的圈内的人。《青年研究》2004年第8期(二)概率抽样的方法概率抽样的原理保证总体中每一个个体都有相等的机会入选样本。当总体情况不明时,无法做到随机抽样1.简单随机抽样(simplerandomsampling)——(1)简单随机抽样又称纯随机抽样,它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素。(2)简单随机抽样步骤①取得一份总体所有元素的名单(抽样框)②将总体中所有元素一一按顺序编号③根据总体规模是几位数来确定从随机数码表中选几位数码(2)简单随机抽样步骤(续)④以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍⑤根据样本规模的要求选择出足够的数码个数⑥依据从随机数码表中选出的数码,到抽样框中去找出它所对应的元素(3)随机数表的使用随机数表2.系统抽样(systematicsampling)(1)系统抽样的含义系统抽样又称为等距抽样或机械抽样。它是把总体中的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。它和简单抽样一样,需要有完整的抽样框。(2)系统抽样具体步骤:1.将总体的所有个体按顺序编号2.计算抽样间距KN(总体规模)n(样本规模)K=3.在头K个个体中随机确定起点(A)e.g.如果K=10,就从01-10号中抽签决定一个号码作为起点,假定为054.从A开始,每隔K个个体抽取一个个体,组成样本:A,A+K,A+2K…..,A+(n-1)K05,15,25,….,95001011021031…091002012022032092003013023033093004014024034094005015025035095006016026…..096007017027097008018028098009019029099010020030100√√√√√(3)注意要点系统抽样一个十分重要的前提条件,是总体中个体的排列,相对于研究变量来说,应该是随机的,即不存在某种研究变量相关的规则分布。(3)注意要点之一A.总体名单中,个体的排列具有某种次序上的先后、等级上的高低情况。例抽取若干家庭样本进行消费状况调查。(3)注意要点之二B.总体名单中,个体的排列上有与抽样间隔相对应的周期性分布情况。(1)含义:先将总体中所有单位按某种特征或标志划分为若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽取一个子样本,将其合成样本。3.分层抽样/类型抽样图示:分层抽样分类随机抽样总体子群样本(2)分层抽样的运用A分层的比例问题B分层的标准问题A样本量在各层的分配①按比例分配。即各层的子样本单位在总体中所占的比例,与各层单位在总体中所占的比例的比例完全相同。②非等比例抽样最优分配(Optimumallocation)案例分层抽样某所大学采矿专业中,男生4500人,女生500人,女生比例仅占10%。如果按比例抽样,则当样本规模为500时,女生仅为50人。B分层的标准①理论上,按调查目标变量进行分层是最好的,但在调查之前目标变量的值是不知道的,因此只能是根据与目标变量最相关的辅助变量进行分层,B分层的标准(续)常用辅助变量包括:性别;年龄;职业;教育程度;收入;地域;民族和宗教B分层的标准之二②理论上讲,分层的数量越多越好,但是实际抽样中,层的数量受到限制。首先是样本量的限
本文标题:社会调查与统计第四章抽样
链接地址:https://www.777doc.com/doc-419953 .html