您好,欢迎访问三七文档
第五章抽样设计SAMPLINGDESIGN授课老师:陆娟汇报人:王丹江月朋学习目标学习抽样设计原理及相关概念确定符合实际的抽样调查方式掌握抽样设计的具体程序步骤了解抽样误差形成及计算方法学习确定样本容量的具体规则内容提要1)抽样调查概述2)抽样方案设计3)概率抽样方法4)非概率抽样方法5)抽样误差6)样本量确定5.1抽样调查(SamplingSurvey)概述5.1.1抽样调查的概念、意义及特征抽样(Sampling)是指从一个较大的群组(范围或者总体)的一个子集(样本)获得信息的过程。它包括随机抽样(概率抽样,probability)及非随机抽样(非概率抽样,non-probability)抽样调查的意义:抽样调查做为科学研究方法中重要技术之一,旨在就所要研究的某特定现象之总体中,抽取一部份作为样本,以其为研究总体之依据。将样本研究结果,在抽样信赖水准内,推算总体的可能特性,并以其为决策之参考。从概念中可得知其特征:抽样调查对象只是作为样本的一部分单位,不是全部单位,也不是个别或少数单位。从总体中抽选出的样本对调查总体应具有一定的代表性。抽样调查的目的是根据样本的调查结果去推测总体,达到认识总体特征。样本特征与总体特征之间只能是一个近似情况,二者间存在着必然的差异,但这种差异可以计算和控制。5.1.2抽样调查优缺点比较普查(census)与抽样调查相对应,普查是指对有关总体的每一个单位进行逐一的、普遍的、全面的调查。市场普查可以获得全面准确的信息资料。适用于不常进行调查领域的信息资料收集。普查局限性:耗费时间长,时效性差、费用昂贵抽样调查既克服了普查的组织困难、费用高、时间长的缺点,也克服了重点调查和典型调查的主观随意性和样本代表性不强的弱点,具有较强的代表性和科学性。是比较客观和科学的一种调查技术。抽样调查的优点—节约、高效、准确、适应节约:样本单位数量是直接影响调查成本的关键因素,样本量越多,获取和分析数据的成本越高,由于人力、物力、财力和时间有限,全面调查在一些研究中无法进行,而抽样调查在实践中更容易实现。高效:有些调查对时效性要求很强,与全面调查相比,抽样调查所调查的单元少,数据采集及汇总工作量较小,可以更快的提供调查结果。准确:抽样调查只调查总体中的一小部分,从而减少了在人员登记、主观影响及监督检查方面的误差。调查由少数优秀人员施予特殊训练并配合特殊设备进行,利用抽样技术及机率理论,可得到较深入且质量更高的调查结果。适应:全面调查适用于有限总体的调研,而大多数时候,总体量的把握并不能达到完全精确和有限。另外抽样调查还可作为已有数据的验证。因此在实地市场调查中,抽样调查是不可或缺之工具。抽样调查的缺点它通常只能提供总体的一般资料,而缺少详细的分类资料,在一定程度上难以满足对市场经济活动分析的需要。抽样调查存在难以计算和解释的结果,其不精确性会导致抽样误差。[小知识]现代抽样方法的先驱—盖洛普“一种客观测量报刊读者阅读兴趣的新方法”是乔治·盖洛普在艾奥瓦大学写博士论文时用的题目。通过对“DesMoinesRegisterandTribune”和瑞士数学家雅克布·贝努里具有200年历史的概率统计理论的研究,盖洛普在抽样技术领域取得了进展。他指出当抽样计划中的调查对象涵盖广泛,涉及到不同地域、不同种族、不同经济层次的各种人时,你只需随机抽取而无需采访每个人。尽管当时他的方法不能为每个人理解和认同,但现在,这已被广泛使用。盖洛普通常引出一些特例来解释他自己在说什么或做什么。假设有7000个白豆子和3000个黑豆子十分均匀地混合在一起,装在一个桶里。当你舀出100个时,你大约可以拿到70个白豆子和30个黑豆子,而且你失误的机率可以用数学方法计算出来。只要桶里的豆子多于一把,那么你出错的机率就少于3%。30年代早期,盖洛普在全国很受欢迎。他成为Drake大学新闻系的系主任,然后转至西北大学。在此期间,他从事美国东北部报刊的读者调查。1932年夏天,一家新的广告代理商电扬广告公司,邀请他去纽约创立一个旨在评估广告效果的调查部门,并制定一套调查方案。同年,他利用他的民意测验法帮助他的岳母竞选艾奥瓦州议员。这使他确信他的抽样调查方法不仅在数豆子和报刊读者调查方面有效,并有助于选举人。只要你了解到抽样范围具有广泛性,白人、黑人,男性、女性,富有、贫穷,城市、郊区,共和党、民主党,只要有一部分人代表他们所属的总体,你就可以通过采访相对少的一部分人,来预测选举结果或反映公众对其关心问题的态度。盖洛普证实,通过科学抽样,可以准确地估测出总体的指标。同时,在抽样过程中可以节省大量资金。*Gallup,GeorgeHorace,(1901—1984)是美国数学家,抽样调查方法的创始人、民意调查的组织者5.1.3抽样调查适用范围对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样方式解决。如:破坏或损坏性的产品质量检验:轮胎耐磨性如顾客满意度调查在经费、人力、物力和时间有限的情况下,采用抽样调查方法可在节省费用,争取时效的前提下达到满意的调查效果。对全面调查进行验证。全面调查涉及面广、工作量大、花费时间和经费多,组织起来比较困难。但调查质量的检查验证,无法再次用全面调查方式进行。可运用于企业管理,尤其是产品质量管理。5.1.4抽样调查核心问题及原则调查核心—选好样本:样本准确估计总体的要诀就在于选择哪些个体作为样本进行估算,所以以科学的方式选择样本,以确保其代表性(可作为总体的缩影)是至关重要的。结论:构成总体的主要类型在样本中的比例越与他们在较大总体中的比例接近,其代表性越好。抽样应遵循的基本原则抽样调查基本目的在于通过信息搜集形成结论以供决策参考。因此有效抽样调查应具有下几点原则:有效原则抽样调查应该符合调查目的之需要所获信息价值应超过所支付成本。可测量原则抽样的正确程度必须能够测量,否则抽样调查就失去意义。简单原则抽样调查必须保持简单性要求,使抽样调查顺利进行,以避免不必要之节外生枝。5.1.5抽样调查涉及的基本术语概念总体和样本重置抽样与不重置抽样总体指标和抽样指标抽样误差与非抽样误差精度与费用指标与标志抽样框与抽样单元全及总体:简称总体(population)或母体,抽样中的“总体”与“范围”、“母群”均指所调查研究对象的全体,它由若干个相同性质的调查单位所构成,其单位数体现了其容量,用N表示。按照总体容量大小,我们可将总体分为:有限总体:总体单位数有限,可进行全面调查和抽样调查无限总体:总体单位数无限不可数,只能进行抽样调查柯赫伦(W.G.Cochran):凡样本单位数占总体单位数5%以上的可视为有限总体,不够5%就按无限总体处理。即:n/N≥5%有限总体;n/N<5%无限总体。样本:总体中被选择调查的对总体具有代表性的个体的集合。其单位数体现了其容量,用n表示。总体是所要研究的对象,样本是所要观察的对象。例:从北京市所有居民户中抽取1500户进行生活质量调查,则抽中的居民户就组成了一个样本。指标:是用来说明总体数量特征的基本概念和具体数值。指标都可以用数值表示出来。例如:2006年10月我国职工工资总额是××万元,这句话包括了以下几个指标要素:基本概念--职工工资;具体数值--××万元;空间限制--我国;时间限制--2006年10月标志:用来说明个体特征名称,如个人年龄、性别、职业等。标志可以是数量标志也可以是质量标志。1.用数量来加以反映的,叫数量标志,有标志值。如:年龄、收入等;2.不可以用数值来加以反映的,叫品质标志。如:职业、性别等。他们虽然可以用1,0来表示,但它只是一种代号,不代表数值。总体指标—总体参数(Parameters)是描述总体特征的综合指标,用θ表示。指标是未知的,需推断的。常用的总体指标:总体平均数、总体成数P、总体标准差σ(σp)抽样(样本)指标—统计量(Statistics)是描述样本特征的综合指标,用表示。用来推断总体数量特征,是可计算的。常用的样本指标:抽样平均数、样本成数p、样本标准差s(sp)总体指标和抽样指标计算公式(图1)重置抽样不重置抽样回置抽样、有放回的抽样不回置抽样,即无放回的抽样从总体N个单位中抽取一个容量为n的样本,每次抽中的单位经登录其有关标志后又放回总体中重新参加下一次抽选。具体指从总体N个单位中抽取一个容量为n的样本,每次抽中的单位经登录其有关标志后不再放回总体中参加下一次抽选。每次抽取均是在相同条件下进行的。上次抽选结果会直接影响到下次抽选。经过连续n次不重复抽选单位构成样本,实际上相当于一次性同时从总体中抽中n个单位构成样本抽样框(Samplingframe):可以从中抽出样本单位的总体数据目录或单位的名单。完整性:不遗漏总体中的任意一个个体唯一性:任意一个个体都是唯一的抽样框几种形式名单抽样框区域抽样框时间表抽样框例如:1.名单抽样框:从10万名大学生中抽取2000名大学生组成一个样本,则10万大学生名册就是抽样框。(以名单一览表形式列出总体所有单位)2.区域抽样框:农产品抽样调查中,把土地划分为相同面积的单位进行编号。(按自然地理区域划分并排列出总体所有单位)3.时间表抽样框:对流水线生产的产品进行产品质量检验,把24小时划分为许多抽样时间单位并按先后顺序排列,再按一定要求进行抽样。(按时间顺序排列总体单位)抽样单元(Samplingunit):为方便实行抽样,将总体按某些特征划分为有限且互不重叠的部分,每个部分就是一个抽样单元。它是构成抽样框的基本要素。与基本抽样单元的区别:不一定是组成总体的最小单位。抽样单元分级例:对“北京市中高档商品房的市场需求调查”可以先按区域将北京划分为,东城区、西城区、丰台区、海淀区、朝阳区等。这是一级抽样单位,然后再按各区街道划分成二级抽样单位。抽样误差(Samplingerror)及非抽样误差精确度(Precision)精确度指关于被测特征的不确定性程度。例如:在物价统计中,经济家若认为物价如上升0.02将影响经济决策,则精确度须订在0.02。精确度要求越高,成本越高,但我们一般要求二者之间的平衡而不是一味追求精确度100%。精确度的具体体现就是抽样误差精确度和费用与样本量成正比,但样本量与精确度呈非线性关系。抽样调查费用与精确度之间的关系(图)最优设计:核定费用内达到最高精度或在达到精度要求条件下调查费用使用最少。5.2抽样方案设计定义目标总体选择资料收集方式选择抽样框架确定抽样方法与技术确定样本量实施抽样步骤5.2.1定义总体目标总体(Targetpopulation):指抽样设计者根据调查目的界定的调查研究对象的集合体。确定调查目的和范围对定义目标总体具有关键性的作用总体同质性:指构成总体的各个单位至少有一种性质是共同的,同质性是将总体各单位结合起来构成总体的基础,也是总体的质的规定性。通常以问卷中的过滤性问题来识别合格的答题者为确定应答者是否合格的过滤性问题实例定义总体就是确定那些应排除在外的人的特征地域因素认知程度产品或服务使用情况人口统计学特征同质总体定义基础例:某空调制造商拟进行一项空调满意度调查目标总体:在调查前6个月内接受过该公司售后服务的所有国内用户。抽样总体:在调查前6个月内接受过该公司售后服务,并留了联系方式的所有国内用户。思考:北京现代汽车公司拟进行一项用户满意度的调查,应该如何定义目标总体呢?5.2.2选择资料收集方式资料收集的方法对抽样过程有重要影响。优点缺点座机/手机搜集资料速度快、费用低、覆盖面广,易于控制质量及纠正误差,操作简单,易解除受访人压力。缺少无座机(手机)用户样本,容易屏蔽,难于调查深入,无法了解被调查者当时的态度信件扩大调查范围,增加样本容量,减轻人力负担,给被访者充足时间,可以增加敏感信息调查反馈周期长,要求阅读能力,难以确定总体,低回复率导致偏见。入户/访谈样本代表性强,利于认真作答,易于纠正填写错误,便于回访和核实,便于补充调查。便于
本文标题:抽样设计(调查)
链接地址:https://www.777doc.com/doc-418815 .html