您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 绪论(抽样技术――蒋妍)
《抽样调查》中国人民大学统计学院第1章绪论1.1调查与抽样调查调查(survey):通过使用明确的概念、方法和程序,依据专门设计的调查方案指导的方式,从一个总体全部或部分单元中搜集感兴趣的指标信息,并将这些信息综合整理成数据系列的有关活动。例:调查北京市民对出租车行业的满意度调查全面调查与非全面调查根据“调查是否针对总体的所有单元”划分:全面调查:普查非全面调查非全面调查相对于全面调查的优点:(1)时间短速度快;(2)费用少成本低;(3)调查结果比较准确;(4)应用范围广泛。应用前提抽样调查的基本概念抽样调查(samplingsurvey)是一种非全面的调查,指从研究对象的全体(总体)中抽取一部分单元作为样本,根据对所抽取的样本进行调查,获得有关总体目标量的了解。抽样调查的作用1.节约费用2.时效性强3.可以承担全面调查无法胜任的项目4.有助于提高调查数据的质量根据“单元是否按照一定的概率入样”划分:概率抽样和非概率抽样随机抽样是指按照概率原则,从总体中抽取一定数目的单位作为样本进行观察,随机抽样使总体中每个单位都有一定的概率被选入样本,从而使根据样本所做出的结论对总体具有充分的代表性。非随机抽样是以方便为出发点或根据研究者主观的判断来抽取样本。非随机抽样主要依赖研究者个人的经验和判断,它无法估计和控制抽样误差,无法用样本的量化数据来推断总体。概率抽样调查非概率抽样调查优点:能够保证样本的代表性,避免人为因素的干扰;用概率抽样取得的样本去估计总体特征时,可以对由抽样产生的抽样误差进行估计。缺点:难以评价样本的代表性无法估计抽样误差偏倚往往较大概率(随机)抽样(probabilitysampling)非概率(非随机)抽样(non-probabilitysampling)抽样调查应用领域社会经济现象的调查社会性的民意调查市场调查1.2基本概念目标总体与抽样总体抽样框与抽样单元总体参数与统计量估计量方差、偏差、均方误差抽样误差与非抽样误差精度与费用目标总体与抽样总体总体目标总体也可简称为总体,是指所要研究对象的全体,或者说是希望从中获取信息的总体,它是由研究对象中所有性质相同的个体所组成组成总体的各个个体称作总体单元或单位。抽样总体是指从中抽取样本的总体。抽样框与抽样单元抽样总体的具体表现是抽样框。通常抽样框是一份包含所有抽样单元的名单。抽样框的形式:名单、手册、地图、数据包等等。抽样框的要求:(1)抽样框必须是有序的,即抽样单元必须编号,且根据某种顺序进行了排列。(2)抽样框中包含的抽样单元务必要“不重不漏”,否则将出现抽样框误差。抽样单元分级:初级单元——次级单元——三级单元——四级单元……——基本抽样单元。总体参数和(样本)统计量总体参数:总体是调查的客体,而总体参数是总体某个特征或属性的数量表现。常见的总体参数有4种:(1)总体总值;(2)总体均值;(3)总体比例;(4)总体比率。总体总值、总体均值、总体比例三者是统一的,它们都可以用总体均值来表示。why统计量和估计方法统计量是根据样本的n个单元的变量值计算出的一个量,也叫估计量,用于对总体参数的估计。估计量是随机变量,比如样本均值估计方法:最常见的估计方法是简单线性估计,除此之外,还可以借助于辅助变量。辅助变量必须满足的两个条件:(1)与要估计的变量高度相关;(2)其总体信息已知。估计量方差、偏差、均方误差估计量分布的方差称为估计量方差,它是从平均的意义上说明估计值与待估参数的差异状况,也是我们对抽样方案进行评价的标准之一。估计量方差表达式:2)ˆ(ˆ)ˆ(EEV偏差是指按照某一抽样方案反复进行抽样,估计值的数学期望与待估参数之间的离差。偏差的表达式:对于无偏估计量,偏差为零。])ˆ([)ˆ(EB均方误差(MeanSquareError,MSE)指所有可能的估计值与待估参数之间离差平方的均值,它等于估计量方差加偏差的平方。ˆ()MSE22ˆˆˆˆEEEE22ˆˆˆˆˆˆ2EEEEEE22ˆˆˆEEE2ˆˆ()()VB==抽样误差与非抽样误差抽样误差:抽样误差是由于抽取样本的随机性造成的样本值与总体值之间的差异,只要采用抽样调查,抽样误差就不可避免。抽样误差是一个一般的概念,它可以用不同的量值来表示。例如:估计量方差或估计量标准差。可以计算、可以控制非抽样误差:是相对于抽样误差而言的,它不是由于抽样的随机性,而是由于其它多种原因引起的估计值与总体参数之间的差异。•包括:抽样框误差、计量误差、无回答误差等精度与费用调查的费用是一个与样本量有关的函数,最简单的是线性费用函数。最优抽样设计:指以最小的费用达到要求的精度或者在给定费用的情况下达到最大的精度样本容量抽样误差nccC10精度由误差来表现。抽样误差与样本量有关,样本量越大,在其它条件相同情况下,抽样误差就越小,抽样调查的精度就越高。几种基本的抽样方式概率抽样调查非概率抽样调查•简单随机抽样•分层抽样•系统抽样•整群抽样•多阶段抽样•判断抽样(包括典型调查和重点调查)•便利抽样•自愿样本•滚雪球抽样•配额抽样等简单随机抽样简单随机抽样(simplerandomsampling)又称纯随机抽样,考虑一个包含N个单位的母体,从中抽取n个单位作为样本。如果抽样是不放回的,即同一个单位不能在样本中重复出现,那么总共有C(N,n)种不同的取法,也就是说共有C(N,n)个可能的不同样本。如果每个样本被抽中的概率都相等,则称这种抽样方法为简单随机抽样,所得到的样本叫做简单随机样本(SRS)。例题:某大学欲了解该校研究生中打算报考托福人数的比例,全校研究生共有570人,随机抽取了100人,其中有14人准备参加托福考试,试以95%的把握程度对研究生中欲报考托福人数的比例作出估计。分层抽样分层抽样(stratifiedsampling)又称类别抽样,它是先将总体所有单位按某些重要标志进行分类(层),然后在各类(层)中采用简单随机抽样或系统抽样方式抽取样本单位的一种抽样方式。例如,对员工收入状况进行调查,就可将员工按职业不同,分为生产人员、商业人员、服务性工作人员等各层,再从各层中抽取员工。等比例抽样不等比例抽样优点更为精确对每层的推论系统抽样系统抽样是将N个总体单位按一定顺序排列,先随机抽取一个单位作为样本的第一个单位,然后按某种确定的规则抽取样本的其它单位。其中最简单也是最常用的规则是等间隔抽取。所以系统抽样又称等距抽样。系统抽样排列顺序与调查项目无关排列顺序与调查项目有关例如,从600名大学生中抽选50名大学生利用学校现有名册按顺序编号排序,从第001号编至600号。抽选距离=N/n=600/50=12(人)如从第一个12人中用简单随机抽样方式,抽取第一个样本单位,如抽到的是8号,依次抽出的是20号,32号,44号……等。系统抽样优点均匀地分布简单易行缺点抽样误差计算较为复杂周期性重合时会影响调查的精确度需要较为详细、具体的相关资料整群抽样整群抽样是先将总体划分成许多不相重合的子总体或群,然后以群为抽样单位,按某种随机方式从中抽取若干个群,形成一个“群”的随机样本,对抽中的群内所有单位都进行调查。例如,某大学要调查学生的视力,可以将班做为一个群,随机抽取几个班,对这些班的全部学生进行调查。整群抽样一是没有总体最终单位的抽样框实施便利、节省费用影响整群抽样误差的主要是群间方差。分群时使群内方差尽可能大,使群间方差尽可能小。整群抽样的估计精度一般低于简单随机抽样多阶段抽样(multi–stagesampling)多阶段抽样是指抽取样本单位时分几个阶段进行:首先在总体中按随机原则抽取若干初级(一级)单位,然后再从被抽中的初级单位中抽取若干次级(二级)单位,这种抽样称为二阶段抽样。如果每个次级单位又可以进一步分为更小的三级单位,那么在每个被抽中的二级单位中再抽取三级单位,这称为三阶段抽样,以此类推,可以定义更多阶段的抽样。多阶段抽样例如,全国性调查,省;市或县;街道、镇、或乡,等等。在大规模的抽样调查中,特别是当抽样单位为各级行政单位时,通常都采用多阶段抽样。优点:样本单位相对集中,实施调查比较方便,可以节省调查费用。抽样时并不需要全部低级单位的抽样框非随机抽样技术原因:1受客观条件限制,无法进行严格的随机抽样;23在调查对象不确定,或无法确定的情况下采用,例如,对某一突发(偶然)事件进行现场调查等;4总体各单位间离散程度不大,且调查员具有丰富的调查经验时。非随机抽样技术方便抽样根据调查者的方便与否来抽取样本,“街头拦人法”判断抽样凭研究人员的主观意愿、经验和知识,从总体中选择具有典型代表性样本作为调查对象平均型”或“多数型”按照一定标准,主观选取样本非随机抽样技术配额抽样事先要对总体中所有单位按其属性、特征分为若干类型,这些属性、特征称为“控制特征”。如被调查者的姓名、年龄、收入、职业、教育程度等;然后,按照各个控制特征分配样本数额。简单易行,样本具有较高的代表性雪球抽样前提:是总体单位之间具有一定的联系,1.4抽样调查步骤(1)确定调研问题(2)抽样方案设计(3)问卷设计(4)实施调查过程(5)数据处理分析(6)撰写调查报告抽样方案设计内容第一、确定抽样调查的目的、任务和要求;第七、制订实施总体方案的办法和步骤。
本文标题:绪论(抽样技术――蒋妍)
链接地址:https://www.777doc.com/doc-6140866 .html