您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 企业抽样调查(ppt 84)
来自主要内容抽样调查基本知识服务业抽样调查概况企业抽样调查实例来自主要内容抽样调查的基本概念抽样调查的基本理论基本抽样方法抽样方法的选择对抽样调查的基本认识来自一、抽样调查的基本概念抽样调查概率抽样与非概率抽样总体与样本目标总体与抽样总体抽样框调查单位与抽样单位误差误差限与置信度抽样效率与设计效果来自抽样调查统计调查分为全面调查与非全面调查两类。抽样调查是非全面调查中的一种重要方法,它是从所研究对象的全体(总体)中抽取一部分(样本)进行调查,获取数据,并以此对总体目标量作出推断(估计)。这是广义的抽样调查概念。根据样本抽取方法的不同,抽样可分为概率抽样和非概率抽样。来自概率抽样概率抽样(probabilitysampling)也称随机抽样。概率抽样是严格地按照给定的概率来抽取样本的。特点:按一定的概率以随机原则抽取样本。随机不等与随便。随机有严格的科学定义,可用概率来描述,而随便带有人为或主观因素,它不是一个科学的概念。来自概率抽样(续)每个单位被抽中的概率是已知的,或可计算出来。当用样本对总体目标量估计时,要考虑到该样本抽中的概率,也就是说,估计量不仅与样本观测值有关,也与被抽中的概率有关。通常所提到的抽样调查实际上指的就是概率抽样。国际交流:企业抽样调查包括本行业所有规模的企业。来自非概率抽样非概率抽样(non-probabilitysampling)是相对于概率抽样而言,并无严格的定义,不是按随机原则来抽选的。这种抽样效果的好坏在很大程度上依赖于抽样者的主观判断能力和经验,而且不能计算抽样误差,不能从概率意义上控制误差并以此来保证推断的准确性。此外,即使经验可能已表明某种非概率方法过去曾有较好效果,但这并不能保证该方法一直如此。不过尽管有其理论上的弱点,各种形式的非概率抽样仍在实践中广泛采用,主要原因是节省费用和方便。来自非概率抽样(续1)通常我国的典型调查和重点调查,西方国家称为的有目的抽样或判断抽样等都属于非概率抽样。如果调查的目的是用样本数据推断总体的目标量,并以一定的把握程度保证总体目标量落在目的范围,这时非概率抽样是不合适的。来自总体和样本总体(population):总体就是全部被研究的单位,也称研究总体。按研究的总体不同,总体单位可以是人、户或企业。在服务业抽样调查中,总体就是这些行业的企业和个体户。样本(sample):是总体的一部分,从总体中按一定程序抽得的那部分个体或抽样单位。样本量n对总体总单位数N的比称为抽样比(samplingfraction):Nnf来自目标总体与抽样总体目标总体(targetpopulation):是真正作为研究对象的全体。如要研究山西省居民服务业的情况,目标总体就是所有从事居民服务业的企业和个体户。抽样总体(samplingpopulation):是用作抽样的总体,也就是抽样框。二者应一致,实际难做到。如目标总体是2006年所有从事居民服务业的企业和个体户,但很难做到对在调查时(2007年1月)已消亡的单位的调查,尽管在调查时消亡,但可能在2006年全年营业。先定义目标总体,再根据条件进行修订得到抽样总体。来自总体参数与样本统计量无论对总体还是样本,统计中通常使用平均数和标准差等这样一些数量关系进行描述,它们被用于描述总体特征时,称为总体参数,用于描述样本特征时,称为样本统计量。如:居民服务业抽取800家企业,调查结果计算出企业平均营业收入400万元(样本统计量),总体平均营业收入(总体参数)未知。抽样目的是样本(样本统计量)推断总体(总体参数)。如用800家的平均营业收入作为总体平均营业收入的估计值。来自抽样框抽样框(samplingframe):抽样框是指包含所有抽样单位的名单或名册。由于抽样方法不同,可有目录框和区域框,分级抽样框。名单中的每个单位都有可识别的基本信息;名单的范围应是完整的,不重不漏。现实中使用的抽样框并不十分完备,一方面,要改进和完善,如更新和维护;另一方面调查的设计者要认真分析抽样框的状况,以评价框的不完整对调查结果产生的影响,并尽可能采取一些补救的办法。来自调查单位与抽样单位调查单位(surveyunit):抽样调查要通过对样本单位的观察或调查来取得有关数据或记录有关特征,这些单位称为调查单位。如企业和个体户。抽样单位(samplingunit):抽样单位是指将总体划分成不重叠的有限多个部分的每个部分。区域、企业和个体户。来自误差抽样误差(samplingerror):是由于用样本估计总体而产生的误差,也叫代表性误差。非抽样误差(non—samplingerror):是指除抽样误差以外的,由于各种原因而引起的误差,在各种方式的调查中都存在。来自抽样框误差遗漏单位与新增单位;重复;辅助信息是否准确。来自无回答误差单位无回答;项目无回答;部分无回答。来自设计误差问卷设计引起的误差;抽样设计(选用的方法、分层合理性)及抽选过程(随机)引起的误差。来自调查员引起的误差调查员的责任心和态度;调查员水平。来自被调查者引起的误差无意识回答误差;有意识回答误差。来自处理误差编码;编辑录入;加权;做表。来自点估计和区间估计点估计:抽样调查用样本统计量直接作为总体参数的估计值,称点估计。如用样本计算得到的企业平均营业收入作为总体企业的平均营业收入的估计值,就是点估计。区间估计:是对总体参数可能落入的一个数值范围作出的估计,估计值的取值范围称“置信区间”,与置信区间估计相联系的概率称“置信度”,表示置信区间估计包含了总体参数的可靠程度有多大。来自抽样效率与设计效果抽样效率(samplingefficiency):是指两个抽样方案的抽样方差之比;当某个估计量的方差比另一估计量的方差小时,则称方差小的估计量效率比较高。设计效果(designeffect,,简写为Deff):就是把一个设计方案的方差与简单随机抽样的方差进行比较。Deff小于1时,表示设计方案的效率高于简单随机抽样,反之,效率低于简单随机抽样。来自三种性质的分布总体分布(populationdistribution):是指研究对象这一总体的各个单位标志值的分布状况。样本分布(sampledistribution):样本单位标志值的的分布,就称为样本分布。随着样本的增多,样本分布逐渐接近总体分布。抽样分布:是指样本估计量的分布。如采用同样的抽样方法和同等的样本量,在居民服务业企业中抽取多套样本,每套样本都能计算出一个估计量,所有可能的估计量形成的分布就是抽样分布。来自永久随机数随机数就是按随机方法而生成的数码。即0,1,2……9这十个数字出现的机会是等概率的,但排列的顺序是随机的。永久随机数(PermanentRandomNumbers)则是指长久使用、不改变的随机数。比如一个企业一旦被赋予了一个随机数,则在以后的调查中都使用这个随机数,它类似企业法人代码,具有唯一和终身性。对于样本轮换和不同调查中共享样本非常有用。首先对每个单位赋予一个随机数,然后按随机数大小顺序排队,抽取所需要的样本量。来自概率概率是指用来测定样本被抽中可能性大小的一个非负的数值。来自权数在概率抽样中,每个样本单位都代表调查总体中的一些未被抽中单位,通常,将一个样本单位所代表的总体单位的数量即样本单位抽中概率的倒数称为这个样本单位的设计权数或基础权数。来自权数(续1)100个企业中抽10个企业,每个企业被抽中的概率就是10/100=1/10,权数就是100/10=10,即一个样本企业代表了总体中的10个企业。分层抽样中,要在层内计算权数。如企业分成大、中、小3层。来自=11中型3000300300/3000=1/1010小型7000350350/7000=1/2020合计10200850850/10200=1/1212来自权数(续2)最终权数与基础权数之间的关系最终权数等于基础权数:如果一项抽样调查不存在无回答或涵盖不全等情况,基础权数等于最终权数,可以直接用于估计。最终权数在基础权数基础上进行调整:•存在无回答情况(无回答多与少);•范围涵盖不全;•企业分开;•企业重复。来自权数(续3)不同的抽样方法,权数是不一样的,即推算方法是不一样的。目录抽样:基础权数=N/n,最终权数在基础权数基础上进行调整(无回答、范围涵盖不全)。二阶段目录抽样:基础权数等于两个阶段权数之积。最终权数在基础权数基础上进行调整(无回答、范围涵盖不全),在两个阶段分别调整。如服务业个体抽样,第一阶段抽居/村委会,基础权数等于层内居/村委会个数÷样本居/村委会个数;来自权数(续4)第二阶段抽部分个体户,基础权数等于样本居/村委会中个体户总数÷抽取的个体户数。为了避免权数调整,调查中可规定:•PSU和个体户不允许无回答;•合并和分开的PSU,维持原状;•对样本PSUs维护个体户数。•fgtybn37.xls来自权数(续5)整群抽样:与目录抽样方法类似,只不过是将一个群当作一个样本单位对待。基础权数=N/n,最终权数在基础权数基础上进行调整(无回答、范围涵盖不全)。为了避免权数调整,调查中可规定:•PSU和个体户不允许无回答;•合并和分开的PSU,维持原状;•对样本PSUs维护个体户数。来自总量估计方法各种抽样方法都有自己的总量估计计算方法,一些复杂抽样的总量估计计算公式比较复杂,但利用权数,各种抽样方法总量估计计算公式可统一、简单地表述为样本权数与指标值乘积的关系。为回答单位的最终权数,是样本单位的指标值。iiywY*ˆ*iwiy来自二、抽样调查的基本理论两个极限定理估计量的优良性不用怀疑要遵守抽样原则来自两
本文标题:企业抽样调查(ppt 84)
链接地址:https://www.777doc.com/doc-417747 .html