您好,欢迎访问三七文档
抽样调查普查全面报表抽样调查重点调查典型调查全面调查非全面调查统计调查知识点回顾最常用的是:抽样调查•民意调查:美国总统选举•市场调查:企业新开发产品市场调查•收视率调查:港台节目收视xx点•农产量、贸易、住户调查、劳动力、工业企业抽样调查•……•在这一章,我们将学习:–什么是抽样调查?–如何用抽样调查的样本数据推断总体?–抽样调查的组织方式有哪些?第一节抽样调查与抽样推断的相关概念一、抽样调查与抽样推断抽样调查:是一种科学的非全面调查。它是按照随机原则从调查对象的总体中抽取部分单位进行调查,并根据这部分单位的调查结果推断总体的数量特征。抽样推断:广义上的抽样调查其实已包含了抽样推断,它是在按照随机原则从调查对象的总体中抽取部分单位进行抽样调查的基础上,根据这部分单位的调查结果推断总体的数量特征的一种由局部推导全局的统计分析方法。全及总体TotalPopulation:就是统计总体,是为了与样本相区别而提出的,全及总体的容量(单位数)用N表示。全及总体也称为母体。抽样总体(简称样本,SamplingPopulation):又称样本总体,是抽取出来的子样组成的总体,抽样总体的单位数用n表示。二、全及总体和抽样总体(总体和样本)三、总体指标和样本指标(参数和统计量)总体指标:全及总体的那些指标,也称总体参数或母体参数,其值唯一。总体指标有:FFXxNXxPNNPNXXii2221)()(总体方差:总体成数:总体平均数:样本指标:抽样总体的那些指标,也称样本统计量,为随机变量。样本指标有:ffxxnxxspnnpnxxii2221)()(样本方差:样本成数:样本平均数:四、重复抽样和不重复抽样(重置抽样和不重置抽样)重复抽样:也称为重置抽样,是指按照随机原则,抽取一个登记后,放回去再按随机原则再抽的抽样方法。不重复抽样:也称为不重置抽样,是指抽取出总体单位后,不再放回去,对剩下的总体单位继续按随机原则进行抽样的方法。以抽取号码球为例:1、2、3、4、5、6号球,放在暗箱里面作随机抽取五、有序抽样和无序抽样有序抽样:指每次抽样的先后要进行排序的抽样方法。有有序重复抽样和有序不重复抽样。无序抽样:指每次抽样的先后不进行排序的抽样方法。有无序重复抽样和无序不重复抽样。以抽取号码球为例:1、2、3、4、5、6号球,放在暗箱里面作随机抽取六、样本容量和样本个数样本容量:是指一个样本所包含的单位数。用n表示。n≥30大样本n30小样本样本个数:是指一个总体可能抽取的样本个数,根据抽样方法的不同,同样的总体所可能抽取的样本个数是不同的。•最为出名:盖洛普民意调查•以其准确性和权威性在世界各地享有极高的声誉•盖洛普民调:奥巴马50%对42%的支持率领先麦凯恩•CNN民调:奥巴马50%对43%的支持率领先麦凯恩案例1:民意调查出口民调•出口民调,是私营调查机构在投票站出口处对刚刚走出投票站的选民进行的一项调查,通过直接询问选民投给谁来预估选举结果。•收视率是指:收视人数除以整个市场电视人口数的百分比(如:收视率2%,意味着100个人中有2个人收看)•收视率影响广告商愿意花多少钱来买某节目的广告,以及该节目播不播下去。案例2:电视收视率调查收视率在中国•央视-索福瑞公司•AGB尼尔森公司尼尔森公司2008春晚收视率调查•总体:4.24亿收视人群•样本:全国14省市14,000户家庭(装有个人收视记录仪)•标志:某一时段是否在看春晚节目•指标:全国家庭收视率71.8%•央视-索福瑞调查结果春晚收视率为96.5%央视-索福瑞CSM公司•CSM在全国建立了9个省网、67个单独城市调查站,样本总规模达到18,500户•2008年春晚播出时,对全国406个区县进行了3个多小时的电话调查。共访问成功2063个家庭,其中1899个家庭收看了春晚,推算出全国有96.5%的家庭收看了央视春晚。北京奥运会开幕式收视率•央视-索福瑞:68.8%家庭•AGB尼尔森:86.8%家庭第二节抽样误差一、抽样误差抽样误差即指随机误差,是抽样中由于随机的原因,使样本各单位结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。这种误差是抽样调查固有的误差,是无法避免的。但是可以控制的。年龄总体(N)样本一(n)样本二(n)171819202004003001001020155825134合计10005050样本结构不足以代表总体各单位的结构产生误差的案例:对1000名大学生的年龄分别进行抽样调查,随机抽取50名学生作为样本,可抽取无数个样本,我们以样本一和样本二作为代表来进行分析:例1分析:从上例可以看出:1、总体的平均数(年龄)为18.3岁;2、样本一的结构与总体结构完全一致,故样本一的平均数(年龄)也为18.3岁;3、样本二的结构与总体结构相差很大,所以平均数(年龄)的差异也很大,为18.26岁。结论:在大多数情况下,由于随机原则,样本结构不可能与总体结构一致,因此存在误差是必然的,不可能消灭,但可以控制。二、影响抽样误差的因素1.母体(总体)各标志值的变异程度——两者成正比,如果母体(总体)标准值没有差异,则也就没有抽样误差;2.样本容量n——反比关系:样本越大,误差越小3.不同的抽样方法——重复抽样不重复抽样;4.不同的抽样组织形式——是等距抽样还是整群抽样,还是分层抽样或其它形式都会有影响。三、抽样平均误差计算抽样平均误差的意义:由于抽样是随机的,因此样本也是随机的,因此样本指标的计算结果也是随机的,唯一确定的是母体参数值,而母体参数值我们往往是不知道的。因此只能用样本指标来估计,但没有任何一个样本的指标代表的是总体的真实参数,所以只能把所有的样本的指标平均来近似反映,这就产生了抽样平均误差的概念。三、抽样平均误差抽样平均误差的定义:是反映各样本的抽样误差一般水平的指标,实质上是抽样指标(平均数或成数)的标准差。抽样平均误差计算的理论公式(M是样本个数):一般使用计算软件计算MPpMXxPX22)()(注:1、抽样误差实质上就是抽样指标的标准差。2、一般情况下,除非特别指明,抽样误差就是指的抽样平均误差。3、上面这些公式只是定义的理论公式,我们实际计算中一般不用这些公式。三、随机抽样的具体方法所谓随机抽样又叫概率抽样,是指以概率原理为基础,按随机原则抽取样本的抽样方法。随机抽样的具体方法,主要有下列几种:(一)简单随机抽样:有直接抽样、抽签法或抓阄法、随机数表法。(二)等距随机抽样(三)类型随机抽样(四)整群随机抽样(五)多段随机抽样三、随机抽样的具体方法(一)简单随机抽样:又称纯随机抽样,即对总体单位不进行任何组合,仅按随机原则直接抽取样本。1.直接抽样法2.抽签法或抓阄法3.随机数字表法图1简单随机抽样三、随机抽样的具体方法(一)简单随机抽样简单随机抽样的优、缺点:优点:在抽样中完全排除了主观因素的干扰,最符合随机原则,众多抽样方法中最简单,操作方法最容易理解缺点:(1)简单随机抽样需要把总体中每一个体编上号码,如果总体很大,这种编号几乎是不可能的,故它只适用于单位数量不多的调查对象。(2)这种抽样方法常常忽略总体已有的信息,降低了样本的代表性。如,对某一地区的学生进行抽样,测试该地区学生的智力水平,重点学校与一般学校的学生是有差异的,如果不考虑这个因素,则所抽取的样本很可能重点学校的学生多些,或根本没有重点学校的学生。这样样本的代表性是不理想的,若充分考虑并利用重点与一般存在差异这一已有信息,可以设计出更好的抽样方法(见后面的分层随机抽样)(3)抽取的样本可能比较分散或过分集中,这将给实际调查工作带来许多困难。三、随机抽样的具体方法(二)等距随机抽样:也叫机械随机抽样或系统随机抽样。(随机+等距)它是先将总体各单位按一定标志顺序排列,编上号,然后用总体单位数除以样本单位数,求得抽样间隔,并在第一个抽样间隔内随机抽取一个单位作为第一个样本单位,最后按抽样间隔做等距抽样,直到抽取最后一个样本单位为止。例:图2随机起始的等距抽样三、随机抽样的具体方法(二)等距随机抽样优点:样本在总体中的分布比较均匀,具有较高的代表性,抽样误差小于简单随机抽样,而且比较简单易行,只要确定了第一个样本单位,整个样本也就确定了。更适合大样本的使用;样本分布比较分散缺点:调查总体的单位不能太多,而且要有完整的登记注册,否则难以进行。但是,如果总体具有某一种周期性变化,则等距抽样的代表性远不如简单随机抽样。另外,等距抽样同简单抽样一样也容易忽略已有信息三、随机抽样的具体方法(三)类型随机抽样:又称分层随机抽样。具体做法是按照总体已有的基本特征,将总体分成几个不同的部分(每一部分叫一层),然后,根据各类型(或层次)所包含的抽样单位数与总体单位数的比例,确定从各类型中抽取样本单位的数量;最后,再分别在每一部分中随机抽样例:要了解某市800个私营企业的生产经营情况,决定分类抽取100个作为样本进行调查。首先分类,第一产业80个,占10%;第二产业320个,占40%;第三产业400个,占50%。三、随机抽样的具体方法(三)类型随机抽样需要分层的情况Ø总体的不同部分(层)之间有明显差异时Ø调查结果中要求有各个子总体的各自结果时Ø总体中大部分的差异不大,但极个别的局部与其它部分差异很大时,将这个别的局部单独作为一个层三、随机抽样的具体方法类型随机抽样的评价:优点:比简单随机抽样更精确适用于总体单位数量较多,单位之间差异较大的调查对象便于管理与实施控制缺点:必须对总体各单位的情况有较多的了解,否则无法科学分类,抽样难度加大,选择正确的分层标准很重要三、随机抽样的具体方法(四)整群随机抽样又叫聚类随机抽样或集体随机抽样,先将总体各单位按一定标准分成许多群体,并将每一个群体看作一个抽样单位;然后,按照随机原则从这些群体中抽出若干群体作为样本;最后对样本群体中的每个单位逐个进行调查。例:某中学有1200个学生,分为6个年级24个班。采取整群随机抽样方法调查该校学生健康状况。随机抽六个班调查。三、随机抽样的具体方法(四)整群随机抽样优点:样本单位比较集中,调查动作比较方便,可以节省人力、物力、财力和时间。缺点:样本分布不均匀、代表性差,与上述几种抽样方法相比较,在样本数量相同的情况下抽样误差较大。三、随机抽样的具体方法(四)整群随机抽样整群抽样分层抽样抽样对象群个体基本假设群内差异大群间差异小三、随机抽样的具体方法(五)多段随机抽样又称多级随机抽样或分段随机抽样,就是把从总体中抽取样本的过程分成两个或两个以上阶段进行的抽样方法。方法第一步:先将总体各单位按一定标志分成若干群体,作为抽样的第1级单位。然后将第1级单位又分成若干小群体,作为抽样的第2级单位。以此类推,还可以分为第3级、第4级单位。第二步:依随机原则,先在第1级单位中抽出若干群体作为第1级样本,然后再在第1级样本中抽出第2级样本,以此类推,还可以抽出第3级样本、第4级样本。第三步:对最后抽出的样本单位逐个进行调查。例:见书三、随机抽样的具体方法(五)多段随机抽样例:假定某县有20个乡镇,平均每个乡镇有10个行政村,每个行政村有10个自然村,每个自然村有50户.这样全县共有200个行政村、2000个自然村、10万户.现在决定采用随机抽样方法对该县计划生育状况按户做5%的抽样调查,共抽取样本500户.三、随机抽样的具体方法(五)多段随机抽样首先,确定抽样单位,根据该县社会组织的4个层次,即乡镇、行政村、自然村、和户,应采取4段随机抽样方法抽取样本,并确定乡镇为第一级单位,行政村为第二级单位,自然村为第三级单位,户为第四级单位.然后采取不同的抽样方法,分四阶段逐步抽取样本.三、随机抽样的具体方法(五)多段随机抽样一段抽样,从县抽乡镇.20个乡镇经济发展较好的4个,一般的12个,较差的4个.确定样本数量.一级单位抽25%的单位即5个乡镇.较好1个一般的3个较差的1个.三、随机抽样的具体方法(五)多段随机抽样二段抽样,从乡镇抽行政村.采用等距.5个乡镇5
本文标题:抽样调查意义及方法
链接地址:https://www.777doc.com/doc-418926 .html