您好,欢迎访问三七文档
第八章抽样调查第一节抽样的调查概述第二节抽样调查组织形式和方法第三节抽样误差第四节抽样估计练习题本章学习目标本章的学习目标理解抽样调查的几个基本概念、原理及类型;理解抽样调查的计算方法;理解必要抽样单位数目的计算方法及影响的因素。本章重点:抽样误差的计算;简单随机抽样、类型抽样的区间估计。本章难点:对抽样误差的理解;抽样极限误差和把握程度的概念及其关系。第一节抽样的调查概述一、抽样调查的概念(一)抽样调查的概念抽样调查是指从研究的总体中按随机原则抽取部分单位作为样本,进行观察研究,并根据这部分单位的调查结果去推断总体,以达到认识总体的统计调查方法。(二)抽样调查的特点1.抽样调查是按随机原则抽取调查单位;随机原则就概率意义而言,又称为等可能性原则。2.抽样调查是用总体中部分单位的指标数值去推断总体指标数值;3.抽样调查中产生的误差可以事先计算并加以控制。二、抽样调查的作用(一)用于无限总体的数量特征的推断;(二)用于实际工作不可能进行全面调查,而又需要了解其全面情况的现象的总体的数量特征的推断;(三)用于某些不必要进行全面调查的总体数量特征的推断。(四)对普查和全面调查资料的质量检查和修正。抽样调查的局限性:首先,由于总体构成的复杂性,通常无法提供总体中各个组成部分的资料。其次,组织抽样调查要遵守某些条件,被调查对象也有一定限制。三、抽样调查的几个基本概念(一)总体和样本1.总体,是指由调查研究对象的全部单位所构成的整体,也称为全及总体。其总体单位是否能全面计数,分为有限总体和无限总体。2.样本,是指从总体中随机选取出部分单位作为一个抽样总体进行调查,这个抽样总体通常称为样本。(二)总体指标和样本指标1.总体指标根据总体中各单位的标志值计算出来的用于反映总体的数量特征的指标称为总体指标。又称为全及指标或总体参数。性质:☆当总体确定以后,总体指标是一个确定的量,其指标数值是确定的、惟一的。☆总体指标的数值是一个未知的常数。常用的总体指标有平均数、成数、标准差、方差和总体总值指标。用以下符号表示:设总体的标志值为:总体中具有某种特性单位的数目为N1。XNXNNPNXXNXXNXXNiiNiiNii~:;:;)(:)(:;:1122121总体总值指标总体成数总体方差总体标准差总体平均数为总体的容量其中NXXXN,,,,212.样本指标根据样本中各单位的标志值计算出来的用于反映样本数量特征的指标称为样本指标,也称统计量。性质:样本指标是不确定的,它的取值随样本的变化而变化,是一个随机变量。设样本的标志值为:样本中具有某种特性单位的数目为n1。为样本的容量其中nxxxn,,,,211)(:;:121nxxsnxxniinii样本标准差样本平均数xnxnnpnxxsnii~:;:;1)(:1122样本总值指标样本成数样本方差第二节抽样调查的组织形式和方法一、抽样调查的组织形式(一)简单随机抽样它是指对总体不作任何技术处理(如分类、排队)而完全按随机原则直接从总体中抽取样本单位的一种抽样组织形式,又称纯随机抽样。简单随机抽样主要有以下几种抽选方法:1.抽签法2.随机数字表法3.计算机程序产生法简单随机抽样的局限性第一,它要求包含所有总体单位的名称作为抽样框,当N很大时,不易构造抽样框;第二,当抽出的单位很分散,给实施调查增加了困难;第三,没有利用其它辅助信息难以提高估计的效率。简单随机抽样的适用情况:总体单位数较少,范围较狭窄的情况。(二)类型抽样1.概念:类型抽样又称分层抽样或分类随机抽样。它是按照某一标志先将总体分成若干组(类),其中每一组称为一层,然后在每一层内按照简单随机抽样方式进行抽样的抽样组织方式。2.种类等比例类型抽样:是指样本单位数在各组之间的分配比例与全及总体单位数在各组之间分配比例相同。不等比例类型抽样:是指样本单位数在各组之间的分配比例与全及总体单位数在各组之间分配比例不相同。类型抽样的优点:1、可以避免标志值比较接近的单位同时被抽中,即保证了样本中包含有各种特征的抽样单位,样本的结构与总体的结构比较相近,从而提高估计的精度。2、类型抽样在一定条件下为实施组织实施调查提供了方便;3、类型抽样既可以对总体参数进行估计,也可以对各层的目标量进行估计。(三)整群抽样1.概念:整群随机抽样是先将总体按某一标志分成若干组,每一组称为一个群,以群为单位进行简单随机抽样,然后对抽到的群进行全面调查的抽样组织方式。2.整群抽样特点:(1)抽取样本时,只需群的抽样框,而不需要具有所有单位的抽样框,这就大大简化了编制抽样框的工作量。(2)由于群通常是由哪些地理位置邻近或隶属同一系统的单位构成,因而调查的地点相对集中,能节省调查费用,方便调查的实施。(3)在某些情况下,往往由于不适宜采用一一个抽取总体单位,不得不采用整群抽样。3.优点:效率高、费用低。4.缺点:整群抽样的抽样误差较大,抽样估计精度也较低。(四)等距抽样1.概念:等距抽样又称为系统抽样或机械随机抽样。它是先将总体中各单位按一定的标志排队,在规定的间隔距离范围内随机抽取一个单位为初始单位,然后按每隔一定的距离抽取一个总体单位(个体)的抽样组织方式。2.种类在等距抽样中,总体单位的排队顺序可以是无关标志,也可以是有关标志。(1)按无关标志排列:即总体各单位排列顺序时所依据的标志与调查的标志无关。(2)按有关标志排列:即总体各单位排列顺序时所依据的标志与调查的标志有关。种类:1.随机等距2.中点等距3.对称等距(五)多阶段抽样多阶段抽样是将一次抽样后得到的样本当作总体再次进行随机抽样,得到第二次抽样样本,然后再如此进行下去的抽样方式。如,我国农产品调查的五阶段抽样方式。省抽县、县抽乡、乡抽村、村抽地块、地块抽样本点,对样本点进行实割实测的调查方法。多阶段抽样与整群抽样和类型抽样都需要对总体进行分组,然后再抽取单位。整群抽样和类型抽样都是一个阶段完成的多阶段抽样的优点:→保证样本相对集中,节约调查费用;→由于实行了再抽样,使调查单位在更广泛的范围内展开。适用:在大规模的抽样调查中,多阶段抽样是经常采用的抽样组织形式。二、抽样调查的方法(一)重复抽样,是指每次从总体中抽取一个单位进行观察后,再把这个单位重新放回总体,使之继续参加下次抽选。这种抽选法也称为回置抽样或重置抽样。(二)不重复抽样,是指每次从总体中抽取一个单位进行观察后不再把这个单位重新放回总体,这个总体单位不再继续参加下次抽选。这种抽选法也称为不回置抽样或不重置抽样。第三节抽样误差一、抽样误差的概念统计误差是指统计数据与客观实际数据之间的差异。即统计数据大于或小于客观实际数据之差。(一)统计误差的种类统计误差根据造成误差的来源不同,可分为登记误差与代表性误差。代表性误差有两种,系统误差和随机误差。系统误差也称偏差,是破环了抽样的随机原则所产生的误差。随机误差也分为两种,绝对误差和平均误差。绝对误差也称实际误差,是指一次抽样中,由随机因素引起的样本指标与全及指标之间的离差。平均误差是指所有可能出现的样本指标值与总体指标值的平均离差。(二)抽样平均误差的概念抽样平均误差是指样本平均数(样本成数)的标准差,它反映了所有抽样结果所得的样本指标值与全及指标值的平均离差。平均数的抽样平均误差用成数指标的平均误差用2)]([xExEx2)]([pEpEp二、抽样平均误差的计算(一)简单随机抽样的平均误差1.抽样平均数的抽样平均误差(1)在简单随机重复抽样条件下,其计算公式为:---平均数指标的抽样平均误差---总体的方差n---样本单位数。nx2x2(2)在简单随机不重复抽样条件下,平均数的抽样平均误差的计算公式为:N---总体单位数n---样本单位数当N很大时,公式可改为:)1(2NnNnx)1()1(22NnnNnNnx2.抽样成数的抽样平均误差(1)在简单随机重复抽样条件下,其计算公式为:(2)在简单随机不重复抽样条件下,其计算公式为:---成数指标抽样平均误差P---总体的成数N---总体单位数n---样本单位数nPPp)1()1()1(NnnPPpp计算抽样平均误差时,要使用总体方差:总体方差往往是未知的,通常有以下几种解决方法:第一,用样本方差代替;第二,用过去的调查资料代替,若有几个可供选择,应取最大一个;第三,用估计资料代替;第四,小规模试验资料代替。)1(2PP和)1(2pps和例1某高等学校有20000名学生,随机按不重复抽取200名学生的计算机统考考试成绩,计算得到:平均成绩为80分,标准差10分,及格率为90%,试计算:1.平均成绩和及格率的抽样平均误差;2.若采用重复抽样,结果又如何?解:P=0.9,则平均成绩的抽样平均误差为:及格率的抽样平均误差为:替总体的方差和成数用样本的方差和成数代10,200,20000nN)(70.0)200002001(200100)1(2分Nnnx%11.2)200002001(2001.09.0)1()1(NnnPPp2.采用重复抽样平均成绩的抽样平均误差为:及格率的抽样平均误差为:)(71.02001002分nx%12.22001.09.0)1(nPPp例2在一批茶叶中,随机抽取20包,测其重量为:(单位:克)146147151149148150151152148153148.5151.4149.1151.1151.3149.6148.8151.2148.3152.1假设茶叶的重量服从正态分布,试求抽样平均误差。解:由样本数据可得样本平均数:样本方差为:)(82.149204.29961克nxxnii)(506.312061.661)(2122克nxxsnii用样本方差代替总体方差则平均重量的抽样平均误差为:)(419.020506.32克nx(二)类型抽样的抽样平均误差在类型抽样中,总体平均数(或成数)的抽样平均误差计算公式与简单随机抽样的抽样平均误差计算公式大致相同,由于类型抽样是先分类,再从各类中抽选样本单位数,故其方差应是各类方差的加权算术平均数。1.抽样平均数的抽样平均误差(1)在重复抽样条件下,其计算公式为:(2)在不重复抽样条件下,其计算公式为:nx2)1(2Nnnx代表总体平均组内的方差,它是各个组的方差的平均数。计算公式为:代表第组(类)的总体单位数和方差。2NNkiii1222iiN和),,2,1(kii在等比抽样的条件下,可用各组的样本单位数和样本单位总数n代替,即NNi和innnNNkiiikiii12122例3某地区有小麦播种面积10000亩,现按平原.丘陵.山区面积等比例按不重复抽取其中3%,计算各类平均亩产和各类亩产标准差。iNnixi按地势分组全部面积亩样本面积亩样本平均亩产公斤亩产标准差公斤符号平原600018060080丘陵300090450110山区100030350150合计10000300——解:样本平均数:平均组内的方差为:)(53030030350904501806001公斤nnxxkiii)(97203003015090110180802222122公斤nnkiii平均亩产抽样平均误差为:)(61.5%)31(3009720)1(2公斤Nnnx2.抽样成数的抽样平均误差(1)在重复抽样条件下,其计算公式为:(2)在不重复抽样条件下,其计算公式为:nPPp)1()1()1(NnnPPp代表总体平均组内的成数的方差,它是各个组的成数的方差的平均数。计算公式为:代表第组(类)的总体单位数和成数。NNPPPPkiiii1)1()1(iiPN和),,2,1(kii在等比抽样的条件下,可用各组的样本单位数和样本单位总数n代替,即:iNN和innnPPNNPPPPk
本文标题:08第八章抽样调查
链接地址:https://www.777doc.com/doc-3053167 .html