您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 大学课件 > 第5章抽样与抽样分布
第五章抽样与抽样分布王新华武汉工业学院经管学院主要内容•5.1常用的抽样方法•5.2抽样分布重点与难点•重点:常用的几种抽样方法(包括简单随机抽样、分层抽样、系统抽样、整群抽样)、抽样分布定理•难点:抽样分布定理的应用5.1常用的抽样方法•样本(sample)是按照一定的抽样规则从总体中抽取的一部分单位的集合。根据抽取的原则不同,抽样方法有概率抽样和非概率抽样。•(本科评估专家如何抽样?)5.1常用的抽样方法(1)概率抽样(随机抽样):按随机原则抽取样本,随机原则(random)排除主观意愿的干扰,使总体的每个单位都有一定的概率被抽为样本单位。(比较客观)最基本的组织方式有:简单随机抽样、分层抽样、系统抽样、整群抽样。该方式有效避免了主观选择带来的倾向性误差,可以估计、推断建立在概率、数理统计的科学理论上,可以计算、控制抽样误差,能够说明估计结果的可靠程度。5.1常用的抽样方法(2)非概率抽样(非随机抽样):从研究目的出发,根据调查者的经验或判断,从总体中有意识地抽取若干单位构成样本。如:重点调查、典型调查、配额调查、方便调查该方式可以及时了解总体大致情况,总结经验教训,进行大规模调查前的试点,但易产生倾向性误差。注意:统计上所指的抽样一般都是指概率抽样,本书所研究的抽样也都是概率抽样。5.1常用的抽样方法•简单随机抽样•分层抽样•系统抽样•整群抽样一、简单随机抽样simplerandomsampling•在总体中抽取n个单位作为样本,要使得每一个总体单位都有相同的机会(概率)被抽中,这种抽样方式称为简单随机抽样。•重复抽样(samplingwithreplacement)•不重复抽样(samplingwithoutreplacement)(世界杯小组抽签)(福利彩票选号)二、分层抽样(分类抽样)stratifiedsampling•分层抽样是指在抽样之前先将总体的单位划分为若干层(类),然后从各个层中抽取一定数量的单位组成一个样本。•例如:专家抽样:按专业进行抽样;城市职工收入调查,按行业分类;居民的消费支出调查,可按户口分类(城市、农村)或性别分类(男、女)或地区分类(31省市)。•分层抽样是统计分组法与抽样原理结合,可以提高样本的代表性,样本结构更接近于总体结构。•划分层之后,确定各层的抽样数目(等比例分层抽样、不等比例分层抽样)三、系统抽样(等距抽样或者机械抽样)systematicsampling•在抽样中先将总体单位按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个单位,直至抽取n个单位形成一个样本。•如:总体有1000个单位,要从中抽取50个样本单位,可先将总体单位依次排队,计算出抽样间隔距离1000/50=20,再从第一个至第20个单位的范围内随机确定一个抽样起点,之后每个20个单位抽取一个样本单位。•比如:调查某校学生的学习成绩,可以将学生按学好排队,然后每个一定数量的学生抽取一名学生进行调查。系统抽样的最显著的特点是:提高样本单位分布的均匀性,样本代表性较强。三、系统抽样(等距抽样或者机械抽样)systematicsampling•按排队标志与调查内容的关系分为:1.无关标志排队系统抽样2.有关标志排队系统抽样三、系统抽样1.无关标志排队系统抽样•排队的标志与调查内容没有直接联系。•如城市居民消费和收入调查,按居民所居住的街道门牌号码排队。产品质量检查,按产品生产的时间先后顺序排队。•抽样起点r可以随机确定,可以为第一个抽样距离内的任意一个总体单位。•接近于简单随机抽样,抽样误差按简单随机抽样的误差公式计算。三、系统抽样2.有关标志排队系统抽样•排队标志与调查内容有密切关系。•如:调查某学校学生,按学习成绩高低排队。调查居民消费的情况,按收入高低排队。•其抽样起点的确定不宜随机确定。(在第一个抽样距离内随机的抽取一个标志值较小或较大的单位作为抽样起点,整个样本势必出现偏低或者偏高的系统误差。)三、系统抽样2.有关标志排队系统抽样(1)半距起点等距抽样以第一个抽样距离的一半为抽样起点(r=k/2)并每间隔k个单位抽一个单位。(只能抽取一个样本)(2)对称等距抽样在第一个抽样距离内随机确定抽样起点r(),然后以组界[k,2k,3k,……]为对称点两两对称的抽取样本单位。如:03571013151720四、整群抽样clustersampling•调查时先将总体划分成若干群,然后再以群作为调查单位从中抽取部分群,进而对抽中的各个群中所包含的所有个体单位进行调查或观察。•例如:研究学生体质情况,以学校为群抽样;研究农民收入情况,以自然村为群;检验产品质量,从自动生产线上每隔若干小时抽一个小时的产品作检验。•整群抽样只需对各群进行编号,而不需要对各总体单位进行编号,由于样本单位较集中,便于集中力量去调查。但是整群抽样的代表性可能较差。•样本代表性取决于抽中群体对全部群体的代表性。群体之间差异愈大,样本代表性愈差。5.2抽样分布•抽样分布的概念•样本均值的抽样分布•样本比率的抽样分布一、抽样分布的概念•每个随机变量都有其概率分布。样本指标即样本统计量是一种随机变量,它有若干可能取值,每个可能取值都有一定的可能性,从而形成它的概率分布,统计上称为抽样分布。•抽样分布就是样本统计量的概率分布。样本统计量是由n个随机变量构成的样本的函数(如样本均值、样本比率),所以,抽样分布属于随机变量函数的分布。•抽样推断中,统计量服从正态分布或以正态分布为渐进分布,另外还有t分布、F分布、分布。2二、样本均值的抽样分布•总体方差已知时,样本均值的抽样分布•总体方差未知时,样本均值的抽样分布221.总体方差已知时,样本均值的抽样分布•定理1:设总体,()是其一个随机样本,则:样本均值,转化为标准正态分布为:•定理2:若总体X的均值为,方差为,()是其一个随机样本,当样本容量n充分大(n30),则:样本均值转化为标准正态分布为:),(~2NXnxxx,21,),(~2nNx)1,0(~/Nnx2nxxx,21,),(2nNx)1,0(/Nnx1.总体方差已知时,样本均值的抽样分布•例如:在一批供货中标明某种工具的平均使用使用寿命是50小时,标准差为3小时,现随机从中抽取60件,求它们的平均寿命在49.5~51小时之间的概率。解:所以),(2nNx)609,50(~Nx8966.0)58.229.1()60/3505160/3505.49()515.49(xPxPxP2.总体方差未知时,样本均值的抽样分布•定理3:设总体,()是其一个随机样本,样本均值为,样本标准差为s,则统计量:),(~2NXnxxx,21,x)1(~/ntnsxt三、样本比率的抽样分布•比率:产品合格率、收视率、市场占有率、支持率等等,即具有某种特征的单位占全部单位的比例。•定理4:对任意总体X,其总体比率为P,从中抽取容量为n的样本,样本比率为p,则当n充分大(n30),样本比率转化为标准正态分布为:))1(,(nPPPNp)1,0()1(NnPPPp三、样本比率的抽样分布•例如:某批产品的合格率为98%,从该产品中任意取100件产品,求样本合格率大于96%的概率。•解答:9236.0)43.1()10002.0*98.098.096.0())1(96.0()96.0(ZPZPnPPPZPpP
本文标题:第5章抽样与抽样分布
链接地址:https://www.777doc.com/doc-8686824 .html