您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学第六章抽样与抽样分布
2019/8/20河北工程大学经济管理学院1河北工程大学经济管理学院主讲:岳志春yuezhichun@163.com统计学2019/8/20河北工程大学经济管理学院2第六章抽样与抽样分布本章内容:抽样与抽样分布是推断统计学中的最基本内容。学习本章了解抽样的概率抽样方法;理解抽样分布的概念和形式;掌握样本平均数、样本比例的抽样分布;了解抽样组织方式及其抽样分布。重点是样本平均数、样本比例的抽样分布。2019/8/20河北工程大学经济管理学院3第六章抽样与抽样分布本章分三节:第一节抽样的基本概念第二节抽样分布第三节抽样组织方式及其抽样分布2019/8/20河北工程大学经济管理学院4第一节抽样的基本概念本节需要把握四个问题:一、总体与样本;二、抽样方法;三、抽样框;四、抽样误差。2019/8/20河北工程大学经济管理学院5一、总体与样本把握两个问题:1、总体和总体参数;2、样本和样本统计量。2019/8/20河北工程大学经济管理学院61、总体与总体参数(1)总体:指根据研究目的确定的所要研究的同类事物的全体,是所要说明其数量特征的研究对象。按所研究标志性质不同,分为变量总体和属性总体,分别研究总体的数量特征和品质特征。构成总体的个别事物(基本单元)就是总体单位,也称个体。总体单位的总数称为总体容量,记作N。2019/8/20河北工程大学经济管理学院71、总体与总体参数(2)总体参数:指抽样估计中用来反映总体数量特征的指标。研究目的确定后,总体确定,总体参数存在但未知,需要估计。A、变量总体中各单位可以直接用数量表示,设各单位变量值为:X1,X2,…XN,则总体参数有均值,标准差或方差以及总体标志总量,即我们研究变量X值的全体,X的取值有一定分布,为一个随机变量。XNFFXXXXNFXFNXXNiiNii,)(1),(221221或或2019/8/20河北工程大学经济管理学院8(2)总体参数:B、对于属性总体,各单位不能用数值来表示,但可以计算总体成数,如前面所学P=N1/N,Q=N0/N,P+Q=1,则总体参数有均值,标准差或方差以及具有某一属性的单位总数,即:1、总体与总体参数PX__NPPP,)1(2019/8/20河北工程大学经济管理学院92、样本和样本统计量(1)样本:是从总体中抽出的部分单位的集合,样本所包含的总体单位个数称为样本容量,一般用n表示。把n≥30的样本称为大样本,n﹤30的样本称为小样本。对于既定总体,由于抽取样本的方式方法不同,样本容量可大可小,样本不确定。样本的内部构成与总体内部构成总有一定差异,即样本不能完全代表总体,用样本估计总体总存在代表性误差。样本个数:又称样本可能数目,它是指从一个总体中可能抽取多少个样本。样本个数的多少与抽样方法有关。2019/8/20河北工程大学经济管理学院102、样本和样本统计量(2)样本统计量:又称样本指标或估计量,它是根据样本资料计算的、用以估计和推断相应总体参数的综合指标,常用的有:)1(),1(11)(1221221ppsnnpxssffxxxxnsfxfnxxniinii,或或2019/8/20河北工程大学经济管理学院11二、抽样方法把握以下问题:1、概率抽样与非概率抽样;2、重复抽样与不重复抽样。2019/8/20河北工程大学经济管理学院12(1)概率抽样:又称随机抽样,指按随机原则抽取样本。随机原则:就是排除主观意愿的干扰,使总体的每一个单位都有一定的概率被抽选为样本单位,每个单位能否入样是随机的。概率抽样的基本组织方式有:简单随机抽样、分层抽样、等距抽样和整群抽样。1、概率抽样与非概率抽样2019/8/20河北工程大学经济管理学院131、概率抽样与非概率抽样(2)概率抽样的特点:A、避免主观选样带来的倾向性误差(系统偏差),使样本资料能够估计、推断总体的数量特征;B、因为抽样建立在概率和数理统计基础上,可以计算和控制抽样误差,能说明估计结果的可靠程度。实际中,在不可能或不必要全面调查时,常用概率抽样推断总体,还可以修正或补充全面调查的结果。2019/8/20河北工程大学经济管理学院141、概率抽样与非概率抽样(3)非概率抽样:又称非随机抽样,指从研究目的出发,根据研究者的经验或判断,从总体中有意识抽取若干个单位构成样本。有重点调查、典型调查、配额抽样、方便抽样等。配额抽样:指抽选一群特定数目的满足特定条件的被调查者的抽样方法,这群被调查者已知对此研究主题有用,配额通常是年龄、收入、职业等,使用配额抽样有助于降低非概率抽样方法的偏差。2019/8/20河北工程大学经济管理学院151、概率抽样与非概率抽样(4)非概率抽样:适用于:了解总体大致情况,总结经验教训,进行大规模调查前的试点等,有其优越性。缺点:受主观影响易产生倾向性误差;不能计算、控制误差,无法说明调查结果的可靠程度。抽样一般都是指概率抽样。2019/8/20河北工程大学经济管理学院162、重复抽样和非重复抽样(1)重复抽样:又称重置抽样,是指从总体中抽出一个样本单位,记录其标志值后,又将其放回总体中继续参加下一轮单位的抽取。特点是:第一,n个单位的样本是由n次试验的结果构成的。第二,每次试验是独立的,即其试验的结果与前次、后次的结果无关。第三,每次试验是在相同条件下进行的,每个单位在多次试验中选中的机会(概率)是相同的。在重复试验中,样本可能的个数是,N为总体单位数,n为样本容量。nN2019/8/20河北工程大学经济管理学院172、重复抽样和非重复抽样(2)非重复抽样:又称为不重置抽样,即每次从总体抽取一个单位,登记后不放回原总体,不参加下一轮抽样。下一次继续从总体中余下的单位抽取样本。特点是:第一,n个单位的样本由n次试验结果构成,但由于每次抽出不重复,所以实质上相当于从总体中同时抽取n个样本单位。第二,每次试验结果不是独立的,上次中选情况影响下次抽选结果。第三,每个单位在多次(轮)试验中中选的机会是不等的。不重复抽样,如果是考虑顺序,其样本可能个数为;如果不考虑顺序,其样本可能个数为。)!(!nNN!)!(!nnNN2019/8/20河北工程大学经济管理学院18三、抽样框把握以下问题:1、概念;2、抽样框的形式;3、对抽样框的要求。2019/8/20河北工程大学经济管理学院191、概念抽样框:指包括全部抽样单位的名单框架。调查目的确定后,总体随之确定,总体又叫目标总体,即理论上的抽样范围,与实际抽样的总体范围有时不一致。此外抽样单位可以是个总体单位,也可以是若干总体单位的集合。如某省进行农户收支调查,目标总体是全省所有农户,抽样单位可以是每个农户,也可以是每个乡或村。所以,有目标总体后还必须明确实际进行抽样的总体范围和抽样单位。2019/8/20河北工程大学经济管理学院202、抽样框的形式(1)名单抽样框:列出全部总体单位的名录一览表,如职工名单、企业名单等。(2)区域抽样框:按地理位置将总体范围划分为若干小区域,以小区域为抽样单位。如某市居民住房调查,将全市居民户划分为若干街道或片区。(3)时间表抽样框:将总体全部单位按时间顺序排列,把总体的时间过程分为若干小的时间单位,以时间单位作为抽样单位。如对流水线上24小时内生产的产品进行质量抽检。2019/8/20河北工程大学经济管理学院213、对抽样框的要求(1)应与目标总体一致,即包括全部总体单位,不重不漏,否则破坏随机原则。例如,对某市居民进行抽查,以电话号码本为抽样框不科学。(2)尽可能利用与所研究变量高度相关的辅助变量的信息,设计最佳的抽样组织方式和抽样估计方法。2019/8/20河北工程大学经济管理学院22四、抽样误差把握以下问题:1、调查误差概念及其分类;2、实际抽样误差;3、抽样平均误差;4、抽样极限误差。2019/8/20河北工程大学经济管理学院231、调查误差概念及其分类(1)统计调查的误差:指调查结果与总体真值间的差异。(2)分为登记性误差和代表性误差:A、登记性误差:指在调查和汇总过程中由于观察、测量、登记、计算等方面的差错或被调查者提供虚假资料造成的误差。它是任何一种统计调查都可能产生的,可以避免。2019/8/20河北工程大学经济管理学院241、调查误差概念及其分类(2)分为登记性误差和代表性误差:B、代表性误差:指用样本指标推断总体指标时,由于样本结构与总体结构的不一致,样本不能完全代表总体而产生的误差。代表性误差又分为系统误差和随机误差:a、系统误差又称偏差,指非随机因素引起的样本代表性不足产生的误差,可以避免;b、随机误差,又称偶然性误差、抽样误差,随机因素引起的代表性误差,不可避免,但可以计算并加以控制。2019/8/20河北工程大学经济管理学院252、实际抽样误差(1)实际抽样误差指某一具体样本的样本估计值与总体参数的真实值之间的离差。实际中,总体参数未知,误差无法计算。平均数的误差:成数的误差:p-P)(____Xx2019/8/20河北工程大学经济管理学院262、实际抽样误差(2)由于样本随机抽取,估计量是随样本不同而不同的随机变量,所以实际抽样误差是随机变量,可正可负,可大可小。就某个既定的抽样方案,样本估计量所有可能值有一定的分布规律,它们与总体参数的离差即抽样误差也有一定的规律。实际中真正计算、控制的误差并不是该误差。2019/8/20河北工程大学经济管理学院273、抽样平均误差(1)它是反映抽样误差一般水平的指标。常用样本估计量的标准差反映所有可能样本估计量与其中心的平均离散程度,即抽样平均数或抽样成数的标准差,公式为:则抽样平均数、抽样成数的标准差分别为:可能样本个数2))(()(E可能样本个数2___))(()(xExx可能样本个数2))(()(pEpp2019/8/20河北工程大学经济管理学院283、抽样平均误差(2)又因为,则上式变为反映所有可能样本的估计值与总体参数的平均差异程度,即抽样平均误差,可以衡量样本对总体的代表性大小,它越小则统计量的分布就越集中在总体参数的附近。抽样平均数、抽样成数的标准差变为:另一个概念是抽样方差为抽样平均误差的平方。)(E)1.5())()(2可能样本个数可能样本个数2____)()(Xxx可能样本个数2)()(Ppp)(V2019/8/20河北工程大学经济管理学院294、抽样极限误差(1)它是指一定概率下样本指标与总体参数间抽样误差的可能范围,又称允许误差。因为总体参数确定,统计量围绕其左右变动,用统计量与总体参数之差的绝对值表示误差的可能范围。公式表示:在一定概率下:平均数、比例的抽样极限误差,在一定概率下,______xXxpPp2019/8/20河北工程大学经济管理学院304、抽样极限误差(2)抽样极限误差是抽样误差的可能范围而非完全肯定范围,可能范围大小与这一估计的可能性大小即概率紧密联系,这个概率被称为置信度或可信程度、把握程度、概率保证程度等,表示为,其他条件不变的情况下,抽样极限误差越大,置信度越大。12019/8/20河北工程大学经济管理学院314、抽样极限误差(3)相关概念:抽样误差率=(抽样极限误差/估计量)×100%,抽样估计精度=100%-抽样误差率估计精度与置信度矛盾。其他条件不变下,提高估计置信度,增大允许误差,使精度降低;反之,提高精度会降低置信度。实际中根据具体情况,可先确定置信度再求极限误差或先确定极限误差再求相应的把握程度。2019/8/20河北工程大学经济管理学院32第二节抽样分布本节只讨论重复的简单随机抽样,所得容量为n的样本(x1,x2…xn)称为简单随机样本,它满足两个条件:x1,x2…xn相互独立;每个xi(i=1,2,…,n)都与总体X同分布。把握以下问题:
本文标题:统计学第六章抽样与抽样分布
链接地址:https://www.777doc.com/doc-420128 .html