您好,欢迎访问三七文档
上课啦!第四章抽样推断学习目的与要求•抽样推断是统计研究中的一种重要分析方法。学习本章要求掌握能利用统计资料来推断总体数量特征的原理及方法,其具体要求:–理解抽样推断的概念及特点–深刻理解抽样误差产生的原因–对抽样误差、抽样平均误差、抽样极限误差加以区别,并会运公式进行计算–重点掌握简单随机抽样组织形式的区间估计方法–掌握必要样本单位数的确定方法第四章抽样推断(教学内容)•第一节抽样推断中几个基本概念•第二节抽样误差•第三节抽样估计的方法•第四节假设检验•第五节抽样的组织方式第一节抽样推断中几个基本概念第四章抽样推断第一节抽样推断中几个基本概念一、抽样推断的意义(一)抽样推断的概念抽样推断是按照随机原则,从全部研究总体中抽取一部分单位进行调查,并依据所获得的数据对总体的某一数量特征做出具有一定可靠程度的估计与推断的一种统计方法。抽样推断的全过程,就是抽样调查。一、抽样推断的意义(二)抽样推断的特点1、按随机的原则抽取样本。2、在数量上,以样本推断总体。3、抽样误差可以事先计算和控制。(三)抽样调查的作用1、对于产品或商品具有破坏性的质量检验不能进行全面调查。•例如灯泡、电视机使用寿命的检验,种子的发芽率检验,炮弹的射程测试等,不能为了鉴定质量而破坏所有的产品。这种情况下,也只能用抽样的方法。2、有时虽然能全面调查,但抽样调查仍有独到作用,它可以大大节省人力、物力,又可节省时间,提高调查的时效性,并且能取得比较详细的资料。因此,对那些资料要求紧迫,需以较短时间,迅速了解总体全面情况时,也可用抽样法。3、有些现象总体范围过大,单位分布又过于分散,很难或不必要进行全面调查。如,要检验水库的鱼苗数,森林的木材蓄积量。4、对全面调查资料进行修正,以提高全面调查质量。二、全及总体与抽样总体(一)全及总体全及总体:抽样调查所要认识对象的全体,也叫母体,简称总体,它是具有某种共同性质或特征的许多单位的集合体。全及总体的单位数通常用N来表示。样本总体全及总体的分类:1.按总体单位标志性质不同分:变量总体:能用数量描述总体各单位的数量特征的总体。抽样推断反映总体的数量特征的量。属性总体:只能用文字描述总体各单位性质特征的总体。抽样推断反映总体的属性特征的量。2.按总体单位的范围不同分:有限总体无限总体(二)抽样总体抽样总体又叫样本或子样,简称样本。它是从全及总体中随机抽取出来,代表全及总体的那部分单位的集合体。样本总体的单位数称为样本容量,通常用n表示,相对N来说,n是很小的数,它可以是N的几十分之一、几百分之一、几千分之一、几万分之一。(一般来说,样本单位数达到或超过30个称为大样本,而在30个以下称为小样本。社会经济现象的抽样调查多取大样本)二、全及总体与抽样总体三、全及指标和抽样指标(一)全及指标:根据全及总体各个单位的标志值或标志特征计算的,反映总体某种数量特征的综合指标称为全及指标。也叫总体指标或母体参数。由于全及总体是唯一确定的,所以根据全及总体计算的全及指标也是唯一确定的。(二)抽样指标:由样本总体各单位标志值或标志特征计算的,反映样本数量特征的综合指标,它是用来估计全及指标的。全及指标和样本指标的相关公式FXFXNXXFFXXNXX22)()(FFXXNXX2222)()(fxfxnxxffxxsnxxs22)()(ffxxsnxxs2222)()(变量总体总体平均数总体标准差总体方差全及指标样本指标全及指标和样本指标的相关公式属性总体总体成数总体成数标准差总体成数方差全及指标样本指标PXNNP1)1(PPP)1(2PPPpxnnp1)1(ppsp)1(2ppsp四、重复抽样与不重复抽样(一)重复抽样也称重置抽样、回置抽样。它是指从总体N个单位中随机抽取容量为n的样本时,每次从总体中抽取一个单位,把结果登记下来后,重新返回,再从全及总体中抽取下一个样本单位。在这种抽样方式中,同一单位可能有多次被重复抽取的机会。例如(二)不重复抽样也称不重置抽样、不回置抽样。它是指从总体N个单位中随机抽取容量为n的样本时,每次从总体中抽取一个单位,不再放回去,下一次则从剩下的总体单位中继续进行抽取,如此反复构成一个样本,就是说,每个总体单位只能被抽取一次,所以从总体中每抽取一次,总体就少一个单位,因此,先后抽出来的各个单位被抽中机会是不相等的。例如五、抽样框与样本数(一)抽样框又称抽样结构,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。(二)样本数又称样本可能数目,是指从总体N个单位中随机抽选n个单位构成样本,通常有多种抽选方法,每一种抽选方法都是从总体N个单位中随机抽选n个单位构成一种组合。一种组合就是一个样本,一种抽选方法有K种组合,就有K个样本,K就是样本可能数目。第二节抽样误差第四章抽样推断第二节抽样误差一、抽样误差的概念(一)什么是抽样误差抽样误差是指样本指标与总体指标之间的离差。具体地讲,就是样本平均数与总体平均数的离差(即),或样本成数与总体成数的离差(即)。XxPp(二)抽样误差的产生原因统计误差的种类统计误差调查误差代表性误差系统性误差随机性误差1.调查误差:即在调查过程中由于观察、测量、登记、计算上的差错所引起的误差,这类误差是所有统计调查都可能发生的。2.代表性误差:即样本各单位的结构不足以代表总体而引起的误差。这类误差只有在非全面调查中才可能发生。代表性误差按产生原因不同又分为两类。系统性误差:是由于违反抽样的随机原则,如有意地多选较好的单位或较坏的单位进行调查。这样做,所据以计算的抽样指标必然出现偏高或偏低现象,造成的误差。随机性误差:在遵守随机原则的条件下,由于被抽选的样本有各种各样,只要被抽中的样本其内部各单位被研究标志的构成比例与总体有所出入,而产生的偶然性代表性误差。二、影响抽样误差的因素1、样本单位数的多少2、总体被研究标志的变异程度3、抽样方法4、抽样的组织形式这么多影响因素啊怎样计算抽样平均误差啊三、抽样平均误差(一)什么是抽样平均误差是反映抽样误差一般水平的指标。它是所有样本平均数(或样本成数)的标准差。其理论计算公式为:样本可能数目2)(Xxx三、抽样平均误差(二)样本平均数的平均误差抽样调查实践中用来计算抽样平均误差的基本公式是根据定义公式推导出来的。数理统计证明,在重复抽样条件下,抽样平均误差与总体标准差成正比,与样本单位数的算术平方根成反比。即:nnxx2或样本平均数的平均误差计算案例现以4个工人的日产量为例来验证两个公式的计算结果是相同的。[例1]设4个工人的日产量分别为40、42、46、48件。则平均日产量与平均日产量的标准差如表4—1,则:怎样计算啊?序号样本变量()样本平均数()离差()离差平方12345678910111213141516404040424046404842404142424642484640464046424648484048424846484840414344414244454344464745454748-4-3-10-3-201-10230134169109401104901916合计--704-80xxXx2)(Xx如果从总体中随机抽出2个单位进行调查,则抽样平均误差:件)(44448464240NXX件)(1623.34)4448()4446()4442()4440()(22222NXXx(件)2361.221623.3nx抽样平均误差:(件)样本可能数目2361.21680)2Xxx不重复抽样条件下计算公式为:通过比较不重复抽样条件下和重复抽样条件下的公式可以看出,根号下相差我们把这个式子叫做修正因子。不难看出当N较大时,与的计算结果是十分接近。因此,当N较大时在不重复抽样条件计算抽样平均误差的公式可采用:)1(2NnNnx)1(NnN)1(NnN)1(Nn)1(2Nnnx根据上例资料计算:通过上例计算看出,不重复抽样的抽样误差小于重复抽样的抽样误差)(8257.1)1424(21623.3)1(22件NnNnx抽样误差就这样计算啊![例2]从某厂生产的10000只日光灯管中随机抽取100只进行检查,假如该产品平均使用寿命的标准差为100小时,试计算该厂日光灯管平均使用寿命的平均误差。解:在重复抽样条件下在不重复抽样条件下(小时)1100100nx99)100001001(100100)1(22Nnnx(二)抽样成数的平均误差如用表示抽样成数的抽样平均误差,其公式为:在重复抽样条件下在不重复抽样条件下以上所有的公式中,不论是抽样平均数的抽样平均误差,还是抽样成数的抽样平均误差,所用的标准差都是全及总体的标准差。但实际上,无论是在抽样之前,还是在抽样之后,全及总体的标准差都是未知的。所以,一般都用样本总体的相应指标来代替。nppp)1()1()1(Nnnpppp[例3]从某厂生产的10000件产品中,随机抽取1000件进行调查,测得有85件为不合格。试求产品合格率的抽样平均误差。解:根据条件可知,合格率P=91.5%1.在重复抽样条件下2.在不重复抽样条件下%877.0)1000010001(1000)915.01(915.0)1()1(Nnnppp(一)抽样极限误差的概念抽样极限误差是指样本指标和总体指标之间抽样误差的可能范围。由于总体指标是一个确定的数,而样本指标则是围绕着总体指标上下波动的量,它与总体指标可能产生正离差,也可能产生负离差,样本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围,我们将这种以绝对值形式表示的抽样误差可能范围称为抽样极限误差。四、抽样极限误差pPpxxXxXxXx抽样极限误差用符号表示为:样本平均数的抽样极限误差为:样本成数的抽样极限误差为:而抽样推断的目的是用样指标估计总体指标,对上列公进行整理可得估计总体指标的算式为:ppPpPxxxXxpppPp0抽样极限误差的计算公式基于概率估计的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量。与抽样平均误差的概率度t相关,其计方法为:xxtppt五、抽样估计的概率度、精度和可靠程度(一)抽样估计的概率度基于概率估计的要求,抽样极限误差通常需要以抽样平均误差为标准单位来衡量。把极限误差除以抽样平均误差得相对数t,它表示误差范围为抽样平均误差的若干倍,t是测量估计可靠程度的一个参数,称为抽样平均误差的概率度。xxxXxtpppPpt五、抽样估计的概率度、精度和可靠程度(二)抽样估计的精度抽样估计的精度就是估计误差的最大范围,即误差的最大值,可通过极限误差系数来反映,即抽样误差扫的相对程度,其计算公式为:抽样估计精度(A)的计算公试为:估计精度是根据研究对象的变异程度和分析任务的性质来确定的。显然,A越大,估计的精度要求越高,A越小,估计的精度要求越低。估计精度的确定要以实际需要为基本标准。比如,对航天元器件的估计误差,就要求控制在极小的范围内;而对一些小商品如纽扣的合格率估计,其估计误差就可以控制在较大的范围里,因为这种误差,对消费者、对厂商的负面影响都有限。pΔΔp'pxΔΔx'x'xxΔ-1A'PPΔ-1A五、抽样估计的概率度、精度和可靠程度(三)抽样估计的可靠程度抽样估计的可靠程度:就是估计的区间所包含总体参数真实值的可能性大小。又称置信度、或把握程度。具的地说,抽样置信区间是以一定的概率把握程度确定总体指标所在的区间。置信度是总体指标落在某个区间的概率把握程度。抽样估计的可靠程即概率用P表示,P是t函数。而P=F(t)表明概率分布是概率度t的函数。确定抽样估计的可靠程度,就是确定抽样平均数或抽样成数落
本文标题:第四章-抽样推断
链接地址:https://www.777doc.com/doc-7203739 .html