您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第六章抽样推断-复件
第六章抽样推断一家食品生产企业以生产袋装食品为主,每天的产量约为8000袋左右。按规定每袋的重量应不低于100克,否则即为不合格。为对产量质量进行检测,企业设有质量检查科专门负责质量检验,并经常向企业高层领导提交质检报告。质检的内容之一就是每袋重量是否符合要求。由于产品的数量大,进行全面的检验是不可能的,可行的办法是抽样,然后用样本数据估计平均每袋的重量。质检科从某天生产的一批食品中随机抽取了25袋,下表是对每袋食品重量的检验结果。(假定该种袋装食品重量服从正态分布。)案例导入根据以上数据,质检科估计出该天生产的食品每袋的平均重量在101.57~109.14克之间,其中,估计的可信程度为95%,估计误差不超过4克。产品的合格率在95.68%~64.32%之间,其中,估计的可信程度为95%,估计误差不超过15.68%。112.5102.6100.0116.6136.8101.0107.5123.595.4102.8103.095.0102.097.8101.5102.0108.8101.6108.498.4100.5115.6102.2105.093.3质检报告提交后,企业高层领导人提出几点意见:一是抽取的样本大小是否合适?能不能用一个更大的样本进行估计?二是能否将估计的误差在缩小一点?比如,估计平均重量时估计误差不超过3克,估计合格率时误差不超过10%。三是总体平均重量的方差是多少?因为方差的大小说明了生产过程的稳定性,过大或过小的方差都意味着应对生产过程进行调整。参数估计、假设检验在统计方法中的地位统计方法描述统计推断统计参数估计假设检验统计推断的过程样本总体样本统计量例如:样本均值、成数、方差第一节抽样调查•一、抽样调查的概念与作用•1.抽样调查的概念•抽样调查是一种科学的非全面调查,是按照随机原则从总体中抽取一部分单位组成样本进行调查,根据调查的样本数据推断总体的某一数量特征的统计方法。2.抽样调查的特点•抽样调查具有以下特点:•(1)遵循随机原则选择调查单位•(2)抽样调查节省人力、费用和时间,比较灵活•(3)抽样误差可以计算并且可以加以控制3.抽样调查的适用范围•(1)某些不可能进行全面调查又需要了解其全面情况的社会经济现象•(2)某些不必要进行全面调查又需要了解其全面情况的社会经济现象•(3)抽样调查可以用来检验和修正全面调查资料•(4)抽样调查可以用于工业生产过程中的质量控制•(5)利用抽样调查,可以对于假设进行检验二、抽样调查中的几个基本概念•1.全及总体和抽样总体•(1)全及总体•简称总体,是指所要认识对象的全体,全及总体的单位数通常用大写的英文字母“N”来表示。•(2)抽样总体•也称样本,是指从全及总体中随机抽取出来,代表全及总体部分单位的集合体,抽样总体的单位数通常用小写英文字母“n”表示。一般说来,n≥30称为大样本,n30称为小样本,n/N称为抽样比例,社会经济现象的抽样调查多取大样本。•全及总体是惟一确定的,抽样总体则是随机的•一个全及总体可能抽取很多个样本,全部样本的可能数目和每一样本的容量有关,也和随机抽样的方法有关,不同的样本容量和取样方法,样本的可能数目也有很大的差别。可能样本数目的计算公式考虑顺序不考虑顺序不重复抽样重复抽样!()!nNNANnnnNBN!!()!nNNCnNn(1)!!(1)!nnNNNnDDnN2.全及指标和抽样指标•(1)全及指标•反映总体数量特征的综合指标,称为全及指标、参数。•由于全及总体是惟一确定的,所以全及指标也是惟一确定的。•对于变量总体,由于各单位的标志可以用数值来表示,所以可以计算总体平均数,用表示;•对于属性总体,可以计算总体成数,用大写英文字母表示,变量总体也可以计算成数。•全及指标还有总体方差和总体标准差。XP2参数研究总体中的数量标志总体平均数总体方差X=∑XNX=∑XF∑FΣ(X-X)N2σ=2Σ(X-X)FΣF2σ=2研究总体中的品质标志总体成数成数方差σ2=P(1-P)P=N1N(只有两种表现)•(2)抽样指标•由抽样总体各个标志值或标志特征计算的综合指标称为抽样指标、统计量。•变量样本的抽样指标有抽样平均数、样本平均数方差和样本平均数标准差;•属性样本的抽样指标有抽样成数、样本成数方差和样本成数标准差。•抽样指标的数值不是惟一确定的,是随机变量。x2xsxsp2psps统计量研究数量标志样本平均数x=∑xnx=∑xf∑f样本标准差nxx212ffxxSx研究品质标志样本成数成数标准差np=nppSp112nxxSx3.重复抽样与不重复抽样•(1)重复抽样•重复抽样,又称有放回抽样,是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位经登录其有关标志表现后又放回总体中重新参加下一次的抽选。每次抽取均是在相同的条件下完全按照随机原则进行的。•(2)不重复抽样•不重复抽样又称无放回抽样,是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位登录其有关标志表现后不再放回总体中参加下一次的抽选,上一次的抽取结果会直接影响到下一次抽选。4.抽样框•全及总体也叫目标总体。目标总体规定了理论上的抽样范围。但实际进行抽样的总体范围与目标总体有时是不一致的。因而,在抽样前还必须明确实际进行抽样的总体范围和抽样单位。•抽样框又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。•好的抽样框的标准是:完整而不重复。•常见的抽样框如大学学生花名册、工商企业名录、街道派出所里居民户籍册、意向购房人信息册等。•在没有现成的名单的情况下,可由调查人员自己编制。•在利用现有的名单作为抽样框时,要先对该名录进行检查,避免有重复、遗漏的情况发生。以提高样本对总体的代表性。•例如:要从10000名职工中抽出200名组成一个样本,则10000名职工的名册,就是抽样框。•抽样框也可能存在一些误差,主要有:•(1)丢失目标总体单位,也被称为“涵盖不足”,或丢失目标单位。•对丢失的总体单位不能发现并纠正会造成调查中对总量的估计偏低。•(2)包含非目标单位,也被称为“过涵盖”,是指抽样框中包含了一些不属于研究对象的非目标总体单位。•由于抽样框中存在非目标总体单位,容易造成估计量的高估。•(3)丢失目标单位和包含非目标单位共存,是指在抽样框中既有丢失目标单位,也有包含非目标单位。•在实际调查中,丢失目标单位不易被查觉和发现,具有较大的隐蔽性,相比之下,包含非目标单位的抽样框误差的威胁性要小些。因为在调查过程中,非目标单位容易被发现,并予以剔除。•(4)复合连接,是指抽样框单元与目标总体单元不完全一一对应,而是存在一对多、多对一或是多对多模式的现象。•例如:若某银行想了解其客户的情况进行一次抽样调查,则该行所有客户构成目的总体。•选择的抽样框是银行的来往帐目,这就构成了多对一模式。若在这个框中进行抽样,则来往帐目多的客户被抽中的可能性则较大,反之来往帐目少的客户被抽中的可能性很小,而两种客户通常会有较大差异,从而造成样本的偏斜,使估计量产生偏差。•(5)抽样框老化,是指随着时间的推移,抽样总体与目标总体产生极大的偏差,即原来的抽样框不符合实际情况,必须进行更新。•最典型的例子,就是随着城市建设的大规模展开,许多地区已被改造,地址发生了变化,如果仍按以前的抽样框去抽样,那么精度就会难以控制。三、抽样调查的基本原理•1.大数定律•大数定律,又称为大数法则,是指在随机试验中,每次出现的结果可能不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。•在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会相互抵消,从而使现象的必然规律性显示出来。•例如,观察个别或少数家庭的婴儿出生情况,发现有的生男,有的生女,没有一定的规律性,但是通过大量的观察就会发现,男婴和女婴的比例会趋于107:100。切贝雪夫大数定理•设是一列两两相互独立的随机变量,服从同一分布,且具有相同的数学期望和方差,则对任意小的正数ε,有:1)1(lim1niinxnP2,,21xx•当n很大时,服从同一分布的随机变量的算术平均数将依概率接近于这些随机变量的数学期望。•随着样本容量n的增加,样本平均数将接近于总体平均数,从而为统计推断中依据样本平均数估计总体平均数提供了理论依据。,,21xxx•(1)现象的某种总体规律性,只有当具有这种现象的足够多的单位综合汇总在一起的时候,才能显现出来;•(2)现象的总体性规律或倾向通常以平均数(或比率)的形式表现出来;•(3)当所研究的现象总体包含的单位越多,平均数(或比率)也就越能正确反映出这些现象的规律性;•(4)各单位的共同倾向决定着平均数(或比率)的水平,而各单位对平均数(或比率)的离差则会由于足够多数单位的综合汇总的结果,而相互抵消,趋于消失。•根据大数定律的内容特点运用抽样调查时,必须注意以下两个问题:•(1)抽样必须遵循随机原则,这样样本指标才能成为随机变量,大数定律才能应用;•(2)抽样必须遵循大量原则,只有观察到足够多的单位,才能在综合后使个别单位表现出来的偶然性得以消除。2.中心极限定理•在一定条件下,大量独立随机变量的平均数以正态分布为极限。设随机变量相互独立;其数学期望值为;其标准差为;,,•满足下述条件:•••对任一实数,有,,21xx,,21xExE,,21niixE1)(nii1220lim133niiinxExEtdttniinetnxP21221limt•即:•只要在样本容量充分大的条件下,不论全及总体的变量分布是否属于正态分布,其抽样平均数也服从或近似服从正态分布,这就为抽样调查进行估计提供了重要的理论根据。•(1)如果总体服从正态分布,样本平均数也服从正态分布;•(2)如果总体很大,但不服从正态分布,只要样本足够大,样本的平均数也趋近于正态分布;•(3)样本平均数的数学期望等于总体均值。•意义:当我们的认识对象分布未知时,只要坚持随机抽取足够多的样本单位,就可以使样本统计量服从(或近似服从)正态分布,继而便可运用正态分布理论,根据样本信息来推断认识对象总体的数量特征。第二节抽样误差•一、抽样误差•1.抽样误差的概念•抽样指标与所要估计的全及指标之间的差值称为抽样误差。•抽样误差既是一种随机性误差,也是一种代表性误差。抽样误差中的代表性误差是抽样调查本身所固有的、无法避免的误差,但随机性误差则可利用大数定律精确地计算并能够通过抽样设计程序加以控制。2.影响抽样误差的因素•(1)样本容量•(2)总体各单位标志值的差异程度•(3)抽样方法•(4)抽样的组织形式二、抽样平均误差•1.样本平均数的抽样平均误差•(1)当抽样方法为重复抽样时,样本标志值是相互独立的,样本变量与总体变量同分布。其计算公式如下:••它说明在重复抽样的条件下,抽样平均误差与总体标准差成正比,与样本容量的平方根成反比。•在计算抽样平均数的抽样平均误差时,通常并不知道总体方差的数值,可用样本方差来代替总体方差。,,21xxxXnnx2=•(2)不重复抽样:••当总体单位数很大时,这个计算公式可近似表示如下:•)(=12NnNnx)(=Nnnx12•总是小于1,所以不重复抽样的抽样平均误差总是小于重复抽样的抽样平均误差。•当抽样比例很小时,即使是采用不重复抽样的方法来抽取调查单位,也可使用重复抽样的误差公式来计算抽样平均误差。)(Nn12.抽样成数的平均误差•总体成数可表现为总体是非标志的平均数,它的标准差为。•(1)在重复抽样下,其计算公式如下:•)-(PP1nPPP)-(1•当总体单位数很大时,这个公式可近似表示如下:••在计算抽样成数平均误差时,通常得不到总体方
本文标题:第六章抽样推断-复件
链接地址:https://www.777doc.com/doc-419887 .html