您好,欢迎访问三七文档
1第六章抽样推断本章内容第一节抽样推断的含义第二节抽样推断的基本概念第三节抽样平均误差第四节总体指标的推断第六节必要抽样单位数的确定2第一节抽样推断的含义1、概念:抽样推断是在抽样调查的基础上,按照随机原则从总体中抽取一部分单位进行调查,并用调查所得的指标数值来推断总体的指标数值一种统计方法。2、特点:①只抽取总体中一部分单位进行调查②抽取部分单位要遵循随机原则③用一部分单位的指标值去推断总体的指标值④抽样误差可以计算,并且可以控制返回本章首页3第二节抽样推断的基本概念一、全及总体和抽样总体二、全及指标和抽样指标三、样本容量和样本可能数目四、抽样方法五、抽样的组织设计返回本章首页4一、全及总体和抽样总体(一)全及总体⒈概念:总体,指所要认识的对象的全体。⒉全及总体的分类属性总体(是非总体)变量总体⒊总体单位数:N5(二)抽样总体简称样本,是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本单位数:n一、全及总体和抽样总体返回6二、全及指标和抽样指标(一)全及指标(参数):1、概念:根据全及总体各单位标志值计算的、反映总体某种特征的指标。2、种类:①变量总体的全及指标②属性总体的全及指标7变量总体的全及指标1NiiXXN总体方差总体标准差1MiiiiXFXF总体平均数或或或221()NiiXXNs=-=å221()MiiiiXXFFs=-=åå21()NiiXXNs=-=å21()MiiiiXXFFs=-=åå8属性总体的全及指标总体成数NNP1PNNNNNQ110NNNNN1001性的单位数目。:总体中不具有某种属的单位数目。:总体中具有某种属性其中:总体平均数总体标准差(1)PPPQs=-=9二、全及指标和抽样指标(二)抽样指标(统计量):1、概念:根据样本各单位标志值计算的、反映样本特征的指标。2、种类:①变量总体的抽样指标②属性总体的抽样指标10变量总体的抽样指标1niixxn抽样方差抽样标准差1miiiixfxf抽样平均数或或或221()niixxns=-=å221()miiiixxffs=-?=åå21()niixxns=-=å21()miiiixxffs=-?=åå11属性总体的抽样指标抽样成数nnp1pnnnnnq110返回本节首页nnnnn1001性的单位数目。:总体中不具有某种属的单位数目。:总体中具有某种属性其中:抽样平均数抽样标准差(1)pppqs=-=12三、样本容量和样本可能数目1、样本容量:指一个样本所包含的单位数,记作:n。:大样本。:小样本。30n30n2、样本可能数目:又称样本个数,是指从一个总体中可能抽取多少个样本。返回本节首页13四、抽样方法(考虑抽取先后顺序)返回本节首页1、不重复抽样:从N个单位中每次抽取1个,抽取后不放回,一直到抽够n个单位。2、重复抽样:从N个单位中每次抽取1个,抽取后将其登记下来,再放回,一直到抽够n个单位。()()()()!121!nNNANNNNnNn=---+=-样本数目样本数目nnNNBnnNBN=141、简单随机抽样:对总体不作任何处理,不进行任何分类,从总体的全部单位中随机抽取样本单位。2、类型抽样:先对总体各单位按照一定的标志分类,然后从每类中随机抽取。3、机械抽样:对研究的总体按一定的顺序排列,每隔一定的间隔抽取的一种方法。4、整群抽样:将总体划分为若干群,然后从总体中随机选取若干群,对中选的群的所有单位进行一一调查。5、多阶段抽样:抽样过程分成几个阶段第五节抽样组织设计返回本章首页15类型抽样举例假设某学校教师总数为500名,要求从中抽取50名教师进行调查。①先将这些教师分类,如:按职称分类,其中:助教100名,讲师250名,副教授100名,教授50名。②按照比例来抽取。即:助教中抽取10名,讲师中抽取25名,副教授中抽取10名,教授中抽取5名。这样一种方式就是类型抽样。返回16第三节抽样平均误差一、抽样平均误差的概念二、抽样平均误差的计算三、影响抽样平均误差的因素返回本章首页17一、抽样平均误差的概念抽样误差:样本指标与总体指标之间的离差。例如:、返回本节首页ixX-ipP-抽样平均误差:样本指标和总体指标的平均离差。表示为:px和()2ixxXm-=å样本可能数目18二、抽样平均误差的计算(一)抽样平均数的抽样平均误差1、重复抽样:2、不重复抽样:nxNnnNnNnx1122:总体标准差。n:样本单位数。N:总体单位数。注:(大样本时,可以用样本标准差来代替)19二、抽样平均误差的计算(二)抽样成数的抽样平均误差1、重复抽样:2、不重复抽样:P:总体成数。n:样本单位数。N:总体单位数。注:(大样本时,P可以用样本成数p来代替)nPPp)1()1()1(NnNnPPp返回本节首页201、样本单位数的多少。抽样单位数越多,抽样平均误差越小。2、总体各单位标志的变异程度。总体标志变异程度越大,抽样平均误差越大。3、抽样调查组织方式和抽样方法。三、影响抽样平均误差的因素返回本节首页21例1:某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%的样本进行测试,所得的资料如下:按照质量规定,灯泡使用寿命在1000小时以上为合格品。要求(1)计算样本灯泡的平均使用时间、标准差和平均使用时间的抽样平均误差;(2)计算样本灯泡的合格率和合格率的抽样平均误差。(包括重复抽样与不重复抽两种情形)使用时间(小时)抽样灯泡数(个)使用时间(小时)抽样灯泡数(个)900以下21050—110084900—95041100—115018950—1000111150—120071000—1050711200以上3合计20022(1)求灯泡平均使用时间、标准差和灯泡合格率(样本)253.63iififxx小时1057iiixfxf小时%5.91200183p23(2)求灯泡使用时间抽样平均误差:在重复抽样下:小时792.320063.53nx在不重复抽样下:小时754.311000020010000120063.5322NnNnxx24(2)计算灯泡的合格率和合格率的抽样平均误差。求灯泡合格率的抽样平均误差:在重复抽样下:%972.1200085.0915.01nppp在不重复抽样下:%952.111000020010000200085.0915.011NnNnppxp返回本节首页25第四节总体指标的推断一、抽样极限误差二、抽样极限误差的计算三、置信区间的确定返回本章首页26一、抽样极限误差思考:抽样调查中xX推断pP推断或?Xx?Pp或解决思路:在95%的把握下,将最大抽样误差限定在:xpD或ixipxXpP-=D-=D即:MaxMax和称为:抽样极限误差xp那么,对于任一次抽样结果,xpxXpP抽样误差27一、抽样极限误差xXxppP抽样平均数的抽样极限误差x(一)概念:在给定的概率保证程度下,总体指标和抽样指标之间误差的最大范围。具体的:抽样成数的抽样极限误差p置信度28若在置信度β下,抽样极限误差为Δ,则:1、抽样平均数的范围2、抽样成数的范围xxxXxpppPp(二)总体的估计区间这便是总体的估计区间,又称:置信区间。一、抽样极限误差29返回本节首页样本成数p=190/200=95%pPppppPp95%2%95%2%P-#+93%97%P#例1:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果在90%的把握度下确定抽样极限误差为2%,试估计产品合格率的范围。30二、抽样极限误差的计算(一)引论:思考:在置信度β(概率保证程度)下,有:xXxpPp或问:?x?p或31对某一大学男生群体进行模拟抽样(总体平均体重58千克);对每一种可能样本进行调查计算得:若允许的抽样极限误差与抽样平均误差相同时,推断总体的平均体重是,推断的可靠程度为0.6872。若允许的抽样极限误差是抽样平均误差的2倍时,推断总体的平均体重是,推断的可靠程度为0.9545。若允许的抽样极限误差是抽样平均误差的3倍时,推断总体的平均体重是,推断的可靠程度为0.9973。1xxm±(二)、与、的关系:xDppmx2xxm±3xxm±xxm32(二)、与、的关系:xpxp在统计学当中,常作如下处理:xxtppt即:抽样极限误差常表示成抽样平均误差的倍数t称为误差系数,或概率度。33(三)t=?(t与β的关系)①t越大,β越大)(tF②可以证明:是标准正态分布函数。)(tF查表:P338页34例2:已知和,①在β=0.8064时,②在β=0.9371时,③在95.45%的概率保证程度下,的变化范围?xp?x?pXxx3.1pp86.1xxxXx22x36步骤:1、计算抽样极限误差①计算抽样平均误差②求t(由,查表)③写出抽样极限误差2、估计总体指标的置信区间三、置信区间的确定xxtppt或xxxXxpppPp)(tFt某电扇厂对其生产的2000台电扇进行使用寿命检查,随机抽取100台(不重复抽样)检验,平均使用寿命4.5万小时,方差为950000小时2。要求:以95.45%的可靠性估计这批电扇平均使用寿命的可能范围。下一页小时置信区间:小时极限误差:小时平均误差:45190,4481019045000,19045000,190952952000100110095000012xxxxxxxtNnn从一批产品中随机抽取500件(允许重复)进行质量检查,发现不合格产品有35件。要求:以95%的可靠性估计该产品不合格率的区间。35/5007%10.0710.071.142%5001.961.142%2.24%7%2.24%,7%2.24%4.76%,9.24%pppppppntpp解答:样本不合格率平均误差:极限误差:置信区间:,返回39第六节必要抽样单位数的确定一、重复抽样的样本容量确定二、不重复抽样的样本容量确定返回本章首页确定原则:在保证抽样推断能达到预期的可靠程度和精确程度的要求下,确定一个恰当的制取样本单位的数目。40一、重复抽样的样本容量确定1、抽样平均数的样本容量2、抽样成数的样本容量返回xxxtnntt22222211ppppptnnpptt41二、不重复抽样的样本容量确定1、抽样平均数的样本容量2、抽样成数的样本容量返回2222221xxxnNtttnnNNtssms骣÷çD==-?÷ç÷ç桫D+pptNppNtnNnnppttppp111122242要对某地区某年已成熟的12000亩某种作物进行抽样调查(根据以往资料,平均每亩收获量的标准差为120千克),要求抽样推断的可靠程度达到95%,该种作物平均每亩收获量的抽样误差不超过12千克,求应抽取多少样本单位数?(分别试算两种抽取方法)N1200012xs==D=已知: ,120,t=1.96,重复抽样时1.96120==12=n=384.16385nnxxtt(亩)sm状D邹藁1n1n==1-12=1.961201-n=nNn12000xxtt372.4373(亩)ms骣骣鼢珑D鬃薮崔?鼢珑鼢珑桫桫不重复抽样时43从某市500个小型零售商店中随机抽取10%进行调查,获得月均营业额资料如下:已知样本
本文标题:第六章 抽样推断
链接地址:https://www.777doc.com/doc-6991864 .html