您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学原理第六章抽样调查
第六章抽样调查第一节抽样调查的意义一、抽样调查的概念一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。二、抽样调查的特点(一)抽样调查的目的是由部分来推断整体。(二)抽选部分单位时要遵循随机原则(三)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制。三、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。(一)实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;(二)虽可进行全面调查观察,但比较困难或并不必要;(五)对普查或全面调查统计资料的质量进行检查和修正;(四)在有些情况下,抽样调查的结果比全面调查要准确。(七)利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:(三)和全面调查相比较,抽样调查能节省人力、费用和时间,而且比较灵活(六)抽样调查方法可以用于工业生产过程中的质量控制。一、全及总体和抽样总体(一)全及总体,简称总体全及总体:所要认识对象的全体。总体单位数用N表示。全及总体按其单位标志性质不同分为:变量总体和属性总体。变量总体可以用数量标示加以计量。属性总体用文字描写属性特征。如:完好、非完好。第二节抽样调查的基本概念及理论依据一、全及总体和抽样总体(二)抽样总体,简称样本第二节抽样调查的基本概念及理论依据抽样总体:抽取出来调查观察的单位。抽样总体的单位数用n表示。n≥30大样本n30小样本二、全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。(一)全及指标212122...()()NXPXXXNNNXXNXXN全及平均数全及成数总体方差总体标准差(二)抽样指标抽样指标:抽样总体的那些指标。212122...()()NxpssxxxNnnxxNxxN抽样平均数抽样成数样本方差样本标准差(三)统计抽样过程(图6-1,p255)xXpP所谓,就是用抽样指标来推断全及指标。是用抽样平均数推断全及平均数,从而推断总体标志总量是用抽样成数推断全及成数,从而推断总推断一体二单位总量三、抽样方法和样本可能数目根据取样的方式不同,抽样方式分为:重复抽样和不重复抽样。根据对样本的要求不同,抽样方式分为:考虑顺序抽样和不考虑顺序抽样。抽样方法样本可能数目(p256-257,了解)1.如果是重复抽样:1(2)nnNNnDC考虑顺序的重复抽样:不虑顺序的重复抽样:样本种数种考5(1)()50312,500,000nnNBN例2.如果是不重复抽样:)!(!)())((nNNnNNNNAnN121⑴考虑顺序的不重复抽样:例)(种2002512544647484950550A⑵不考虑顺序的不重复抽样:)!(!!nNnNCnN例)(!种7601182123452002512545550550AC四、抽样调查的理论依据(p257-259,了解)(1)独立同分布大数定律(2)贝努大数定律1.大数定律2.中心极限定理(p256-257,了解)(1)独立同分布中心极限定理(2)德莫佛-拉普拉斯中心极限定理第三节抽样平均误差一、抽样误差的概念登记误差系统性误差统计误差代表性误差实际误差随机误差抽样平均误差在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。xXpP实际误差就是指样本指标和总体指标之间数量上的差别,即、。无法知道。抽样平均误差是指所用可能出现的样本指标的标准差。可以计算。二、影响抽样平均误差的因素(一)全及总体标志变异程度。——正比关系(二)抽样单位数目的多少。——反比关系(三)抽样的组织方式。三、抽样平均误差的意义1.在于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差等于0,则样本指标和总体指标一样大。2.说明样本指标和总体指标相差的一般范围。3.确定抽样单位数多少的计算依据。四、抽样平均误差的计算抽样平均误差实际上是样本指标的标准差。通常用μ表示。(一)抽样平均数的抽样平均误差2()KxKXx抽样平均误差全部可能的样本个数1.重复抽样条件下抽样平均数的抽样平均误差2nnx抽样平均误差2.不重复抽样条件下抽样平均数的抽样平均误差222211111nnnnxNnnNNnnNnNNN当很小时,接近于,与很接近。抽样平均误差四、抽样平均误差的计算(二)抽样成数的抽样平均误差(1)pppn抽样平均误差重复抽样条件下抽样成数的抽样平均误差不重复抽样条件下抽样成数的抽样平均误差(1)1ppnpnN抽样平均误差四、抽样平均误差的计算1.用过去调查所得的资料。3.用小规模调查资料。计算抽样平均误差时和p都是全及指标,一般未知,通常采取四种方法解决:2.用样本方差的资料代替总体方差。4.用估计的材料。(三)抽样平均误差计算实例(p270-271)21020304050X30()525()五户家庭三月份购买某商品的支出:元,元,元,元,元元现从五户中抽取二户作调查,如果为重复抽样考虑顺序=种排列组合如下:例101010-20400102015-15225103020-10100104025-52510503000201015-15225202020-10100203025-52520403000205035525301020-10100302025-52530303000x样本平均数xX误差2xX抽取样本x样本平均数xX误差2xX抽取样本30403552530504010100401025-52540203000403035525404040101004050451522550103000502035525503040101005040451522550505020400合计--2500接左:)()(10252500)()(2为样本配合总数元抽样平均误差nnXxx以上资料编成次数分配表如下:x样本数f(即次数分配)101-20152-15203-10254-530503545403104521550120合计25-xX2(xX)ff∴抽样误差是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。255410()X30()21C种元抽取样本样本平均数离差102015-15225103020-10100104025-52510503000203025-525204030002050355253040355253050401010040504515225合计--750xxX2xX)(66.810750)(元抽样平均误差n)X-x(2x上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:第四节全及指标的推断一、抽样推断要求抽样推断就是按照已经抽定的样本指标来估计总体指标,或其所在的区间范围。只要在样本代表性大,且对全及指标精确性要求不高的情况下,满足下列三个准则:无偏性一致性有效性就会得到合理的估计。抽样指标估计总体指标有三个要求:(p272)(一)点估计xXpP是由样本指标直接代替全及指标,不考虑任何抽样误差因素。即用直接代表,用直接代表。就100x1002p98%X1002P98%在全部产品中,抽取件进行仔细检查,得到平均重量克,合格率,我们直接推断全部产品的平均重量克,合格率。例二、抽样推断的方法1.直接换算法抽样平均数(成数)×总体单位数=总体标志总量1.如果采用点估计方法:上例1中:400×10000=400(万千克)如果用区间估计方法:上例1中该农场小麦总产量的范围为:t=2:(397.62~402.38)×10000=397.62~402.38(万千克)t=3:(396.43~403.57)×10000=396.43~403.57(万千克)2.上例2中,全部一级品数量的范围为:(92.82%~97.18%)×8000=7425.6~7774.4(件)2.修正分数法就是用抽样所得的调查结果同有关资料对比的系数来修正全面统计资料时采用的一种方法。某村6000农户,2005年年末统计养猪头数,从下往上报的是9000头,现抽10%(600户)的农户再复查一下,发现有漏报,也有重报。按600户,原来数字是890头,实际复查为935头,故总的来说,是少报。)(9455%)06.51(90006000%06.5%06.589045)(45890935头农户养猪头数,即:的系数来修正可用差错率头例1)(09.3226%)248.01(1.3218%248.003.41503.1万元年报工资总额正工资总额,则:根据这一系数,再来修差错率某市房地局,年报工资总额3218.1万元。现抽查14个单位:年报:415.03万元多报:0.44万元少报:1.47万元抵冲后1.47-0.44=1.03(万元)例2(二)区间估计根据样本指标和抽样误差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。1.区间估计的意义抽样极限误差又叫抽样误差范围,也称置信区间,是变动的抽样指标与确定的全及指标之间的离差的可能范围。2.抽样极限误差pxppxxpxxXxpPpXxPp()()xXpP即:全及平均数成数抽样平均数成数抽样误差范围的实际意义是要求被估计的全及指标或P落在抽样指标一定范围内,即落在Xxx或pp的范围内。当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);例3.可信程度抽样极限误差△=tμ,(t为概率度)可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。P(277)xxppF(t)xXxpPp()()t在概率的保证下:即:全及平均数成数抽样平均数成数)403.57(100003)99.73%(t(3))402.38(100002)95.45%(t千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克43.39619.1340062.39719.12400)2()(19.1)100001001(10012)1()1(22XxXNnnxx某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:~~例1pp380p100%95%400P(1P)95%(195%)1.09%n40095.45%Pp95%21.09%92.82%97.18%在概率的保证下,全及一级品率:某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:~例2第五节抽样方案设计搞好抽样设计必须掌握两个基本原则:(一)保证实现抽样随机性的原则(二)保证实现最大的抽样效果的原则在一定的误差和可靠性的要求下选择费用最少的样本设计。一、抽样方案设计的基本原则二、简单随机抽样(纯随
本文标题:统计学原理第六章抽样调查
链接地址:https://www.777doc.com/doc-7192497 .html