您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第六章 抽样调查(梁应)
第六章抽样调查第一节抽样调查的意义一、抽样调查的概念一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。二、抽样调查的特点(一)只抽取总体中的一部分单位进行调查(二)用一部分单位的指标数值去推断总体的指标数值(三)抽选部分单位时要遵循随机原则(四)抽样调查会产生抽样误差,抽样误差可以计算,并且可以加以控制三、抽样调查的适用范围抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。1.实际工作不可能进行全面调查观察,而又需要了解其全面资料的事物;2.虽可进行全面调查观察,但比较困难或并不必要;3.对普查或全面调查统计资料的质量进行检查和修正;4.抽样方法适用于对大量现象的观察,即组成事物总体的单位数量较多的情况;5.利用抽样推断的方法,可以对于某种总体的假设进行检验,判断这种假设的真伪,以决定取舍。一般适用于以下范围:第二节抽样调查的基本概念及理论依据一、全及总体和抽样总体(总体和样本)全及总体:所要调查观察的全部事物。总体单位数用N表示。抽样总体:抽取出来调查观察的单位。抽样总体的单位数用n表示。n≥30大样本n30小样本二、全及指标和抽样指标(总体指标和样本指标)全及指标:全及总体的那些指标。抽样指标:抽样总体的那些指标。xXpP所谓,就是用抽样指标来推断全及指标。是用抽样平均数推断全及平均数,从而推断总体标志总量是用抽样成数推断全及成数,从而推断总推断一体二单位总量22ss在抽样调查中应用的总体指标和样本指标还有:方差:总体方差、样本方差标准差:总体标准差、样本标准差抽样框——即总体单位的名单,是指对可以选择作为样本的总体单位列出名册或顺序编号,以确定总体的抽样范围和结构。样本个数——指从总体中可能抽取的样本的数量。样本容量——指一个样本所包括的单位数。三、抽样方法和样本可能数目根据取样的方式不同,有重复抽样和不重复抽样不重复抽样:又称不放回抽样。111500049994998LL,,,例以上每一种组织方式又有不同的抽取样本方法(机械抽样和整群抽样没有重复抽样):重复抽样:又称有放回抽样。不重复抽样:又称不放回抽样。111500050005000LL,,,例111500049994998LL,,,例1.如果是重复抽样:1(2)nnNNnDC考虑顺序的重复抽样:不虑顺序的重复抽样:样本种数种考5(1)()50312,500,000nnNBN例根据对样本的要求不同,抽样方法又有考虑顺序抽样和不考虑顺序抽样两种。2.如果是不重复抽样:550!(1)(1)(1)()!5049484746254,251,200()nNNANNNnNnAL虑顺序的不重复抽样:种考例555050!(2)!()!254,251,2002,118,760()5!54321nNNCnNnAC考虑顺序的不重复抽样:种不例四、抽样调查的理论依据1、大数定律2、中心极限定律第三节抽样平均误差一、抽样误差的概念及其影响程度在统计调查中,调查资料与实际情况不一致,两者的偏离称为统计误差。登记误差系统性误差统计误差代表性误差实际误差随机误差抽样平均误差抽样误差即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。xXpP抽样误差就是指样本指标和总体指标之间数量上的差别,即、。二、抽样误差的影响因素:1.全及总体标志变异程度。——正比关系2.抽样单位数目的多少。——反比关系3.不同的抽样方式。4.不同的抽样组织形式。抽样误差的作用:1.在于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差等于0,则样本指标和总体指标一样大。2.说明样本指标和总体指标相差的一般范围。三、抽样平均误差抽样平均误差实际上是样本指标的标准差。通常用μ表示。在N中抽出n样本,从排列组合中可以有各种各样的样本组:21020304050X30()525()五户家庭三月份购买某商品的支出:元,元,元,元,元元现从五户中抽取二户作调查,如果为重复抽样考虑顺序=种排列组合如下:例四、抽样平均误差的计算101010-20400102015-15225103020-10100104025-52510503000201015-15225202020-10100203025-52520403000205035525301020-10100302025-52530303000x样本平均数xX误差2xX抽取样本x样本平均数xX误差2xX抽取样本30403552530504010100401025-52540203000403035525404040101004050451522550103000502035525503040101005040451522550505020400合计--2500接左:)()(10252500)()(2为样本配合总数元抽样平均误差nnXxx以上资料编成次数分配表如下:x样本数f(即次数分配)101-20152-15203-10254-530503545403104521550120合计25-xX2(xX)ff∴抽样误差是所有可能出现的样本指标的标准差。它是由于抽样的随机性而产生的样本指标与总体指标之间的平均离差。255410()X30()21CQ种元抽取样本样本平均数离差102015-15225103020-10100104025-52510503000203025-525204030002050355253040355253050401010040504515225合计--750xxX2xX)(66.810750)(元抽样平均误差n)X-x(2x上例五户中抽取二户调查,如采取不考虑顺序的不重复抽样方法,则:五、纯随机抽样的抽样平均误差(一)平均数的抽样平均误差或xx2nn1.重复抽样取得σ的途径有:1.用过去全面调查或抽样调查的资料,若同时有n个σ的资料,应选用数值较大的那个;2.用样本标准差S代替全及标准差σ;3.在大规模调查前,先搞个小规模的试验性的调查来确定S,代替σ;4.用估计的方法。x2202()100小时某灯泡厂从一天所生产的产品10,000个中抽取100个检查其寿命,得平均寿命为2000小时(一般为重复抽样),根据以往资料:σ=20小时,根据以往资料,产品质量不太稳定,若σ=200小时,)(20小时于是:例2.不重复抽样:2xNnnN12xNnn(1)nN但实际中,往往很大,很小,故改用下列公式:x400100(1)1.99()10010000上例中,若为不重复抽样,则:小时(二)成数的抽样平均误差已证明得:成数的方差为p(1-p)ppp(1p)np(1p)n(1)nN在重复抽样情况下:在不重复抽样情况下:%1374.1)150001501(150)98.01(98.0)1()1(%14.1150)98.01(98.0)1(%9815014715015000NnnppnpppnNpp若按不重复抽样方式:某玻璃器皿厂某日生产15000只印花玻璃杯,现按重复抽样方式从中抽取150只进行质量检验,结果有147只合格,其余3只为不合格品,试求这批印花玻璃杯合格率(成数)的抽样平均误差。例例:估计某乡粮食亩产量,从5000亩中随机抽取100亩,计算得出样本平均亩产量为450公斤,方差780公斤,则粮食平均亩产量的平均抽样误差是多少?重复抽样不重复抽样2.8公斤2.77公斤例估计对某项措施的支持率,对职工进行5%的随机抽样,调查60名员工,有45人表示支持,则支持率的平均抽样误差是多少?重复抽样:不重复抽样:5.59%5.45%六、类型抽样的抽样平均误差在重复抽样情况下:为各组的总体单位数为全及总体单位数,即为分类数目平均组内方差2ix2ii2ikii1inNNNNNNk()2ixn(1)nN在不重复抽样情况下:重复抽样在成数情况下::pp(1p)n不重复抽样:pp(1p)n(1)nN某农场种小麦12000公顷,其中平原3600公顷,丘陵6000公顷,山地2400公顷,现用类型抽样法调查1200公顷,以各种麦田占全农场面积的比重分配抽样面积数量。麦田类型抽样的平均误差计算表类型全场播种面积(公顷)抽样调查面积(公顷)单位面积产量不均匀程度指标(千克)符号Niniσi丘陵地区6000600750337500000平原地区3600360840254016000山地24002401000240000000合计120001200-831516000iin2例22222iiiiiiiixn831516000692930()n1200NNn(1)nN6929301200(1)519.697522.8()120012000千克或千克iiiipp(1p)n186P(1P)15.5%n1200p(1p)n0.1551200(1)(1)1.078%nN120012000高产麦田比重的平均误差计算表类别高产田比重(%)非高产田比重(%)麦田不均匀程度指标(%)抽样调查面积(公顷)pi(1-pi)ni符号pi1-pipi(1-pi)ni丘陵80201660096.0平原9010936032.4山地60402424057.6合计---1200186七、机械抽样(等距抽样)的抽样平均误差1.若按无关标志排队公式用以上纯随机抽样的公式,一般采用不重复抽样公式:xp2n(1)nNp(1p)n(1)nN为简便起见,也可采用重复抽样公式。2.若按有关标志排队2xpnp(1p)n公式用类型抽样的公式:八、整群抽样的抽样平均误差整群抽样的抽样平均误差受三个因素影响:(1)抽出的群数(r)多少(反比关系)(2)群间方差()(正比关系)2计算方法如下:为全及总体各群的平均数为全及平均数或:为抽样各群的平均数为抽样各群的总平均数为全及总体各群的成数为全及总体的成数22x22x22p2priii1riii1riii1(xx)xrx(xx)rxrx(pp)prp或:为抽样各群的成数为抽样各群的总成数2riii1(pp)rprp(3)抽样方法2x2pxpRrrR(1)R1Rr(1)rRr(1)rR整群抽样都采用不重复抽样。所以在计算抽样误差时要使用修正系数,当的数目较大时,可用来代替。整群抽样的抽样平均误差计算公式为:假如某一机器大量生产某一种零件,现每隔一小时抽取5分钟产品进行检验,用以检查产品的合格率,检查结果如下:ipp2i(pp)r合格率群数rpipir80%20.801.6-0.09960.0198485%40.853.4-0.04960.0098490%120.9010.80.0004…(太小不计)95%30.952.850.05040.0076298%30.982.940.08040.01939合计24-21.59-0.0566922p2prii1ppr21.590.8996r24(pp)r0.056690.002362r24r0.00236224(1)(1)0.0095(0.95%)rR24288p样本群平均合格率群间方差或例以上抽样平均误差的公式归纳如下:2px2222x2pnnp1-pn(1)1N(2)p1-pp1-p(3)p1-p
本文标题:第六章 抽样调查(梁应)
链接地址:https://www.777doc.com/doc-419876 .html