您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第6章抽样推断88821373
2019/8/201第6章抽样推断抽样推断的基本概念抽样误差抽样推断的方法抽样的组织形式2019/8/2026.1抽样推断的基本概念抽样推断,从其内涵来说,包括抽样调查和抽样推断两部分,前者着重调查,后者着重推断。抽样推断是在抽样调查的基础上利用样本的实际资料计算出的样本数据,并运用概率估计方法,推算总体相应的数量指标的一种统计分析方法。2019/8/203抽样推断具有如下几个特点抽样推断是由部分推算整体的一种认识方法。抽样推断是建立在随机取样的基础上。抽样推断是运用概率估计的方法,利用样本指标来估计总体参数。抽样推断的误差是可以事先控制的,用样本指标值推断总体指标值是存在一定误差的。2019/8/204抽样推断的作用应用于某些不可能作全面调查或很难作全面调查的场合。在可以使用全面调查的场合,抽样调查仍有其独特的作用。用于假设检验。2019/8/2056.1.1总体和样本1.总体(population)也称全及总体,是指所研究现象的整体,即包括所要调查的所有单位。例如,从1000名学生中,抽取50名学生进行抽样调查,以计算学生的平均体重。这1000名学生是全及总体,一般用英文大写字母N来表示总体的单位数,取N=1000人。全及总体按其各单位性质的不同,可以分为变量总体和属性总体两类。对于一个总体来说,若被研究的单位标志属于品质标志,则该总体为属性总体,若被研究的单位标志属于数量标志,则该总体为变量总体。2019/8/2062.样本(sample)又称子样,它是从全及总体中随机抽取出来,作为代表这一总体的那部分单位组成的集合体。样本的单位数是有限的,相对来说,它的数目比较小,一般用英文小写字字母n来表示样本的单位数。如上例n=50人。作为推断对象的总体是确定的,而且是唯一的。但作为观察对象的样本就不是这样。从一个总体可以抽取很多个样本,每次可能抽到哪个样本不是确定的。也不是唯一的,而是可变的。2019/8/2076.1.2参数和统计量1.参数(parameter)。根据总体各单位的标志值或标志属性计算的,反映总体数量特征的综合指标称为全及指标。全及指标是总体变量的函数,其数值是由总体各单位的标志值决定的。由于总体是唯一确定的,因此,全及指标也是唯一确定的,所以也称参数。常用的参数有总体平均数,总体成数、总体方差和总体标准差。2019/8/208(1)总体平均数Populationmean对于变量总体,由于各单位的标志可以用数量表示,因此可以计算总体平均数,通常用表示。X设X为总体的某一变量,其N项变量值为X1、X2、…Xn,则总体平均数为:NXNXXXXn212019/8/209(2)总体成数Proportion对于属性总体,由于各单位标志不能用数量表示,因此总体参数常以成数或比重来表示。通常以P表示总体中具有某种标志表现即“是”的单位数在总体单位数中所占的比重;以Q表示不具有某种标志表现即“非”的单位数所占的比重。设总体N个单位中,有N1个单位具有某种标志表现,N0个单位不具有某种标志表现,且N=N1+N0,则总体成数为:NPN1PNNNQNN1102019/8/2010【实例6.1】红光灯泡厂生产的10000只灯泡中,有9550只是合格品,有450只是不合格产品,则总体成数即灯泡的合格率和不合格率分别为:%5.951000095501NPN%5.4100004500NQN需要指出,统计上把只表现为“是”与“非”的标志称为是非标志,也称交替标志,如性别标志等。2019/8/2011(3)总体方差和总体标准差Variance&standarddeviation就变量总体而言,其总体方差和标准差计算公式分别为:NXX22NXX2在属性总体条件下,则可以把“是”与“非”两种标志表现进行量化处理,用“1”表示“是”,即具有某种标志表现,用“0”表示“非”,即不具有某种标志表现,那么“是”的成数就可视为是非标志的平均数,从而计算出属性总体的方差和标准差,即=(1-P)2P+(0-P)2Q=Q2P+P2Q=PQ(P+Q)=PQ=P(1-P)2P)1(PPp2019/8/20122.统计量(statistic)。根据样本各单位标志值计算的反映样本特征的指标称为统计量,也称作样本指标samplestatistic。它是用来估计总体参数的。与总体参数相对应,统计量主要有样本平均数表示样本内各单位某一标志值的一般水平X样本方差,反映样本中各单位标志值的离散程度,从而可说明样本平均数的代表性大小,记作S2,称S为样本标准差或均方差样本成数,指具有某种性质的单位在样本中所占比重(如抽样产品的合格率),记作p;样本成数的方差是p(1-p)2019/8/2013(1)样本平均数Samplemeannxnxxxxn21(2)样本成数npn1pnnnqnn110(3)样本方差和样本标准差Samplevariancexxsn221nSxx22019/8/2014样本是非标志的方差S2和标准差S的计算公式分别为)1(2PPsP)1(PPsp2019/8/20156.1.3样本容量和样本个数是两个有联系但又完全不同的概念。样本容量是指一个样本所包含位数样本个数又称样本可能数目。是指从一个总体上可能抽取的样本个数。2019/8/20166.1.4重复抽样和不重复抽样重复抽样又叫重置samplingwithreplacement抽样,也叫做有放回的抽样或重置抽样不重复抽样又叫不重置samplingwithoutreplacement也叫做无放回抽样或非重置抽样样本可能数目nNM样本可能数目!!nNNM2019/8/20176.2抽样误差6.2.1抽样误差的概念抽样误差(samplingerror)是指由于随机抽样的偶然因素使各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差。Samplingerroristhedifferencebetweenasamplestatisticanditscorrespondingpopulationparameterandisduepurelytochance.是一种由于随机抽样引起的偶然的代表性误差,或随机误差randomerror\chanceerror。抽样误差不可消除,但可以计算和控制。2019/8/2018抽样调查中误差有以下两个来源一个是登记性误差。也叫调查误差datarecordingerror,是指在调查登记过程中发生的误差,这类误差是可以避免的。二是代表性误差representativeerror,在抽样调查中,是指由于用抽样指标去代替总体指标时所产生的误差。代表性误差的发生的两种情况:第一,非随机的代表性误差;第二,随机性误差。2019/8/2019DubiousSampling:TheLiteraryDigestCase•Aclassiccaseofbothselectionbiasandnonresponsebiasoccurredin1936.TheLiteraryDigestmagazine,whichhadcorrectlypredictedthewinnerineveryU.S.presidentialelectionsince1916,predictedconfidentlyacomfortablevictoryforAlfredM.Landon,theRepublicancandidate,overFranklinD.Roosevelt,theDemocraticcandidate,byamarginof57to43.YetRooseveltwonbyalandslideneverbeforeseeninU.S.history,receiving62percentofthevotescast.Whathadgonewrong?2019/8/2020•First,therewasselectionbias.TheDigestmailedquestionnairesto10millionpeoplewhosenameshadbeentakenfromvariouslistssuchasitsownsubscribers,telephonedirectories,andautomobile-registrationrolls.DuringtheGreatDepression,higher-incomepeopletypicallyvotedRepublican,andthesepeoplewerewellrepresentedintheDigest’ssample.Ontheotherhand,lower-incomepeople,whoheavilyfavoredtheDemocrats,wereunderrepresentedbecausealowerpercentagecouldaffordmagazinesubscriptions,telephones,andautomobiles.2019/8/2021•Second,therewasnonresponsebias.Only2.4millionofthel0millionquestionnairesweremailedback.Althoughthismadethesurveythelargestsampleevertaken,moreeducatedpeoplearemorelikelytorespondtomailquestionnairesthanlesseducatedones.Theformer,again,tendedtofavorRepublicans;thelatter,theDemocrats.Thus,amuchlargerpercentageofthenonrespondentsthanoftherespondentswereforRoosevelt.Thisbiasreinforcedtheselectionbias.2019/8/2022•Note:TheDigestneversurvivedthedebacleandfoldedshortlythereafter.Atthesametime,GeorgeGallupwassettinguphissurveyorganization,andhecorrectlyforecasttheRooseveltVictoryfromameresampleof50,000people.Yetin1948,usinganotherdubiousprocedure(aformofjudgmentsampling,calledquotasampling),Gallup'sorganization(alongwithCrossley'sandRoper's)incorrectlypredictedthevictoryofThomasDeweyoverHarrySTruman.2019/8/20236.2.2抽样平均误差standarderror是根据随机原则抽样时,所有可能出现的样本平均数的标准差。它反映样本平均数(样本成数)与总体平均数(总体成数)的平均误差程度,常用μ表示。Thestandarderrorofthesamplemeanisthestandarddeviationofthesamplingdistributionofsamplemeans.2019/8/20241.抽样平均数的平均误差(1)重复抽样的抽样平均误差计算公式nnx2但是,σ是全及总体标准差,这是不知道的。如果知道,就无需进行抽样调查了。在这种情况下可用样本的方差s2来代替。其计算公式如下nxxs22ffxxs222019/8/2025(2)不重复抽样的抽样平均误差计算公式)1(2NnNnx
本文标题:第6章抽样推断88821373
链接地址:https://www.777doc.com/doc-419548 .html