您好,欢迎访问三七文档
第六章抽样估计第一节抽样推断的一般问题一、抽样推断的概念和特点抽样推断是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据以推算总体相应数量特征的一种统计分析方法。特点:1、由部分推算整体的一种认识方法2、抽样推断是建立在随机取样的基础上3、抽样推断是运用概率估计的方法4、抽样推断的误差可以事先计算并加以控制(一)参数估计。特点是不知道总体的数量特征,依据所获得的样本观察资料,对所研究现象总体的水平、规模等数量特征进行估计(二)假设检验。特点是对总体的变化情况不了解,不妨对总体的状况作某种假设,然后再根据抽样推断的原理,根据样本观察资料对所作假设进行检验,来判断着种假设的真伪,以决定行动的取舍。二、抽样推断的内容(一)全及总体和样本总体全及总体简称总体,是指所研究现象的全体。总体单位数用表示。样本总体简称样本,是指按照随机原则,从全及总体中抽取的一部分单位所组成的小总体,用表示。Nn(二)全及指标和样本指标(参数和统计量1、全及指标:根据总体各单位的标志或标志属性计算的,反映总体数量特征的综和指标称为全及指标(1)全及平均数(总体平均数)nxX(未分组)fxfX(分组)三、抽样调查中的几个基本概念(2)全及成数(总体成数),NNp1pNNq10N1:具有某种研究标志单位数;N0:不具有研究标志的单位数。(3)总体数量标志的标准差与方差NXx)(2(未分组)ffXx)(2(分组)总体方差=NXx)(22ffXx)(22或(4)总体是成数的标准差与方差标准差=)1(PPqP方差=qP)1(PP2、样本指标根据样本各单位标志值或标志属性计算的综合指标称为统计量(1)抽样平均数nxx(未分组)ffxx(分组)(2)抽样成数,nnp1pqnn10(3)样本数量标志标准差与方差nSxx)(2(未分组)ffxxS)((分组)方差=S2(4)样本是成数标准差与方差标准差=)1(pppq方差=pq)1(pp三、样本容量和样本个数样本容量是指一个样本所包含的单位数样本个数又称样本可能数目,指从一个总体中可能抽取的样本个数四、重复抽样和不重复抽样第二节抽样估计的方法一、抽样误差的概念是指样本指标与被它估计的总体相应指标的差。登记性误差:登记,汇总,计算,过录中产生的误差。统计误差系统误差:没有遵守随机原则。代表性误差:随机误差:遵守随机原则。抽样误差:就是指随机误差,是抽样调查固有的,是一种代表性误差二、抽样平均误差的概念及计算(一)抽样平均误差的概念平均误差:是指所有可能出现的样本指标数值与总体指标数值的平均离差,也可以说是所有样本指标的标准差。)(抽样成数的平均误差)抽样平均数的平均误差)((22)(MPpMpxXx(二)影响抽样平均误差的因素:l总体各单位标志值的差异程度l样本的单位数l抽样方法l抽样调查的组织形式(三)抽样平均误差的计算1、抽样平均数的平均误差(x)计算(1)重复抽样计算公式xnn2(2)不重复抽样的计算公式x)1(2Nnn2、抽样成数的平均误差计算(1)重复抽样nppp)1((2)不重复抽样)1()1(Nnnppp(四)抽样极限误差(允许误差)极限误差是抽样误差的可能范围。1、抽样平均数的极限误差)(xx,XxxtX=2、抽样成数的极限误差)(pp,=Ppptp=注:在计算样本平均误差时,通常得不到总体标准差的数值,要用样本标准差来代替总体标准差三、抽样估计抽样估计就是指利用实际调查计算的样本指标数值来估计相应的总体指标的数值。(一)抽样估计的优良标准1、无偏性。2、一致性。3、有效性。(三)抽样估计的方法1、点估计(定值估计):用样本指标的实际值作为总体参数的估计值。2、区间估计:在一定概率保证下,利用实际抽样资料,指出总体被估计值的上限和下限。在区间估计中,有三个基本要素:l相应的概率保证程度l估计值l估计值的误差范围)()(tFtXxpXxxtxx注意:t=1F(t)-68.27%t=2F(t)=95.45%t=3F(t)=99.73%需要熟记区间估计:xxxXxx()tXpppPpp()tp区间估计的步骤:1、计算样本指标数据,(x)p2、确定总体方差2,或计算样本指标方差S23、计算平均误差,(x)p4、计算极限误差,(x)p5、区间估计[例6-1]某高校有5000名学生,随机抽取250名调查每周看电视时间,资料如下:每周看电视时间(小时)学生人数2以下2-44-66-88-102256926020合计250试按不重复抽样方法,以95.45%的概率推断该校全部学生每周平均看电视时间的可能范围。已知:2250,5000tNn,[解](小时)5250209607925563221fxfx544.42502060925622)()59()57()55()53()51(222222ffxx2(小时)13.0)50002501(250544.4)1(2Nnnx(小时)26.013.02xxt26.0526.05XxXxxx(小时)26.574.4X全校学生每周平均看电视时间在4.74-5.26小时之间可靠程度为95.45%。[例6-2]对一批成品按不重复抽样方法抽选200件,其中废品8件,又知样本容量为成品总量的,当概率为95%时,试估计废品率的范围。201已知:%,42008p,201Nnt=1.96[解]%35.1)2011(20096.004.0p%65.2%35.196.1p%65.2%4%65.2%4p这批产品废品率在1.35%~6.65%之间。第三节抽样组织设计一、抽样组织设计的基本原则(一)保证随机原则的实现。(二)考虑样本容量和结构。(三)关于抽样的组织形式问题。二、常用的抽样组织形式:简单随机抽样、类型抽样、等距抽样、整群抽样二、抽样调查组织方式及抽样误差计算(一)简单随机抽样。它是按随机原则直接从总体N个单位中抽出n个单位作为样本,总体中每个总体单位都有同等被抽取的机会,适用于均匀总体。(二)类型抽样(分层抽样)它首先将总体按主要标志加以分组,然后再从各组中按随机原则,抽取样本单位。222间内总类型抽样的抽样平均误差与组间的方差无关,仅取决与组内方差的平均水平(三)等距抽样它事先将总体各单位按某一标志排队,然后依一定顺序和时间间隔来抽取样本单位的一种抽样组织形式。例如:工业产品质量抽查按时间顺序取样,农产量抽样调查按田间的地理顺序取样,居民家计调查按街道的门牌号码抽取调查户(四)整群抽样是将总体先分为若干群,然后按随机原则从中抽取若干群,对抽中群的所有单位进行全面调查的抽样组织形式。,)1(2RrRrxx)1(2RrRrPP,Rixxx)(22RippP)(22注:整群抽样是对中选群进行全面调查,所以只存在群间抽样误差不存在群内抽样误差抽样方案的检查:主要有(1)准确性检查(以方案所要求的允许误差范围为标准)(2)代表性检查(方案中的样本指标与过去已掌握的总体同一指标或P进行对比,视其比率是否超过规定的要求)x第四节样本容量的确定一、影响样本容量的因素1、总体各单位标志变异程度。2、允许的极限误差大小。3、抽样方法。4、抽样方式。5、抽样推断可靠程度。二、样本容量的计算在简单随机抽样组织形式下:(一)平均数样本容量的确定1、在重复抽样条件下222xtnxxt2、在不重复抽样条件下22222ttnXNN(二)成数样本容量的确定1、在重复抽样条件下22)1(ppptn2、在不重复抽样条件下)1()1(222ppNppNttnP[例6-5]某药厂为了检验瓶装药片数量,从成品库随机抽检100瓶,平均每瓶101.5片,标准差为3片。试以F(t)=99.73%的把握程度推断成品库该种药平均每瓶数量的置信区间,如果允许误差减少到原来的,其他条件不变,问需要抽取多少瓶?21已知:,100n,瓶)(5.101xS=3(片),t=3片则:3.01003nx)(9.03.03片xxt9.05.1019.05.101X(片)4.1026.100X (片)若 45.029.0x(瓶)则: 40045.033222222xtn
本文标题:抽样估计
链接地址:https://www.777doc.com/doc-418163 .html