您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 统计学第4章抽样调查
1、第四章抽样调查•重点与难点:•重点:抽样调查的意义抽样平均误差的意义及计算总体参数的点估计与区间估计的方法•难点:抽样平均误差的计算总体参数的区间估计•学习内容:一、抽样调查的基本问题二、抽样误差三、参数估计四、抽样调查的组织形式第一节抽样调查的基本问题一、抽样调查的意义一般所讲的抽样调查,即指狭义的抽样调查(随机抽样):按照随机原则从总体中抽取一部分单位进行观察,并运用数理统计的原理,以被抽取的那部分单位的数量特征为代表,对总体作出数量上的推断分析。1.按随机原则抽选调查单位;2.用样本推断总体;3.在调查之前可以计算和控制抽样误差。抽样调查的特点:抽样推断:即根据样本统计量推断总体参数的过程。也叫抽样估计。抽样调查的特点之一:由部分推断总体统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样调查(抽样推断)的概念随机样本:与总体分布特征相同非随机样本:与总体分布特征不同并非所有的抽样估计都按随机原则抽取样本。也有非随机抽样。特点之二:按随机原则抽取样本特点之三:存在估计误差,并可加以控制。抽样推断误差登记误差代表性误差用设计、培训、管理等方法消除用抽样方法、样本。
2、容量等手段控制抽样调查方法是市场经济国家在调查方法上的必然选择,和普查相比,它具有准确度高、成本低、速度快、应用面广等优点。二、抽样调查的适用范围1.总体范围较广,不需要了解每一个别单位的情况;2.对破坏性或消耗性产品的质量进行检验;3.对普查或全面调查的统计资料进行检查和修正。一般适用于以下范围:三、抽样调查的几个基本概念(一)总体和样本总体:所要调查观察的全部事物。总体单位数用N表示。总体可以分为有限总体和无限总体。样本:从总体中抽取出来那部分单位所组成的集合体。样本是总体的一个缩影。抽样总体的单位数,即样本容量,用n表示。n≥30大样本n30小样本(二)参数和统计量总体参数样本统计量特征数及符号总体单位数N样本(单位数)容量n总体平均数样本平均数总体成数P样本成数p总体标准差样本标准差S总体方差样本方差参数:描述总体特征的指标。统计量:描述样本特征的指标。抽样推断的目的就是要通过对样本的平均数、成数的标准差(或方差)的测量来推断总体的相应特征值。主要统计特征数及符号X22Sx(三)抽样方法重置抽样:即有放回抽样。不重置抽样:即无放回抽样,每个总体只能有一次被抽中的机会。样本单。
3、位的抽选方法在组织抽样调查时,根据样本单位是否重复抽取,分别有重复抽样和不重复抽样两种方法。1、重复抽样重复抽样是指每次从总体中抽取一个单位进行观察后,再把这个单位重新放回总体,使之继续参加下次抽选。这种抽选法也称为回置抽样或重置抽样。重复抽样法由于前一次抽中的单位又被放回总体中,不会影响后面的抽选,所以总体中每个单位被抽中的机会均等连续抽选各单位都是独立进行的的。2、不重复抽样不重复抽样是指每次从总体中抽取一个单位进行观察后不再把这个单位重新放回总体,这个总体单位不再继续参加下次抽选。这种抽选法也称为不回置抽样或不重置抽样。不重复抽样法由于每次抽中的单位不再放回总体中,每抽选一次,总体中的单位就减少一个,使连续抽选的各个单位不相互独立。但是总体中各单位被抽中的机会仍然是均等的!不重复抽样按是否考虑抽选样本单位的顺序,又可分为有顺序不重复抽样和无顺序不重复抽样两种。有顺序不重复抽样即通常所说的不重复排列。按这种抽样方法只要有一个单位不同,就算不同的样本。抽样框——是指包含有全部总体单位及其主要指标特征的一个框架或列表。(四)抽样框以确定总体的抽样范围和结构。设计出了抽样框后,便可采用抽。
4、签的方式或按照随机数表来抽选必要的单位数。若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。抽样框的形式一般有两种:(四)抽样框一览表:表中列出所有总体单位。地图:在地图上将调查单位分布在各个地区,然后根据地区进行抽样。样本可能数目又称样本个数,是指从一个有N个单位的总体中抽取容量为n的样本时,有可能出现的所有样本的个数。(五)样本可能数目!!()!nMNNMnNn重置抽样考虑顺序时,样本可能数目不重置抽样时,样本可能数目为:抽样调查的理论基础概率论大数定律中心极限定理大数定律•大数定律是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。其原因是,在大量的观察试验中,个别的、偶然的因素影响而产生的差异将会相互抵消,从而使现象的必然规律性显示出来。•例如,观察个别或少数家庭的婴儿出生情况,发现有的生男,有的生女,没有一定的规律性,但是通过大量的观察就会发现,男婴和女婴占婴儿总数的比重均会趋于50%。中心极限定理(P97)•大数定律揭示了大量随机变量的平均结果,但没有涉及到随机变量的分布的问题。而中心极限定理说明的是在。
5、一定条件下,大量独立随机变量的平均数是以正态分布为极限的。论证了:1、如果总体很大,而且服从正态分布,样本平均数的分布也同样服从正态分布。2、如果总体很大,但不服从正态分布,只要样本容量足够大,样本平均数的分布趋近于正态分布。3、样本平均数的的平均数,等于总体平均数。第二节抽样误差一、抽样误差的概念抽样误差是指在抽样调查中,由于随机抽样的偶然性因素,使样本的结构不足以代表总体的结构,而引起的样本指标与总体指标之间的绝对离差。即指随机误差,这种误差是抽样调查固有的误差,是无法避免的。xXpP即、。抽样误差的影响因素:1.总体标志变异程度。——正方向变化关系2.抽样单位数目的多少,即样本容量。——反方向变化关系3.不同的抽样方法。4.不同的抽样组织形式。抽样误差的作用:1.在于说明样本指标的代表性大小。误差大,则样本指标代表性低;误差小,则样本指标代表性高;误差等于0,则样本指标和总体指标一样大。2.说明样本指标和总体指标相差的一般范围。抽样误差的意义:指所有可能样本的指标(所有的统计量)与总体指标(参数)的平均离差,反映抽样误差的一般水平。二、抽样平均误差2()xMxX总体平。
6、均数的抽样平均误差抽样平均误差指所有可能样本(统计量)的指标与总体指标(参数)的平均离差。通常用μ表示。其定义为:(1)pppMM其中,表示所有可能的样本数目。总体成数的抽样平均误差三、抽样平均误差的计算(一)总体平均数的抽样平均误差或xx2nn1.重置抽样抽样平均数的平均误差例题:某工厂有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其工资水平资料如下:月平均工资(元)524534540550560580600660工人数469108643计算样本平均数和抽样平均误差。解:先列表xfxf52442096129651845346320467640565409486040036005501055001001000560844800058063480400240060042400160064006603198010000300005028000526402)(xxfxx2)(计算平均数即平均工资:元)(5605028000fxfx元)(样本标准差(45.325052640)2ffxxs元)抽样平均误差(59.45045.3。
7、2nsx2.不重置抽样:2xNnnN12xNnn(1)nN但实际中,往往很大,很小,故改用下列公式:x400100(1)1.99()10010000上例中,若为不重复抽样,则:小时(二)总体成数的抽样平均误差pp(1p)nn1.重置抽样2.不重置抽样:2pNnnN1NnnN1p(1-p)抽样成数的平均误差例题:某钢铁厂生产某种钢管,现从该厂某月生产的500根产品中抽取一个容量为100根的样本。已知一级品率为60%,试求样本一级品率的抽样平均误差。解:已知p=60%、n=100、N=500%9.4100%601%60)1(nppp重复抽样下:%4.4)5001001(100%)601(%6011Nnnppp不重复抽样下:四、抽样极限误差样本指标围绕总体指标左右两侧波动形成的一定范围。把可允许的误差范围叫做抽样极限误差,即pppppPpPpxxxxXxXx其中、分别表示抽样平均数和抽样成数的极限误差。x五、抽样估计的可靠程度抽样极。
8、限误差通常要以抽样平均误差为尺度来度量,也就是说,抽样极限误差的大小相当于几个抽样平均误差,能有多大的概率保证误差不超过此范围。xxxxtttFt.)(或其中表示。概率保证程度用差的概率度一个指标,称为抽样误是测量估计可靠程度的•当t=1时,F(t)=0.6827;•当t=1.5时,F(t)=0.8664;•当t=2时,F(t)=0.9545;•当t=3时,F(t)=0.9973.•这就表明,抽样误差范围与可靠程度之间的数量关系。当抽样误差范围扩大时,就可以提高抽样推断的可靠程度;反之,缩小抽样误差范围,推断的可靠程度就降低。第三节参数估计一、点估计和区间估计只要在样本代表性大,且对全及指标精确性要求不高的情况下,可采用点估计法。如能满足下列三个准则:无偏性一致性有效性就会得到合理的估计。(一)点估计xXpP是由样本指标直接代替全及指标,不考虑任何抽样误差因素。即用直接代表,用直接代表。就100x1002p98%X1002P98%在全部产品中,抽取件进行仔细检查,得到平均重量克,合格率,我们直接推断全部产品的平均重量克,合格率。例(二)区间估计是根据样本指标和抽样误。
9、差去推断全及指标的可能范围,它能说清楚估计的准确程度和把握程度。根据中心极限定理,得知当n足够大时,抽样总体为正态分布,根据正态分布规律可知,样本指标是以一定的概率落在某一特定的区间内,统计上把这个给定的区间叫抽样极限误差,也称置信区间,即在概率F(t)的保证下:抽样极限误差△=tμ,(t为概率度)可见,抽样极限误差,即扩大或缩小了以后的抽样误差范围。当F(t)=68.27%时,抽样极限误差等于抽样平均误差的1倍(t=1);当F(t)=95.45%时,抽样极限误差等于抽样平均误差的2倍(t=2);当F(t)=99.73%时,抽样极限误差等于抽样平均误差的3倍(t=3);例抽样误差范围的实际意义是要求被估计的全及指标或P落在抽样指标一定范围内,即落在Xxx或pp的范围内。二、全及平均数和全及成数的推断xxppF(t)xXxpPp()()t在概率的保证下:即:全及平均数成数抽样平均数成数)403.57(100003)99.73%(t(3))402.38(100002)95.45%(t千克亩产量的可能范围为:亩小麦的平均保证,该农场若以概率千克亩产量的可。
10、能范围为:亩小麦的平均保证,该农场若以概率千克43.39619.1340062.39719.12400)2()(19.1)100001001(10012)1()1(22XxXNnnxsx某农场进行小麦产量的抽样调查,该农场小麦播种面积为10000亩,采用不重复的简单随机抽样从中选100亩作为样本,进行实割实测,得到样本的平均亩产量为400千克,样本标准差为12千克。则:~~例1pp380p100%95%400P(1P)95%(195%)1.09%n40095.45%Pp95%21.09%92.82%97.18%在概率的保证下,全及一级品率:某机械厂日产某种产品8000件,现采用纯随机不重复抽样方式(按重复抽样公式计算),从中抽取400件进行观察,其中有380件为一级品,试以概率95.45%的可靠程度推断全部产品的一级品率及一级品数量的范围。则:抽样一级品率:~例2三、样本容量的确定(一)影响样本容量的因素总体的变异程度抽样的误差范围抽样估计的置信度不同的抽样组织形式对抽样误差有影响,所以也影响了样本容量的确定。(一)。
本文标题:统计学第4章抽样调查
链接地址:https://www.777doc.com/doc-420123 .html