您好,欢迎访问三七文档
1安徽理工大学统计学第三十二讲主讲雷思友副教授/硕导/系主任2市场营销2009----1/2/3/4Bequiet!Shutyourmouth!!3第七章抽样调查第一节抽样调查概述第二节抽样调查的一般原理第三节抽样估计第四节抽样的组织形式4(一)抽样推断的含义抽样调查是按随机原则,从全部研究对象中抽取一部分单位进行观察,并根据样本的实际数据,对总体的数量特征做出具有一定可靠程度的估计和判断,从而达到对全部研究对象的认识的一种统计方法。其中心问题是如何根据已知的部分资料来推断未知的总体情况。第一节抽样调查概述一、抽样调查的含义5(二)抽样推断的特点1.抽样推断是非全面调查2.抽样推断是按随机原则抽选调查单位。3.抽样推断是用样本的指标数值去推算总体的指标数值。4.抽样推断中产生的抽样误差,可以事先计算并加以控制。6二、抽样调查的主要内容(一)随机抽样:按照随机原则从总体中抽取部分单位构成样本的过程。(二)统计估计:根据随机抽取的部分单位的特性来对总体的分布函数、分布参数或数字特征等进行推测估算的过程。(三)假设检验:根据经验或认识,提出某一假设,并判断该假设正确性的过程。7三、抽样推断的作用(一)解决了无法进行全面调查或很难进行全面调查的问题(二)可以补充或修正全面调查的数据(三)可以节省调查费用和调查时间8四、抽样推断涉及的基本概念(一)总体和样本1.全及总体(总体、母体)它是指调查对象的全部单位,是由具有某种共同性质的许多单位组成的。总体既是我们所要研究的对象,又是样本所赖以抽取的母体。组成总体的单位称为总体单位,总体的单位数通常用N表示。92.抽样总体(样本、子样)是指在总体中按随机原则抽取的那一部分单位所构成的集合体。组成样本的单位称为样本单位,样本单位数亦称样本容量,通常用n表示。样本单位数总是大于1而小于总体单位数N的,即1nN。10样本单位数n相对于总体的单位数N要小得多。统计把n/N称为抽样比例。样本单位数达到或超过30个(n≥30)称为大样本,而在30个以下(n30)称为小样本。社会经济现象的抽样调查多取大样本,而自然实验观察则多取小样本。以很小的样本来推断很大的总体,这是抽样推断法的重要特点。11(二)总体指标和抽样指标1.总体指标总体指标是指根据总体各单位的标志值计算出来的,反映总体某种属性或特征的综合指标,亦称为总体参数。由于总体是惟一确定的,因此,根据总体计算的总体指标也是惟一确定的。常用的总体指标有:总体平均数、总体成数、总体标准差和总体方差。12X(1)总体平均数代表总体单位数量标志一般水平的指标,它表明变量变动的集中趋势,通常用表示。NXNXXXXXniin11...其中:X1,X2,…Xn为总体中每一个调查单位的取值N是总体单位数∑是总和符号13NNp1NNQ0(2)总体成数当总体的一个现象有两种表现时,其中具有某一种表现的单位数占总体单位数目的比重,叫总体成数,用P或Q表示。其计算公式为:N代表总体单位数;N1代表具有某一种表现的总体单位数;No代表具有另一种表现的总体单位数;P、Q代表成数。14PQNNNQPNNN110101则15〔例1〕某公司生产的10000件产品中,有500件为不合格品。则产品不合格率P=/N=500/10000=5.0%产品合格率Q=1—P=1-5.0%=95%N116(3)总体标准差和总体方差。表示单位之间标志值的变异程度指标,叫做总体标准差,又称总体均方差(标准差)。总体标准差的平方称为总体方差。其计算公式为:NXX2NXX22172.抽样指标抽样指标是指根据抽样总体各单位标志值计算的综合指标,又称样本指标。常用的抽样指标有:抽样平均数、抽样成数、抽样总体标准差和抽样总体方差。18(1)抽样平均数。代表样本单位数量标志一般水平的指标称抽样平均数或样本平均数。nxnxxxxxniin1321...19(2)抽样成数。在抽样总体中,一个现象有两种表现时,其中具有某一种表现的单位数占抽样总体单位数的比重,叫做抽样成数,亦称样本成数。用p或q表示。其计算公式为:nnp1nnq020同总体成数p1q1)(0101-=则nnnqpnnn21[例5.2)从某公司生产的产品中,抽样检查了100件产品,其中有5件不合格,则:样本产品不合格率:样本产品合格率%510051nnp%95%511pq22(3)抽样总体标准差和抽样总体方差。说明抽样总体之间标志值变异程度的指标,叫做抽样总体标准差。抽样总体标准差的平方称为抽样总体方差(简称样本方差)。其计算公式为:nxxs2nxxs2223一个总体可以抽取许多个样本,而样本不同,抽样指标的数值也各不相同。可见,抽样指标的数值不是惟一确定的。因为抽样指标是样本变量的函数,是随机可变的变量。也就是说,由样本观测值所决定的统计量是随机变量。24(三)重复抽样和不重复抽样1.重复抽样(重置抽样)采用这种方法抽取样本单位的特点是:同一单位有多次重复被抽中的机会,并且总体单位数目始终不变,每个单位抽中或抽不中的机会在各次都是相同的。252.不重复抽样(不重置抽样)采用这种方法抽取样本单位的特点是:同一单位只有一次被抽中的机会,并且总体单位数目随着样本单位数目抽取的次数的增多而愈变愈少。每个单位抽中或抽不中的机会在各次是不同的。26抽样推断是通过样本对总体进行推算。其中,统计量与被估算的总体指标之间的关系,是推算的关键。两者的关系主要通过统计量的分布来反映,且因样本量的大小而有差别。第二节抽样推断的一般原理一、抽样推断的理论依据27(一)大样本统计量的推断依据——大数定律在重复试验中,事件频率的稳定性是大量随机现象的统计规律性的典型表现。人们根据频率的稳定性预见到概率的存在和概率的性质,同样,在长期的统计实践中,人们也找到了大量随机现象的平均结果也具有稳定性的理论依据,即大数定律。28大数定律在统计中是指一切关于大量随机现象的平均结果稳定性的定理,它为那些均值存在稳定性及整个统计推断提供了最基本的理论依据。大数定律的本质意义在于,尽管单个随机现象的具体表现不可避免地引起随机偏差,然而在大量随机现象共同作用时,由于这些随机偏差互相抵消、补偿和拉平,致使总的平均结果趋于稳定。29比雪夫大数定理:设x1,x2,x3…,xn为独立的随机变量序列,服从同一分布,且具有相同的期望值以及方差,则对于任意正数有1)1(lim1niinxnp30安徽理工大学统计学第三十三讲主讲雷思友副教授/硕导/系主任31(二)大样本统计量分布的依据一中心极限定理中心极限定理是指在一定的条件下,大量相互独立的随机现象的概率分布是以正态分布为极限。因正态分布在概率论中占有中心地位,所以把该定理叫做中心极限定理。32大数定律只揭示了大量随机变量的平均结果,但并没有涉及到随机变量的分布规律,而中心极限定理则说明了许多随机变量的分布是正态或近似正态的。这就可以简化统计推断中许多统计量的分布问题,所以它是统计学中的重要工具之一。33二、抽样推断的原理抽样估计就是以样本的实际资料为依据,计算一定的样本指标,并以此对总体做出数量上的估计和判断。其原理是:(一)抽样推断运用的是归纳推理方法抽样推断的方法是归纳法,而归纳法推断结论的正确性必须过事实的验证。34(二)抽样推断运用的是概率原理抽样推断的结论,其可靠性究竟是多少,需要运用概率的原理加以说明。(三)抽样推断的结论存在着一定的抽样误差抽样误差是抽样调查所特有的,而且是不可避免的。35抽样推断结论的可靠程度和抽样误差的大小是联系在一起的。在其他条件不变的情况下,允许的误差范围愈大,则概率的保证程度也愈大;反之,如果精确度的要求愈高,允许的误差范围愈小,则概率的保证程度也愈小。抽样误差范围可以事先通过—定资料加以计算,并能采取一定的组织措施来控制这个误差范围,保证抽样推断的结果达到一定的可靠程度。36三、抽样推断的优良标准(一)无偏性用抽样指标推断总体指标要求抽样指标的平均数等于被估计的总体指标。就是说,虽然每个可能样本的抽样指标不一定等于未知的总体指标,但在多次反复估计中,要求各个抽样指标的平均数应该等于总体指标,亦即从平均来说,抽样指标的估计是没有偏误的,叫做无偏性。37例如,样本平均数总是总体平均数X的无偏估计量,亦即样本平均数的平均数等于总体平均数。因为XxEnxEnxExE)()()()(38(二)一致性用抽样指标推断总体指标要求其样本的单位数充分大时,抽样指标也充分地靠近总体指标。也可以说该抽样指标对总体指标是一个一致估计量。391))((limxExnXxE)(1)(limXxpn证明:设为任意正数,根据大数定律有:抽样平均数的期望值等于总体平均数,即40(三)有效性用抽样指标推断总体指标时,要求作为优良估计量的方差应比其他估计量的方差小。即用抽样平均数和总体某一变量来估计总体平均数,虽然两者都是无偏的估计量,而且在每一次估计中两种估计量和总体平均数都可能有离差,但样本平均数更靠近在总体平均数的周围,平均说来它的离差比较小,所以对比来说,抽样平均数是更为优良的估计值41第三节抽样估计一、抽样误差的概念1.由样本得到的估计值与被估计的总体未知真实特征值之差,就是误差。或样本指标数值与总体指标数值之间的差数。2.抽样误差就是指按随机原则抽样时,单纯由不同的随机样本得出不同的估计量而产生的误差。423.由于总体平均数和成数是惟一确定的,抽样平均数和成数则是随机变量,因而抽样误差也不是惟一确定的,而是随机变量。抽样误差愈小,表示样本的代表性愈高;反之,样本的代表性就愈低。同样,抽样误差还说明样本指标与总体指标的相差范围,因此,它也是推算总体的依据。434.抽样误差是抽样调查自身所固有的不可避免的误差,虽然不能消除这种误差,但可以用数理统计方法进行计算确定其数量界限并加以控制,也就是根据研究的需要,把它控制出所允许的范围以内。44二、抽样平均误差(一)抽样平均误差的含义抽样平均误差是指一个抽样方案的所有可能样本的某统计量与总体相应指标的离差的平均值。纯随机抽样平均误差的定义关系式如下:所有可能的样本个数望值)(各种样本统计量-期抽样平均误差=245上式表明了抽样平均误差的含义,并不能作为计算公式。因为:1.在现实的抽样中,我们只能取得一个样本,不可能也没必要获得全部所有可能样本,所以抽样平均误差也不可能通过所有样本来直接计算。2.统计量的分布律中我们已经知道:统计量是以总体相应指标为期望值,抽样平均误差实质上就是该统计量在其概率分布中的标准差。46(二)抽样平均误差的计算1.抽样平均数的平均误差(1)在重复抽样的条件下总体方差已知,样本平均数服从正态分布,其抽样平均数的平均误差计算公式为:nnx247由上式可以看出,抽样平均数的平均误差就是抽样平均数的标准差。抽样平均误差和总体标准差是成正比的,与样本单位数的平方根成反比。因此,要想减少抽样平均误差以提高抽样指标的代表性,只能增大样本单位数n,因为总体标准差是不能改变的。48(2)在不重复抽样的条件下,抽样平均数的平均误差计算公式为:当总体单位数N很大时,公式中的N—1可以用N代替。)1(2NnNnx49在实际计算时,不重复抽样的抽样平均数的平均误差可用下式计算:)1(2Nnnx502.成数的平均误差统计成数(比重)是一种结构相对数,它实际属于是非标志平均数的特例。统计上习惯以1表示“是”,以0表示“非”。p为1的概率,q=1—p为0的概率。成数的方差是P(1-P)其特点为,最大值为0.25(0.5×0.5),即当两种表现的总体单位各占一半时,它的变异程度最大。51当N很大时,以N代替N—1,则可简化为:)1()1(Nnnppp52在重复抽样条件下,其计算公式为:nppp)1(在不重复抽样条件下,其计算公式为:)1()1(Nnnppp
本文标题:chap7抽样调查
链接地址:https://www.777doc.com/doc-417417 .html