您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 贾俊平《统计学》第6章 统计量及其抽样分布
你不必吃完整一头牛,才知道它的肉是咬不动的。SamelJohnson统计应用“抓阄”征兵计划在美国的对越战争中,为使前线有足够的士兵,美国政府制定了一个“抓阄”的征兵计划。该计划打算把1到366的号码随机地分配给一年中每一天,然后由军事部门按分配的号码顺序把生日与之对应的年轻人分批征召入伍。这种方法的目的是为了给大家相等的机会卷入这场不受欢迎的战争中,因此被征召的可能性应该是随机的在第一年的征兵计划中,号码1被分配给了9月14日,分配方法是随机抽取一个大容器中的366个写上了日子的乒乓球。结果所有年满18岁且生于9月14日的合格青年将作为第一批被征召入伍。生日被分配为号码2的青年则在第二批被征召入伍,以此类推统计应用“抓阄”征兵计划我们知道,并不是所有的人都被征召入伍,因此,生日被分配的号码较大的人也许永远轮不上到军队服役这种抓阄看起来对决定应该被征召入伍是一个相当不错的方法。然而,在抓阄的第二天,当所有的日子和它们对应的号码公布以后,统计学家们开始研究这些数据。经过观察和计算,统计学家们发现了一些规律。例如,我们本应期望应该有差不多一半的较小的号码(1到183)被分配给前半年的日子,即从1月份到6月份;另外一半较小的号码被分配给后半年的日子,从7月到12月份。由于抓阄的随机性,前半年中可能不会分到正好一半较小的号码,但是应当接近一半统计应用“抓阄”征兵计划然而结果是,有73个较小的号码被分配给了前半年的日子,同时有110个较小的号码被分配给了后半年的日子。换句话说,如果你生于后半年的某一天,那么,你因为被分配给一个较小号码而去服兵役的机会要大于生于前半年的人在这种情况下,两个数字之间只应该有随机误差,而73和110之间的差别超出了随机性所能解释的范围。这种非随机性是由于乒乓球在被抽取之前没有被充分搅拌造成的。在第二年,主管这件事的部门在抓阄之前去咨询了统计学家(这可能使生于后半年的人感觉稍微舒服些)第6章统计量与抽样分布6.1统计量6.2关于分布的几个概念6.3由正态分布导出的几个重要分布6.4样本均值的分布与中心极限定理6.5样本比例的抽样分布6.1统计量6.1.1统计量的概念6.1.2常用统计量6.1.3次序统计量6.1.4充分统计量统计量的概念判断是否统计量:看构造的函数是否有未知参数。常用统计量掌握均值和方差。次序统计量哪些是次序统计量:中位数、分位数、四分位数、极差和均值充分统计量统计计量加工过程中一点信息都不损失的统计量通常称为充分统计量。6.2关于分布的几个概念6.2.1抽样分布6.2.2渐近分布6.2.3随机模拟获得的近似分布抽样分布(samplingdistribution)英国统计学家把抽样分布、参数估计和假设检验看作统计推断的三个中心内容。抽样分布就是指样本统计量的概率分布,属于随机变量函数的分布。若无特别说明,讨论的都是可重复的简单随机抽样,需满足两个条件:1、随机变量X相互独立2、样本与总体同分布抽样分布的形成过程(samplingdistribution)总体计算样本统计量如:样本均值、比例、方差样本渐近分布当n较大时,就用极限分布作为抽样分布的一种近似,这种极限分布称为渐近分布。6.3由正态分布导出的几个重要分布1、2分布2、t分布3、F分布1、由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出来。2、设,则3、令,则Y服从自由度为1的2分布,即2分布(2distribution)),(~2NX)1,0(~NXz2zY)1(~2Y1.分布的变量值始终为正2.分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称3.期望为E(2)=n,方差为D(2)=2n(n为自由度)4.可加性:若U和V为两个独立的服从2分布的随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布2分布(性质和特点)2分布(图示)选择容量为n的简单随机样本计算样本方差s2计算卡方值2=(n-1)s2/σ2计算出所有的2值不同容量样本的抽样分布2n=1n=4n=10n=20总体6.4样本均值的抽样分布与中心极限定理=50=10X总体分布n=4抽样分布xn=165x50x5.2x当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)中心极限定理(centrallimittheorem)当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布nx从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ,方差为σ2/n的正态分布一个任意分布的总体xx抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本样本均值正态分布样本均值正态分布样本均值非正态分布样本比例的抽样分布总体(或样本)中具有某种属性的单位与全部单位总数之比不同性别的人与全部人数之比合格品(或不合格品)与全部产品总数之比总体比例可表示为样本比例可表示为比例(proportion)NNNN101或nnpnnp101或在重复选取容量为n的样本时,由样本比例的所有可能取值形成的相对频数分布。当样本容量很大时,样本比例的抽样分布可用正态分布近似。推断总体比例的理论基础。样本比例的抽样分布样本比例的数学期望样本比例的方差重复抽样不重复抽样样本比例的抽样分布(数学期望与方差))(pEnp)1(21)1(2NnNnp样本方差的抽样分布样本方差的分布1.在重复选取容量为n的样本时,由样本方差的所有可能取值形成的相对频数分布2.对于来自正态总体的简单随机样本,则比值的抽样分布服从自由度为(n-1)的2分布,即)1(~)1(222nsn22)1(sn结束
本文标题:贾俊平《统计学》第6章 统计量及其抽样分布
链接地址:https://www.777doc.com/doc-3430219 .html