您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第六章统计量及其抽样分布.
statistics《统计学》中山大学新华学院经贸系第六章统计量及其抽样分布statistics《统计学》中山大学新华学院经贸系本章框架结构一、统计量二、关于分布的几个概念三、几种常见的分布四、总体分布、样本分布和抽样分布五、常见统计量的抽样分布statistics《统计学》中山大学新华学院经贸系一、统计量统计量是用来描述样本特征的概括性数字度量。它是根据样本数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数,它不依赖于任何未知参数。(第一章)设X1,X2,…,Xn是从总体X中抽取的容量为n的一个样本,如果由此样本构造一个函数T(X1,X2,…,Xn),不依赖于任何未知参数,则称函数T(X1,X2,…,Xn)是一个统计量如:样本均值、样本比例、样本方差等都是统计量statistics《统计学》中山大学新华学院经贸系、2211()niiBSXXn、2211()1niiDSXXn、21niiCXEX、【例】设是从总体X中抽取一个样本,下面哪一个不是统计量()statistics《统计学》中山大学新华学院经贸系次序统计量定义:设X1,X2,…,Xn是从总体X中抽取的一个样本,X称为第i个次序统计量,它是样本(X1,X2,…,Xn)满足如下条件的函数:每当样本得到一组观值时,其由小到大的排序中,第i个值就作为次序统计量X(i)的观测值,而X(1),X(2),…,X(n)称为次序统计量中位数、分位数、四分位数等都是次序统计量【例】下列不是次序统计量的是()A.中位数B.均值C.四分位数D.极差12,,...,nxxx12nxxxx()()(i)LL()ixstatistics《统计学》中山大学新华学院经贸系二、抽样分布1.样本统计量的概率分布称为该统计量的抽样分布2.随机变量是样本统计量3.结果来自容量相同的所有可能样本4.提供了样本统计量长远而稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据statistics《统计学》中山大学新华学院经贸系抽样分布的形成过程总体样本计算样本统计量如:样本均值、比例、方差statistics《统计学》中山大学新华学院经贸系统计量的渐近分布样本均值渐近正态分布。假设样本X=X1,X2,…,Xn随机地抽取具有均值和方差的总体,则当时,样本均值的标准化随机变量渐近的服从标准正态分布.un2X(0,1)N*()XXnstatistics《统计学》中山大学新华学院经贸系三、由正态分布导出的几个重要分布1、分布2、t分布3、F分布2statistics《统计学》中山大学新华学院经贸系、分布(distribution)(1)由阿贝(Abbe)于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson)分别于1875年和1900年推导出来。(2)定义:设随机变量相互独立,且服从标准正态分布,则他们的平方和服从自由度为n的分布。(3)图象:(如图)niiX1212,,,nXXXL),...,2,1(niXi222statistics《统计学》中山大学新华学院经贸系(4)性质和特点分布的变量值始终为正;分布的形状取决于其自由度n的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称;常用于方差的估计和假设检验,以及列联分析中。期望为:E(2)=n,方差为:D(2)=2n(n为自由度);可加性:若U和V为两个独立的2分布随机变量,U~2(n1),V~2(n2),则U+V这一随机变量服从自由度为n1+n2的2分布;当自由度增加到足够大时,2分布的概率密度曲线趋于对称,当时,2分布的极限分布是正态分布。nstatistics《统计学》中山大学新华学院经贸系()n(5)分位数:设,若对于:01,存在满足X~2(n)2()0n2{()},PXn则称为2(n)分布的上分位点2()nstatistics《统计学》中山大学新华学院经贸系(6)实际应用:与分布有关的抽样分布:设,则,令,则X服从自由度为1的2分布,即。当总体,从中抽取容量为n的样本,则:2),(~2NX)1,0(~NXZ2XZ2~(1)X),(~2NX2212()~()niiXnstatistics《统计学》中山大学新华学院经贸系、t分布(tdistribution)(1)也称学生氏分布,是威廉·戈塞尔(W.S.Gosset)于1908年在一篇以“学生”为笔名的论文中首次提出的。(2)定义:设随机变量,,且与独立,则,其分布称为t分布,记为t(n),其中n为其自由度。(3)图象:(如右图))1,0(~NX)(~2nYXYnYXtstatistics《统计学》中山大学新华学院经贸系(4)性质和特点:①当时,t分布的数学期望;当时,t分布的方差。②自由度为1的t分布称为柯西分布。③随着自由度n的增加,t分布的密度函数愈来愈接近标准正态分布的密度函数。实际中,当时,t分布与标准正态分布就非常接近。④t分布的提出对于统计学中小样本理论和应用有着重要的促进作用。2n3n0tE2nntD30nstatistics《统计学》中山大学新华学院经贸系分布图示xt分布与标准正态分布的比较t分布标准正态分布t不同自由度的t分布标准正态分布t(df=13)t(df=5)zstatistics《统计学》中山大学新华学院经贸系分位点设t~t(n),若对:01,存在t(n)0,满足P{tt(n)}=,则称t(n)为t(n)的上分位点。)(ntstatistics《统计学》中山大学新华学院经贸系注:1()()tntn1()tn()tnstatistics《统计学》中山大学新华学院经贸系(5)实际应用:与t分布有关的抽样分布:①设来自正态分布的一个样本,,,则称为服从自由度为的t分布。12,,,nXXXL),(2NniiXnX1121211niiXXnS)1(ntSXn~1nstatistics《统计学》中山大学新华学院经贸系、F分布(Fdistribution)(1)由统计学家费希尔(R.A.Fisher)提出的,以其姓氏的第一个字母来命名;(2)定义:设若U为服从自由度为m的2分布,即U~2(m),V为服从自由度为n的2分布,即V~2(n),且U和V相互独立,则,称F为服从自由度m和n的F分布,记为。(3)图象:(如右图)nVmUF),(~nmFFstatistics《统计学》中山大学新华学院经贸系(4)性质和特点:①F分布的数学期望;方差;②F分布的p分位数:;③F分布与t分布的关系:如果随机变量服从分布,则服从的F分布,则:④F分布的应用广泛,如在方差分析、回归方程的显著性检验中都有重要地位。2,2nnntE4,42222nnnmnmntDmnFnmFpp,1,1Xnt2XnF,1),1(~/22nFnYXT),1(~/22nFnYXT),1(~/22nFnYXTstatistics《统计学》中山大学新华学院经贸系二、总体分布、样本分布和抽样分布1、总体分布(populationdistribution)①定义:总体中各元素的观察值所形成的分布;②特点:分布通常是未知的;可以假定它服从某种分布。2、样本分布(sampledistribution)①定义:也称经验分布,是一个样本中各观察值的分布;②特点:当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。statistics《统计学》中山大学新华学院经贸系、抽样分布(samplingdistribution)①定义:样本统计量的概率分布;②特点:A、是一种理论概率分布;B、随机变量是样本统计量;如:样本均值,样本比例,样本方差等;C、结果来自容量相同的所有可能样本;D、为我们提供了样本统计量长远稳定的信息,是进行推断的理论基础,也是抽样推断科学性的重要依据。statistics《统计学》中山大学新华学院经贸系三、常见统计量的抽样分布1、样本均值的抽样分布2、样本比例的抽样分布3、样本方差的抽样分布statistics《统计学》中山大学新华学院经贸系、样本均值的抽样分布1)当总体为正态分布时,样本均值的抽样分布仍为正态分布,服从均值为,方差为的正态分布,即:。【证明P143】2)当总体不是正态分布时,当样本量n比较大,且总体的方差有限时,样本均值仍近似服从正态分布,即:。【见“中心极限定理”】),(2NXn2),(~2nNX2X2~(,)XNnstatistics《统计学》中山大学新华学院经贸系=50=10X总体分布n=4抽样分布xn=165x50x5.2x当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值也服从正态分布,的数学期望为μ,方差为σ2/n。即2~(,)XNn中心极限定理XXstatistics《统计学》中山大学新华学院经贸系当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布nx推论:从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体xxstatistics《统计学》中山大学新华学院经贸系的分布趋于正态分布的过程Xstatistics《统计学》中山大学新华学院经贸系【注意】大样本,小样本之间的区别并不是以样本容量大小来区别的。小样本问题:在样本容量固定的条件下所进行的统计推断、问题分析,不管样本容量有多大,都成为小样本问题。大样本问题:在样本容量的条件下进行的推断、问题分析则成为大样本问题。因此:一般地,统计学中将称为大样本,为小样本的说法只是一种经验的说法。例题:P144,例6.46.5n30n30nstatistics《统计学》中山大学新华学院经贸系()220,()15()220,()100EXDXEXDX解:设随机变量X表示从该批发动力中任取一件发动机的功率值.Xi表示抽取的第i台发动机的功率值(i=1,2…100).则显然X1…X100独立同分布,且与总体X具有相同的
本文标题:第六章统计量及其抽样分布.
链接地址:https://www.777doc.com/doc-2088687 .html