您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第六章统计量及其抽样分布(统计学贾俊平)
第6章统计量及其抽样分布§6.1统计量§6.2关于分布的几个概念§6.3由正态分布导出的几个重要分布§6.4样本均值的分布与中心极限定理§6.5样本比例的抽样分布§6.6两个样本平均值之差的分布§6.7关于样本方差的分布第6章统计量及其抽样分布学习目标1.理解统计量与分布的几个概念2.掌握t、卡方、F三大分布3.掌握单总体参数(均值/比例/方差)推断时样本统计量的分布4.掌握双总体参数(均值差)推断时样本统计量的分布§6.1统计量6.1.1统计量的概念6.1.2常用统计量6.1.3次序统计量6.1.4充分统计量6.1.1统计量的概念(1)定义6.1设是从总体X中抽取的nXXX,,,21容量为n的一个样本,如果由此样本构造一个1.统计量的定义:函数)(21nXXXT,,,,不依赖于任何未知为一个参数,则称函数)(21nXXXT,,,统计量(或样本统计量)。代入T计算的数值称为一个具体的统计量值。(2)当获得样本的一组具体观测值nxxx,,,21后,统计量概念的例题【例6.1】设解:一个样本,判断下列各量是否为统计量。是从某总体X中抽取的nXXX,,,21niiXnX11)1(niiXXnS122)(1)2(niiXEX12)]([)3()()()4(XDXEXi(1)(2)是统计量,(3)(4)不是统计量,因为(3)(4)依赖总体分布的未知参数。6.1.2常用统计量常用的统计量:niiXnX11)1(是样本的均值,反映总体期望的信息niiXXnS122)(11)2(是样本方差,反映总体方差的信息。样本标准差S也是常用的统计量。6.1.2常用统计量XsV)3(是样本变异系数,反映总体变异系数C它反映了随机变量在以它的均值为单位时,取值的离散程度。此统计量取消了均值不同对不同总体的离散程度的影响,常用来刻画均值不同时,不同总体的离散程度。在投资项目的风.险分析中、不同群体或行业的收入差距描述中有广泛的应用。的信息。其中总体变异系数定义为)()(XEXDC6.1.3次序统计量定义6.2设是从总体X中抽取的nXXX,,,21它是样本)(21nXXX,,,满足如下条件的函数:容量为n的一个样本,)(iX称为第i个次序统计量,时,每当样本得到一组观测值nxxx,,,21中,其由小到大的顺序)()2()1(nxxx的观测值,第k个值)(kx就作为次序统计量)(kX称为次序统计量。而)()2()1(nXXX,,,分别为最小和最大次序统计量。)()1(nXX和称为样本极差。)1()()(XXRnn6.1.4充分统计量充分统计量是指统计量的加工过程中一点信息都不损失的统计量。【例6.2】某电子元件厂欲了解其产品的不合格率p,质检员抽检了100个电子元件,检查结果是,除前3个是不合格品(记为)外,其他都是合格品(记为)。当企业领导问及抽检结果时,质检员给出如下两种回答:111321=,=,XXX100~40iXi,(1)抽检的100个元件中有3个不合格)3(1001=记为iiX(2)抽检的100个元件中前3个不合格)3(31=记为iiX解:10011iiXT3212XXXTT1为充分统计量。§6.2关于分布的几个概念6.2.1抽样分布6.2.2渐近分布(略)6.2.3随机模拟获得的近似分布(略)6.2.1抽样分布1.统计量的分布叫抽样分布。2.某个样本统计量的抽样分布:从理论上说就是在重复选取容量为n的样本时,由每一个样本算出的该统计量数值的概率分布。3.正态条件下,主要有分布、t分布、F分布。2§6.3由正态分布导出的几个重要分布6.3.1分布6.3.2t分布6.3.3F分布26.3.1分布2.定义6.3设随机变量相互独立,nXXX,,,21,则它们的且iX服从标准正态分布)10(,N2niiX12平方和服从自由度为n的2分布。分布由阿贝(Abbe)1863年首先提出,后来由21.自由度是统计学中常用的一个概念,可以解释3.海尔墨特(Hermert)和卡·皮尔逊(K.Pearson)分别于1875年和1900年推导出来的。为独立变量的个数。6.3.1分布2)(~2,NX设4.)10(~,NXZ,则2ZY令)1(~2Y,则)(2n5.分布的概率密度函数曲线为n=1图6-1分布的概率密度函数曲线)(2n)(xpxn=4n=10n=206.3.1分布2(1)分布的变量值始终为正的;分布的性质和特点:6.2(2)分布的形状取决于自由度n的大小,通常为不对称分布,但随着自由度的增大逐渐趋于对称,nDnE2)()(22,(3)数学期望和方差分别为)(~)(~2212nVnU,(4)可加性:若,且独立,)(~212nnVU则当n时,2分布的极限分布是正态分布;6.3.2t分布2.定义6.4设随机变量分布,)(~)10(~2nYNX,,记为t(n),其中n为自由度。独立,则且YX与nYXt/其分布称为t分布,t分布也称学生氏分布,是高塞特(W.S.Gosset)于1.提出的。1908年在一篇以“Student”为笔名的论文中首次6.3.2t分布3.t分布的概率密度函数曲线图6-2t分布的概率密度函数曲线N(0,1)t(13))(xpx0t(4)6.3.2t分布(1)以0为中心,左右对称的单峰分布;t分布的性质和特点:4.20)(ntE,(2)t分布的数学期望为:方差为:32)(nnntD,,显然比N(0,1)大;(3)t分布是一簇曲线,其形态变化与n(确切地说与自由度)大小有关。自由度越小,t分布曲线越低平;自由度越大,t分布曲线越接近标准正态分布(u分布)曲线,在自由度大于30的情况下,t分布的曲线就很接近正态分布了。6.3.3F分布则称X服从第一自由度为m,第二自由度为n的mZnYnZmYX//有如下表达式:F分布是统计学家费希尔首先提出的。F分布1.显著性检验中都有着重要的地位。有着广泛的应用,如在方差分析、回归方程的分布,随机变量X2分别服从自由度为m和n的2.定义6.5设随机变量相互独立,且ZY与ZY与F分布,记为F(m,n),简记为)(~nmFX,6.3.3F分布3.F分布的概率密度函数曲线图6-3F分布的概率密度函数曲线F(1,10)F(5,10)F(10,10))(xpxO6.3.3F分布F分布的性质和特点:5.方差:4)4)(2()2(2)(2nnnmnmnXD,(1)设随机变量X服从,,)(nmF22)(nnnXE,则数学期望:(2)F分布与t分布的关系若)(~ntX分布,则)1(~2nFX,§6.4样本均值的分布与中心极限定理6.4.1样本均值的分布6.4.2中心极限定理6.4.1样本均值的分布的随机变量。1.设是从某一总体中抽出的随机样本,nXXX,,,21则为互相独立且与总体有相同分布nXXX,,,212.要想知道的分布,必须知道总体分布。X由于正态分布是最常见的分布之一,所以主要介绍即)(2,N在总体分布为正态分布X时样本均值的分布。)(2,N3.在总体分布为正态分布时,有X)(~2nNX,的抽样分布仍为正态分布,即说明用样本均值X时,平均来说去估计总体均值没有偏差;当n越来越大时,的离散程度越来越小,X即用X越来越准确。估计6.4.1样本均值的分布4.实际应用中,总体的分布并不总是正态分布或近似但由中心极限定理知道,不管总体的分布是什么,的分布总是近似正态分布,只要X此时样本均值2总体的有限。正态分布,此时X的分布将取决于总体分布的情况。,5.无论对什么总体分布,设总体均值为总体方差)(XE为,总有2)1(iXnE)(1iXEn)(XD)1(iXnD)(12iXDnn2所以n较大时,)(~2nNX,即)10(~/,NnX6.4.1样本均值的分布6.由图形来观察:)(~2nNX,总体分布抽样分布X50104n5xX50x16n5.2x当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布一个任意分布的总体6.4.2中心极限定理XXnX2,方差总体期望中心极限定理:设从均值为,方差为的一个任意总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为X2n/2正态分布6.4.2中心极限定理抽样分布趋于正态分布的过程)(xfx)(xfx)(xfx总体分布形状时2n的抽样分布x时4n的抽样分布x时30n的抽样分布xx)(xfx)(xfx)(xfx)(xfx)(xfx)(xfx)(xfx)(xfx)(xf6.4.2中心极限定理2.实际应用中,由于总体的分布未知,我们常要求n≥30。中心极限定理:设从均值为,方差为的一个任意总体中抽取样本量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为X2n/2正态分布注:1.中心极限定理要求n充分大,那么多大叫充分大呢?这与总体的分布形状有关。总体偏离正态越远,则要求n越大。3.大样本与小样本问题。在样本量固定的条件下进行的统计推断、问题分析,都称为小样本问题;而在样本量n→∞的条件下进行的统计推断、问题分析则称为大样本问题。一般统计学中的n≥30为大样本,n30为小样本只是一种经验说法。例题讲解【例6.4】的总体、标准差设从一个均值6.010是很偏,的样本。假定该总体不中随机选取容量36n的近似概率。小于计算样本均值要求:9.9)1(X的近似概率。超过计算样本均值9.9)2(X解:根据中心极限定理,)(~2nNX,)1.010(~2,故NX)9.9(XP)1.0109.91.010(XP)1(ZP)1(ZP)1(1ZP)1(11587.08413.01)9.9(XP)9.9(1XP8413.01587.01解:例题讲解范围内附近在总体均值计算样本均值1.010)3(X)1.109.9(XP)1.0101.101.0101.0109.9(XP)11(ZP1)1(2ZP6826.0的近似概率。解:)1()1(ZPZP例题讲解【例6.5】产的电瓶具有均值为某汽车电瓶商声称其生设质检部门决定个月的寿命分布。现假个月、标准差为660的电瓶进行寿命试验。个该厂生产确,为此随机抽查了检验该厂的说法是否准50解:个电瓶的平均,试描述假定厂商声称是正确的50)1(寿命的抽样分布。根据中心极限定理,,即60X布近似服从正态分布。个电瓶的平均寿命的分说明50,方差72.0506222nX,85.072.0X)85.0,60(2NX~故例题讲解解:过个样本的平均寿命不超假定厂商声称正确,则50)2(个月的概率为多少?57若厂商声称正确,则。,这是一个不可能事件个月的概率为不超过0002.057个电瓶的平均寿命则即若厂商的说法正确,50)57(XP个电瓶的平均寿命观察到根据小概率事件原理,50)85.0,60()1(2NX~的结果:)85.0605785.060(XP)529.3(ZP)529.3(10002.09998.01如果真的观察个月是不可能的;反之小于或等于57个月,则有理由怀疑个电瓶的平均寿命低于到5750。认为厂商的说法不正确厂商说法的正确性,即抽样分布与总体分布的关系总体分布抽样分布大样本小样本任何样本正态分布非正态分布正态分布非正态分布§6.5样本比例的抽样分布1.总体(或样本)中具有某种特征的个体个数与全部个数之比,称为比例。例如:不同性别的人与全部人数之比。2.总体比例:NN0样本比例:nnp0ˆ3.由二项分布的原理和渐近分布的理论可知,逼近。的分布可用正态分布去充分大时,当pnˆ))1((~ˆnNp,所以样本比例的分布:样本比例的例题至少的
本文标题:第六章统计量及其抽样分布(统计学贾俊平)
链接地址:https://www.777doc.com/doc-7182894 .html