您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 6.1随机样本和统计量
1第六章样本及其分布一、随机样本及统计量二、数理统计中的常用分布三、抽样分布定理2数理统计学是运用概率论的知识,对所要研究的随机现象进行多次观察或试验,研究如何合理地获得数据资料,对所关心的问题作出估计与检验的一门学科本章主要介绍随机样本、统计量等基本概念,并着重介绍几个常用的统计量和抽样分布。3第6.1节随机样本和统计量一、总体与个体、随机样本二、频率分布和直方图三、经验分布函数四、统计量4一、总体与个体,随机样本一个统计问题总有它明确的研究对象.研究对象的全体称为总体(母体),总体中每个成员称为个体.研究某批灯泡的质量…考察国产轿车的质量总体总体5然而在统计研究中,人们往往关心每个个体的一项(或几项)数量指标和该数量指标在总体中的分布情况.这时,每个个体具有的数量指标的全体就是总体.该批灯泡寿命的全体就是总体灯泡的寿命国产轿车每公里的耗油量所有国产轿车每公里耗油量的全体就是总体6由于每个个体的出现带有随机性,即相应的数量指标值的出现带有随机性。从而可把此种数量指标看作随机变量,我们用一个随机变量或其分布来描述总体。为此常用随机变量的符号或分布的符号来表示总体。通常,我们用随机变量X,Y,Z,…,等表示总体。当我们说到总体,就是指一个具有确定概率分布的随机变量。7如:研究某批灯泡的寿命时,我们关心的数量指标就是寿命,那么,此总体就可以用随机变量X表示,或用其分布函数F(x)表示.总体某批灯泡的寿命寿命X可用一概率分布来刻划F(x)8因此,在统计学中,总体这个概念的要旨是:总体就是一个概率分布.9某工厂10月份生产的灯泡寿命所组成的总体中,个体的总数就是10月份生产的灯泡数,这是一个有限总体;而该工厂生产的所有灯泡寿命所组成的总体可近似地看成一个无限总体,它包括以往生产和今后生产的灯泡寿命.有限总体和无限总体实例当有限总体包含的个体的总数很大时,可近似地将它看成是无限总体.101.样本的定义为推断总体的分布及各种特征,按一定的规则从总体中抽取若干个体进行观察试验,以获得有关总体的信息.这一抽取过程称为“抽样”.所抽取的部分个体称为样本.通常记为样本中所包含的个体数目n称为样本容量.),,,(21nXXX11容量为n的样本可以看作n维随机变量.但是,一旦取定一组样本,得到的是n个具体的数,称此为样本的一次观察值,简称样本值.简单随机样本抽取样本的目的是为了利用样本对总体进行统计推断,这就要求样本能很好的反映总体的特性且便于处理.为此,需对抽样提出一些要求,通常有两条:),,,(21nxxx12满足上述两条性质的样本称为简单随机样本.简称为随机样本.获得简单随机样本的抽样方法称为简单随机抽样.为了使大家对总体和样本有一个明确的概念,我们给出如下定义:定义6.1一个随机变量X或其相应的分布函数F(x)称为一个总体.1.代表性:X1,X2,…,Xn中每一个与所考察的总体X有相同的分布.2.独立性:X1,X2,…,Xn是相互独立的随机变量.13.,))((,,,,)(,,,,)(2121本简称样的简单随机样本中抽取的容量为或总体为从总体则称随机变量、相互独立的是具有同一分布函数若的随机变量是具有分布函数设nxFXXXXxFXXXxFXnn定义6.2.,,,,21个独立的观察值的又称为称为样本值它们的观察值nXxxxn样本所有可能取值的全体称为样本空间,记为。12(,,,)nXXX的样本点中称为nxxx,,,2114定理6.1).(),,,(),,2,1)((}{)3().(),,,(),,,(),()2().(),,,(),,,(),()1(.),,,(121**121*21121*2121niiniiniinnniinnnxpXXXixpxXPXxfxxxfXXXxfXxFxxxFXXXxFXXXXX的分布率为则样本的分布率为若总体的概率密度为则样本的概率密度为若总体的分布函数为则样本的分布函数为若总体的样本为来自总体设样本的分布15.),,,(,),,,(,)0(2121的概率密度求样本是来自总体的样本布的指数分服从参数为设总体nnXXXXXXX解的概率密度为总体X0,00,)(xxexfx,,,,,21有相同的分布且与相互独立因为XXXXn的概率密度为所以),,,(21nXXX)(),,,(121*niinxfxxxf其它,00,1ixnxenii例116.),,,(,),,,(,10),,1(2121的分布律求样本是来自总体的样本其中服从两点分布设总体nnXXXXXXppBX解的分布律为总体X,,,,21相互独立因为nXXXiippiXP1)1(}{)1,0(i,有相同的分布且与X的分布律为所以),,,(21nXXX例217},,,{2211nnxXxXxXP}{}{}{2211nnxXPxXPxXPniiniixnxpp11)1(.}1,0{,,,21中取值在集合其中nxxx18二、频率分布和直方图设连续型总体X的密度函数是未知的,是X的一个样本观值.下面介绍一种根据样本观察值来近似地求总体X的概率密度f(x)的图解法-----频率直方图法。其具体方法如下:19(1)将样本值适当分组:先从样本值中找出最小值m和最大值M,即12min,,nmxxx,12,,nMxxxmax.20取a略小于m,b略大于M,则区间[a,b]是包含所有样本值的区间.再将区间[a,b]等分为l个小区间,分点记为且每个分点ti的值应比样本值多取一位小数.01latttb相应地,样本值也分成了l个数组.21-1(,]iitt()/hbal每个小区间的长度称为组距,小区间的个数l称为组数.经验表明,组数l要适当的选定,过小会掩盖各组内数据的变动情况,过大则将突出随机性的影响而降低稳定性,从而看不出明显的规律.组数l当样本容量n≥50时应以7到18个为宜,且使每个小区间中都有样本值中的数据.22-1(,]iittif(2)确定频数和频率:设第i个小区间中样本值的频数,则相应的频率为iifvn(1≤i≤l).根据伯努利大数定律,当样本容量n充分大时,应有近似等式111iitiiiitiiiPtXtfxdxfxhtxt23.上面最后一个近似等式的几何意义是,在每个小区间上用矩形面积近似代替曲边梯形面积其中区间(]-1,iitt上矩形的高为()iiivfxyh24(]-1,iittiyivl(3)作频率直方图:在每个小区间上,以小区间为底、为高作矩形,矩形面积即为,由个矩形构成的图形就叫做频率直方图.fxn频率直方图近似总体密度函数的图形,愈大,近似程度愈好.且样本容量25例6.2某厂生产圆钉的长度L是一个连续型随及变量,从中抽取100个测量其长度后得数据如下:152.2156.9157.3160.9159.5163.8154.8160.4158.5154.2155.1156.9155.5161.9159.1151.6162.3160.4152.9148.6160.2156.1160.4162.7156.3160.1153.5153.6149.1154.2156.5159.9159.9154.9154.7156.1157.7152.5157.7155.0160.9152.6155.5155.5165.5155.1155.7155.2162.8152.9152.0157.1158.6153.6159.8150.9158.3153.3158.5150.5157.2155.8159.9152.0161.1152.5155.0156.7157.5153.7164.7150.0155.0158.9163.7151.5164.4148.1156.0163.6152.7153.8156.9152.7160.7151.1154.1150.8147.0155.6158.8151.8165.8148.5161.2153.8151.3150.5154.0149.6试作出试验数据的频率直方图.26解147.0m165.8M145.95,b165.95a因数据中的最小值,最大值,取将区间[145.95,165.95]10等分,每个小区的长2h将100个数据分为10组,如表6-1所示27表6-1各组范围频数fi频率νi=fi/100yi=νi/2145.95~147.9510.010.005147.95~149.9550.050.025149.95~151.95100.100.050151.95~153.95160.160.080153.95~155.95200.200.100155.95~157.95150.150.075157.95~159.95120.120.060159.95~161.95100.100.050161.95~163.9560.060.030163.95~165.9550.050.02528频率直方图如图6-1从直观上看,直方图的上边近似于正态概率密度曲线.145.950.025oxfi/n0.050.0750.1149.95153.95157.95161.95165.95图6-129三.经验分布函数12,,,nxxxxx设总体X的分布函数F(x)是未知的,且为X的一个样本值.对任意实数样本值中不超过则称Fn(x)为经验分布函数.的数据的频数记为m(x),作Fn(x)=m(x)/n,(6.4)上面介绍了利用频率直方图来近似地求总体X的概率密度,现介绍另一种方法,无论总体X是怎么样的随机变量都可以用,这就是根据总体X的样本作出X的“经验分布函数”,它是总体X的分布函数的良好近似。30例6.3设总体X为100个同类铸件中每个铸件上沙眼的个数.从中任取7个铸件,检查每个铸件上的沙眼数,得样本值0,3,2,1,1,0,1.试求相应的经验分布函数.解:样本值中有四个不同的数值0,1,2,3,它们的频数依次为2,3,1,1.310,0,2,01,75,12,76,23,71,3.nxxFxxxx相应的经验分布函数为32oxFn(x)1232/75/76/71oxFn(x)1232/75/76/71图6—2nyFx的图形是一条不降的阶梯形曲线(图6-2).33四、统计量1.统计量的定义.),,,(,,,,,),,,(,,,,21212121计量是一个统则称不含未知参数中若的函数是的一个样本是来自总体设nnnnXXXffXXXXXXfXXXX由样本推断总体特征,需要对样本值进行“加工”,“提炼”.这就需要构造一些样本的函数,它把样本中所含的信息集中起来.34?,,,,),(,,22321哪些不是些是统计量判断下列各式哪为未知为已知其中样本的一个是来自总体设NXXX,11XT,3212XeXXT),(313213XXXT),,,max(3214XXXT,2215XXT).(123222126XXXT是不是例6.4.),,,(),,,(,,,,,,,21212121的观察值是则称的样本值是相应于样本设nnnnXXXfxxxfXXXxxx352.几个常用统计量(样本矩)的定义.,,,,,,,2121是这一样本的观察值是来自总体的一个样本设nnxxxXXX(1)样本平均值;11niiXnX(2)样本方差niiXXnS122)(11.11niixnx其观察值它反映了总体均值的信息它反映了总体方差的信息.11122niiXnXn36其观察值niinxxns122)(11.11122niixnxn(3)样本标准差;11122niiXXnSS其观察值.)(1112niixxns37(4)样本k阶(原点)矩;,2,1,11
本文标题:6.1随机样本和统计量
链接地址:https://www.777doc.com/doc-5001807 .html