您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 003理论分布与抽样分布28
第三章理论分布与抽样分布1、概率分布4、正态分布2、二项分布5、抽样分布3、泊松分布1概率分布事件的概率表示了一次试验某一个结果发生的可能性大小。若要全面了解试验,则必须知道试验的全部可能结果及各种可能结果发生的概率,即必须知道随机试验的概率分布(probabilitydistribution)。为了深入研究随机试验,我们先引入随机变量(randomvariable)的概念。1.1随机变量作一次试验,其结果有多种可能。每一种可能结果都可用一个数来表示,把这些数作为变量x的取值范围,则试验结果可用变量x来表示。【例3.3】对100头病畜用某种药物进行治疗,其可能结果是“0头治愈”、“1头治愈”、“2头治愈”、“…”、“100头治愈”。若用x表示治愈头数,则x的取值为0、1、2、…、100。1.1随机变量【例3.4】孵化一枚种蛋可能结果只有两种,即“孵出小鸡”与“未孵出小鸡”。若用变量x表示试验的两种结果,则可令x=0表示“未孵出小鸡”,x=1表示“孵出小鸡”。【例3.5】测定某品种猪初生重,表示测定结果变量x所取的值为一个特定范围(a,b),如0.5―1.5kg,x值可以是这个范围内的任何实数。1.1随机变量如果表示试验结果的变量x,其可能取值至多为可列个,且以各种确定的概率取这些不同的值,则称x为离散型随机变量(discreterandomvariable);如果表示试验结果的变量x,其可能取值为某范围内的任何数值,且x在其取值范围内的任一区间中取值时,其概率是确定的,则称x为连续型随机变量(continuousrandomvariable)。1.2离散型随机变量的概率分布要了解离散型随机变量x的统计规律,就必须知道它的一切可能值xi及取每种可能值的概率pi。如果我们将离散型随机变量x的一切可能取值xi(i=1,2,…),及其对应的概率pi,记作P(x=xi)=pii=1,2,…则称上式为离散型随机变量x的概率分布或分布。常用分布列(distributionseries)来表示离散型随机变量:1.2离散型随机变量的概率分布x1x2…xn….p1p2…pn…显然,离散型随机变量的概率分布具有以下两个基本性质:1.pi≥02.Σpi=11.3连续型随机变量的概率分布连续型随机变量(如体长、体重、蛋重)的概率分布不能用分布列来表示,因为其可能取的值是不可数的。我们改用随机变量x在某个区间内取值的概率P(a≤xb)来表示。下面通过频率分布密度曲线予以说明。1.3连续型随机变量的概率分布126头基础母羊的体重的次数分布表组别组中值次数(f)36.037.5139.040.5142.043.5645.046.51848.049.52651.052.52754.055.52657.058.51260.061.5763.064.52合计126图中纵坐标取频率与组距的比值。可以设想,如果样本取得越来越大(n→+∞),组分得越来越细(i→0),某一范围内的频率将趋近于一个稳定值─概率。这时,频率分布直方图各个直方上端中点的联线─频率分布折线将逐渐趋向于一条曲线。1.3连续型随机变量的概率分布换句话说,当n→+∞、i→0时,频率分布折线的极限是一条稳定的函数曲线。对于样本是取自连续型随机变量的情况,这条函数曲线将是光滑的。这条曲线排除了抽样和测量的误差,完全反映了基础母羊体重的变动规律。这条曲线叫概率分布密度曲线,相应的函数叫概率分布密度函数。1.3连续型随机变量的概率分布若记体重概率分布密度函数为f(x),则x取值于区间[a,b)的概率为图中阴影部分的面积,即P(a≤xb)=上式为连续型随机变量x在区间[a,b)上取值概率的表达式。可见,连续型随机变量的概率由概率分布密度函数确定。badxxf)(1.3连续型随机变量的概率分布连续型随机变量概率分布的性质:1、分布密度函数总是大于或等于0,即f(x)≥0;2、当随机变量x取某一特定值时,其概率等于0;即(c为任意实数)3、在一次试验中随机变量x之取值必在[-∞,+∞]范围内,为一必然事件。所以上式表示分布密度曲线下、横轴上的全部面积为1。ccdxxfcxP0)()(1)()(dxxfxP2二项分布2.1贝努利试验及其概率公式将某随机试验重复进行n次,若各次试验结果互不影响,即每次试验结果出现的概率都不依赖于其它各次试验的结果,则称这n次试验是独立的。2.1贝努力试验及其概率公式对于n次独立的试验,如果每次试验结果出现且只出现对立事件A与之一,在每次试验中出现A的概率是常数p(0p1),因而出现对立事件的概率是1-p=q,则称这一串重复的独立试验为n重贝努利试验,简称贝努利试验(Bernoullitrials)。AA2.1贝努力试验及其概率公式在n重贝努利试验中,事件A可能发生0,1,2,…,n次,现在我们来求事件A恰好发生k(0≤k≤n)次的概率Pn(k)。先取n=4,k=2来讨论。在4次试验中,事件A发生2次的方式有以下种:24C4321AAAA4321AAAA4321AAAA4321AAAA4321AAAA4321AAAA2.1贝努力试验及其概率公式其中Ak(k=1,2,3,4)表示事件A在第k次试验发生;(k=1,2,3,4)表示事件A在第k次试验不发生。由于试验是独立的,按概率的乘法法则,于是有P()=P()=…=P()=P()·P()·P()·P()=kA4321AAAA4321AAAA4321AAAA1A2A3A4A242qp2.1贝努力试验及其概率公式又由于以上各种方式中,任何二种方式都是互不相容的,按概率的加法法则,在4次试验中,事件A恰好发生2次的概率为P4(2)=P()+P()+…+P()=4321AAAA4321AAAA4321AAAA24224qpC2.1贝努力试验及其概率公式一般,在n重贝努利试验中,事件A恰好发生k(0≤k≤n)次的概率为k=0,1,2…,n若把上式与二项展开式相比较就可以发现,在n重贝努利试验中,事件A发生k次的概率恰好等于展开式中的第k+1项,所以也把上式称作二项概率公式。knkkknqpCkP)(nkknkknnqpCpq0)(2.2二项分布的意义及性质2.2.1二项分布定义设随机变量x所有可能取的值为零和正整数:0,1,2,…,n,且有=k=0,1,2…,n其中p>0,q>0,p+q=1,则称随机变量x服从参数为n和p的二项分布(binomialdistribution),记为x~B(n,p)。)(kPnknCknkqp2.2.1二项分布的定义二项分布是一种离散型随机变量的概率分布。参数n称为离散参数,只能取正整数;参数p称为连续参数,它能取0与1之间的任何数值(q由p确定,故不是另一个独立参数)。2.2.2二项分布的性质二项分布具有概率分布的一切性质,即:1、P(x=k)=Pn(k)(k=0,1,…,n)2、二项分布的概率之和等于1,即3、4、5、(m1m2)1)(0nnkknkknpqqpCmkknkknnqpCmkPmxP0)()(21)()(2121mmkknkknnqpCmkmpmxmP2.2.2二项分布的性质二项分布由n和p两个参数决定:1、当p值较小且n不大时,分布是偏倚的。但随着n的增大,分布逐渐趋于对称,如图1所示;2、当p值趋于0.5时,分布趋于对称,如图2所示;图1n值不同的二项分布比较图2p值不同的二项分布比较图1n值不同的二项分布比较图1n值不同的二项分布比较图2p值不同的二项分布比较图1n值不同的二项分布比较图2p值不同的二项分布比较图1n值不同的二项分布比较图1n值不同的二项分布比较图2p值不同的二项分布比较2.2.2二项分布的性质3、对于固定的n及p,当k增加时,Pn(k)先随之增加并达到其极大值,以后又下降。此外,在n较大,np、nq较接近时,二项分布接近于正态分布;当n→∞时,二项分布的极限分布是正态分布。2.3二项分布的概率计算【例2.1】纯种白猪与纯种黑猪杂交,根据孟德尔遗传理论,子二代中白猪与黑猪的比率为3∶1。求窝产仔10头,有7头白猪的概率。解:根据题意,n=10,p=3/4=0.75,q=1/4=0.25。设10头仔猪中白色的为x头,且x~B(10,0.75)于是窝产10头仔猪中有7头是白色的概率为:2503.025.075.0!3!7!1025.075.0)7(3737710CxP2.3二项分布的概率计算【例2.2】设在家畜中感染某种疾病的概率为20%,现有两种疫苗,用疫苗A注射了15头家畜后无一感染,用疫苗B注射15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能,问:应该如何评价这两种疫苗?2.3二项分布的概率计算解:假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20%,则15头家畜中染病头数x=0的概率为同理,如果疫苗B完全无效,则15头家畜中最多有1头感染的概率为由计算可知,注射A疫苗无效的概率为0.0352,比B疫苗无效的概率0.1671小得多。因此,可以认为A疫苗是有效的,但不能认为B疫苗也是有效的。0352.080.020.0)0(150015Cxp1671.08.02.08.02.0)1(141115150015CCxp2.4二项分布的应用条件(1)各观察单位只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料;(2)已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-p=q,即p+q=1。实际中要求p是从大量观察中获得的比较稳定的数值;(3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。2.5二项分布的平均数与标准差统计学证明,服从二项分布B(n,p)的随机变量之平均数μ、标准差σ与参数n、p有如下关系:(1)当试验结果以事件A发生次数k表示时μ=npσ=npq2.5二项分布的平均数与标准差(2)当试验结果以事件A发生的频率k/n表示时也称为总体百分数标准误,当p未知时,常以样本百分数来估计。此时上式改写为:=称为样本百分数标准误。ppnpq/)(pSppˆnqp/)ˆˆ(pqˆ1ˆpS3泊松分布波松分布是一种可以用来描述和分析随机地发生在单位空间或时间里的稀有事件的概率分布。要观察到这类事件,样本含量n必须很大。在生物、医学研究中,服从波松分布的随机变量是常见的。如,畜群中遗传的畸形怪胎数,每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆虫数等,都是服从波松分布的。3.1泊松分布的定义及特点3.1.1泊松分布的定义若随机变量x(x=k)只取零和正整数值0,1,2,…,且其概率分布为,k=0,1,2,……其中λ>0;e=2.7182…是自然对数的底数,则称x服从参数为λ的泊松分布(Poisson’sdistribution),记为x~P(λ)。ekkxPk!)(3.1泊松分布的定义及特点3.1.2泊松分布的特点泊松分布作为一种离散型随机变量的概率分布,理论上已经证明其均值与方差相等、即μ=σ2=λ这是泊松分布的一个显著特点。利用这个特点可以初步判断一个随机变量是否服从泊松分布。3.1泊松分布的定义及特点3.1.2泊松分布的特点λ是泊松分布小所依赖的惟一参数,λ越小分布越偏,随着λ的增加,分布趋于对称。3.2泊松分布的概率计算【例3-1】食品店每小时光顾的顾客人数服从λ=3的泊松分布,即x~P(3)分布。(1)计算每小时恰有5名顾客的概率。(2)lh内顾客不超过5人的概率。(3)lh内顾客最少有6人的概率。3.2泊松分布的概率计算解:设x表示商店每小时接待顾客的人数①P(x=k=5)=②P(x=k≤5)=③P(x=k≥6)=1008.0!53!35ekek916.0!50kkke6084.0)5(1!kkkxPk
本文标题:003理论分布与抽样分布28
链接地址:https://www.777doc.com/doc-416690 .html