您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 5 几种常见概率分布
Today:2020/1/18第五章常见概率分布律难度级:Today:2020/1/18第一节二项分布第二节泊松分布第三节正态分布第四节其他概率分布律内容提要Today:2020/1/18教学重点:1.正态分布、二项分布、泊松分布的概率计算方法及应用;2.正态分布标准化的方法3.正态分布表、t值表的用法教学要求:掌握正态分布、二项分布、泊松分布的概率计算方法及应用Today:2020/1/18一、贝努利试验及其概率公式(一)独立试验和贝努利试验对于n次独立的试验,如果每次试验结果出现且只出现对立事件与之一;在每次试验中出现A的概率是常数p(0p1),因而出现对立事件的概率是1-p=q,则称这一串重复的独立试验为n重贝努利试验,简称贝努利试验。AAA第一节二项分布(Binomialdistribution)Today:2020/1/18(二)二项分布的概率在n重贝努利试验中,事件A发生x次的概率恰好是(q+p)n二项展开式中的第x+1项,因此将称作二项概率公式。二、二项分布的意义及其性质(一)定义设随机变量X所有可能取的值为零和正整数:0,1,2,…,n,且有(其中p0,q0,p+q=1),则称随机变量X服从参数为n和p的二项分布,记为n.....,,,k,qp)k(PknkknnC210==-n.....,,,k,qp)k(P)kX(PknkknnnC210====-)p,n(B~xToday:2020/1/18(二)二项分布的性质二项分布是一种离散型随机变量的概率分布,由n和p两个参数决定,参数n称为离散参数,只能取正整数;p是连续参数,取值为0与1之间的任何数值。二项分布具有概率分布的一切性质,即:(k=0,1,2,…,n)二项分布的概率之和等于1,即:0≥(k)P=k)=P(Xn10=+=∑=nnkknkkn)pq(qpC-Today:2020/1/18m0=kknkknnqpC=m)≤(kP=m)≤P(Xnm=kk-nkknnqpC=m)≥(kP=m)≥P(X)≤()≤≤()≤≤(21-212121mmqpCmkmPmXmPmmkknkknn二项分布的性质Today:2020/1/18三、二项分布的平均数与标准差统计学证明,服从二项分布B(n,p)的随机变量之平均数μ、标准差σ与参数n、p有如下关系:当试验结果以事件A发生次数k表示时当试验结果以事件A发生的频率k/n表示时,也称率的标准误。pnpq=σnp=μ/n(pq)=σp=μppToday:2020/1/18四、二项分布的概率计算及其应用条件(一)概率计算直接利用二项概率公式[例6]有一批种蛋,其孵化率为0.85,今在该批种蛋中任选6枚进行孵化,试给出孵化出小鸡的各种可能情况的概率。这个问题属于贝努里模型(?),其中,孵化6枚种蛋孵出的小鸡数x服从二项分布.其中x的可能取值为0,1,2,3,4,5,6。6=n0.15=0.85-1=q0.85,=p)85.0,6(BToday:2020/1/180000113901501508500660066.).().().(C)(P===0003872801508506150850151161166.).().().().(C)(P===-00548648015085015150850242262266.).().().().(C)(P===-04145344015085020150850333363366.).().().().(C)(P===-17617711015085015150850424464466.).().().().(C)(P===-3993347801508506150850515565566.).().().().(C)(P===-37714952085015085066066666.).().().(C)(P===-思考:求至少孵出3只小鸡的概率是多少?孵出的小鸡数在2-5只之间的概率是多大?其中:Today:2020/1/18【例4.10】设在家畜中感染某种疾病的概率为20%,现有两种疫苗,用疫苗A注射了15头家畜后无一感染,用疫苗B注射15头家畜后有1头感染。设各头家畜没有相互传染疾病的可能,问:应该如何评价这两种疫苗?假设疫苗A完全无效,那么注射后的家畜感染的概率仍为20%,则15头家畜中染病头数x=0的概率为0352.080.020.0)0(150015CxpToday:2020/1/18同理,如果疫苗B完全无效,则15头家畜中最多有1头感染的概率为由计算可知,注射A疫苗无效的概率为0.0352,比B疫苗无效的概率0.1671小得多。因此,可以认为A疫苗是有效的,但不能认为B疫苗也是有效的。1671.08.02.08.02.0)1(141115150015CCxpToday:2020/1/18(二)应用条件(三个)n个观察单位的观察结果互相独立;各观察单位只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料。已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-P=q,实际中要求p是从大量观察中获得的比较稳定的数值。Today:2020/1/18要观察到这类事件,样本含量n必须很大。在生物、医学研究中,服从泊松分布的随机变量是常见的。此外,由于泊松分布是描述小概率事件的,因而二项分布中当p很小n很大时,可用泊松分布Today:2020/1/18泊松分布是用来描述和分析稀有事件即小概率事件分布规律的函数。在生物、医学研究中,服从波松分布的随机变量是常见的。如,一定种群中某种患病率很低的非传染性疾病患病数或死亡数,种群中遗传的畸形怪胎数,每升饮水中大肠杆菌数,计数器小方格中血球数,单位空间中某些野生动物或昆虫数等,都是服从波松分布的。第二节泊松分布PossiondistributionToday:2020/1/18一、泊松分布的意义(一)定义若随机变量X(X=k)只取零和正整数值,且其概率分布为则称X服从参数为λ的泊松分布,记为X~P(λ)。(二)特征μ=σ2=λ2.7182=e0;λ;0,1,=kek!λ=k)=P(Xλk-Today:2020/1/18•【例4.13】调查某种猪场闭锁育种群仔猪畸形数,共记录200窝,畸形仔猪数的分布情况如表4-3所示。试判断畸形仔猪数是否服从波松分布。Today:2020/1/18表4-3畸形仔猪数统计分布样本均数和方差S2计算结果如下:=Σfk/n=(120×0+62×1+15×2+2×3+1×4)/200S2=0.51x=0.51,S2=0.52,这两个数是相当接近的,因此可以认为畸形仔猪数服从波松分布。xx52.01200200/)10241322151620120(1/)(222222222nnfkfksToday:2020/1/18λ是波松分布所依赖的唯一参数。λ值愈小分布愈偏倚,随着λ的增大,分布趋于对称。当λ=20时分布接近于正态分布;当λ=50时,可以认为波松分布呈正态分布。所以在实际工作中,当λ≥20时就可以用正态分布来近似地处理波松分布的问题。Today:2020/1/18二、波松分布的概率计算由(4-23)式可知,波松分布的概率计算,依赖于参数λ的确定,只要参数λ确定了,把k=0,1,2,…代入(4-23)式即可求得各项的概率。但是在大多数服从波松分布的实例中,分布参数λ往往是未知的,只能从所观察的随机样本中计算出相应的样本平均数作为λ的估计值,将其代替(4-23)式中的λ,计算出k=0,1,2,…时的各项概率。Today:2020/1/18•如【例4.13】中已判断畸形仔猪数服从波松分布,并已算出样本平均数=0.51。将0.51代替公式(4-23)中的λ得:•(k=0,1,2,…)•因为e-0.51=1.6653,所以畸形仔猪数各项的概率为:•P(x=0)=0.510/(0!×1.6653)=0.6005•P(x=1)=0.511/(1!×1.6653)=0.3063•P(x=2)=0.512/(2!×1.6653)=0.078151.0!51.0)(ekkxPkP(x=3)=0.513/(3!×1.6653)=0.0133P(x=4)=0.514/(4!×1.6653)=0.0017把上面各项概率乘以总观察窝数(n=200)即得各项按波松分布的理论窝数。波松分布与相应的频率分布列于表4-4中。0001.09999.01)(1)4(40kkxpxPToday:2020/1/18•表4-4畸形仔猪数的波松分布将实际计算得的频率与根据λ=0.51的泊松分布计算的概率相比较,发现畸形仔猪的频率分布与λ=0.51的波松分布是吻合得很好的。这进一步说明了畸形仔猪数是服从波松分布的。【例4.14】为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如下:试分析饮用水中细菌数的分布是否服从波松分布。若服从,按波松分布计算每毫升水中细菌数的概率及理论次数并将頻率分布与波松分布作直观比较。Today:2020/1/18经计算得每毫升水中平均细菌数=0.500,方差S2=0.496。两者很接近,故可认为每毫升水中细菌数服从波松分布。以=0.500代替(4-23)式中的λ,得(k=0,1,2…)计算结果如表4—5所示。x5.0!5.0)(ekkxPkxx表4—5细菌数的波松分布可见细菌数的频率分布与λ=0.5的波松分布是相当吻合的,进一步说明用波松分布描述单位容积(或面积)中细菌数的分布是适宜的。Today:2020/1/18注意,二项分布的应用条件也是波松分布的应用条件。比如二项分布要求n次试验是相互独立的,这也是波松分布的要求。然而一些具有传染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,所以不符合波松分布的应用条件。对于在单位时间、单位面积或单位容积内,所观察的事物由于某些原因分布不随机时,如细菌在牛奶中成集落存在时,亦不呈波松分布。Today:2020/1/18一、正态分布的定义及其特征(一)定义若连续性随机变量X的概率分布密度函数为:其中,µ为平均数,σ2为方差,则称随机变量χ服从正态分布,记为χ~(µ,σ2).相应的概率分布函数为第三节正态分布normaldistribution0σ,∞+x∞,eπ2σ1=f(x)22σ2μ)(x---x∞σ2μ)(x22eπ2σ1=F(x)---Today:2020/1/18(二)特征正态分布密度曲线是以χ=µ为对称轴的单峰、对称的悬钟形;f(x)在χ=µ处达到极大值,极大值为f(x)是非负数,以x轴为渐进线;正态分布密度函数曲线π2σ1=μf)(Today:2020/1/18正态分布有两个参数,即平均数µ和标准差σ。µ是位置参数,σ是变异度参数。分布密度曲线与横轴所夹的面积为1,即:正态分布密度函数曲线特征1=dxeπ2σ1=)∞+xP22σ2μ)(x∞+∞---(-Today:2020/1/18μ相同而σ不同的三个正态总体σ相同而μ不同的三个正态总体特征Today:2020/1/18(一)定义称µ=0,σ2=1的正态分布为标准正态分布。标准正态分布的概率密度函数及分布函数如下:若随机变量µ服从标准正态分布,记作μ~(0,1)μ∞2μ-2μ-dμeπ2σ1=Φ(μ),eπ2σ1)=(μ22二、标准正态分布standardnormaldistributionToday:2020/1/18(二)标准化的方法对于任何一个服从正态分布(μ,σ2)的随机变量χ,都可以通过标准化变换:u=(χ-μ)/σ即减平均数后再除以标准差,将其变换为服从标准正态分布的随机变量μ。对不同的μ及P(Uu)值编成函数表,称为正态分布表,从中可以查到任意一个区间内曲线下的面积,即为概率。Today:2020/1/18三、正态分布的概率计算(一)标准正态分布的概率计设u
本文标题:5 几种常见概率分布
链接地址:https://www.777doc.com/doc-3148651 .html