您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 几种常见的概率分布率
第三章几种常见的概率分布离散型概率分布•二项分布(binomialdistribution)•泊松分布(poissondistribution)•超几何分布(hypergeometricprobabilitydistritution)•负二项分布(Negativebinomialdistribution)贝努利试验(Bernoullitrial):我们把只有两种可能观测值(每次试验只可能是两个对立事件之一)的随机试验统称为贝努利试验。这种试验在实际中广泛存在,如观察某一实验动物的卵孵化与否、某一实验动物是雌性还是雄性、实验反应是阴性还是阳性等。n次独立地贝努利试验称为n重贝努利试验,其试验结果的分布(一种结果出现x次的概率是多少的分布)即为二项分布。应用二项分布的重要条件是:每一种试验结果在每次试验中都有恒定的概率,各试验之间是重复独立的。3.1二项分布B(n,p)例:例3.1注意:1)放回式抽样适用于二项分布,非放回式抽样适用于超几何分布;2)通式为:n=试验次数;x=在n次试验中事件A出现的次数p=事件A发生的概率(每次试验都是恒定的)1-p=事件发生的概率P(x)=X的概率函数为P(X=x);F(x)=P(X≤x)AxnxxnppcxP--=)1()(一、服从二项分布的随机变量的特征数平均数:μ=np,μ=p(用比率表示时)方差:(用比率表示时)偏斜度:峭度:从以上公式可以看出二项分布决定于两个参考数:试验次数n和概率P,因此其图形变化趋势与这两个参数有关。npppnp)1(),1(22-=-=)1(211pnpp--=npnp6)1(12--=γ1=3.11γ2=9.50γ1=0γ2=0γ1=0γ2=-0.02γ1=0γ2=-0.20γ1=0.12γ2=0.01γ1=0.27γ2=0.05γ1=0.44γ2=0.19γ1=0.98γ2=0.95γ1=0.84γ2=0.51n=10,p=0.0100.20.40.60.810246810n=100,p=0.0100.10.20.30.40.50255075100n=500,p=0.0100.10.20.30.40.50100200300400500n=10,p=0.1000.10.20.30.40.50246810n=100,p=0.1000.050.10.150.20255075100n=500,p=0.1000.020.040.060.080.10100200300400500n=10,p=0.5000.10.20.30246810n=100,p=0.5000.020.040.060.080.10255075100n=500,p=0.5000.010.020.030.040.050100200300400500例3.2用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔杂交,F1代为黑色正常毛长的家兔(BbRr),F1代自交,F2代表型比为:9/16B_R_:3/16B_rr:3/16bbR_:1/16bbrr。问最少需要多少F2代家兔,才能以99%的概率得到一个棕色短毛兔(bbrr)?解:设p为非棕色短毛兔出现的概率,则1-p就为棕色短毛兔出现的概率。在[p+(1-p)]n的展开式中只有第一项pn无棕色短毛兔出现,因此n值可由pn=1-0.99求出。pn=(15/16)n=0.01n(lg15-lg16)=lg0.01-0.02803n=-2.00000n=71.4二、二项分布应用实例二项分布的应用条件有三:(1)各观察单位只具有互相对立的一种结果,如阳性或阴性,生存或死亡等,属于二项分类资料;(2)已知发生某一结果(如死亡)的概率为p,其对立结果的概率则为1-p=q,实际中要求p是从大量观察中获得的比较稳定的数值;(3)n个观察单位的观察结果互相独立,即每个观察单位的观察结果不会影响到其它观察单位的观察结果。3.2泊松分布P(λ)在生物学研究中,有许多事件出现的概率很小,而样本容量或试验次数却往往很大,即有很小的p值和很大的n值。这时二项分布就变成另外一种特殊的分布,即泊松分布。如,显微镜视野内染色体有变异的细胞计数、单位容积的水中细菌数目的分布、作物种子内杂草的分布以及样方内少见植物的个体数等都属于泊松分布。其概率函数可由二项分布的概率函数推导。一、泊松分布概率函数的推导xnxxnxxnxxnppxxnnnnppxnxnppcxp-------=--=-=)1(!)1()2)(1()1()!(!!)1()((将系数的分子分母同乘以nx)(当n→∞时,系数的极限为1,且nφ=μ)!)1()()11()11(1xpnpnxnxnx-----=xnxpx--=)1(!)(1])1[(!xnppxpx----=ep)(1lim,z)(1limep10pz10z=-=--=exx!平均数:μ=λ方差:σ2=λ偏斜度:峭度:概率函数内的λ,不但是它的平均数,而且是它的方差。λ很大时,γ1和γ2则接近于0,这时的泊松分布近似于正态分布。二、服从泊松分布的随机变量的特征数11=12=三、泊松分布应用实例例3.5在麦田中,平均每10m2有一株杂草,问每100m2麦田中,有0株、1株、2株、…杂草的概率是多少?解:先求出每100m2麦田中,平均杂草数μμ=100/10=10株将μ代入泊松分布的概率密度函数中,p(x)=10x/(x!e10),(e=2.71828)即可求出x=0,1,2,…时所相应的概率。例:为监测饮用水的污染情况,现检验某社区每毫升饮用水中细菌数,共得400个记录如下:试分析饮用水中细菌数的分布是否服从泊松分布,计算每毫升水中细菌数的概率及理论次数并将頻率分布与泊松分布作直观比较。•解:经计算得每毫升水中平均细菌数为0.500x=0.5,s2=0.496,两者相接近,可认为服从泊松分布•代入泊松分布公式1ml水中细菌数0123合计次数f2431203164005.0!5.0)(-==ekkxPk•注意,二项分布的应用条件也是泊松分布的应用条件。比如二项分布要求n次试验是相互独立的,这也是泊松分布的要求。然而一些具有传染性的罕见疾病的发病数,因为首例发生之后可成为传染源,会影响到后续病例的发生,所以不符合泊松分布的应用条件。1ml水中细菌数0123合计实际次数f243120316400频率0.60750.30000.07750.01501.00概率0.60650.30330.07580.01441.00理论频数242.60121.3230.325.764003.3正态分布在生物统计学中,正态分布占有极其重要的地位。许多生物学现象所产生的数据,都服从正态分布。一、正态分布(x—N(μ,σ2))的密度函数与分布函数正态曲线正态分布的规律是数据分布集中在平均数附近,并且在平均数的两侧成对称分布。正态分布密度函数的图像,称为正态曲线。密度函数:分布(累积)函数:0,,21)(222)(-=--xexfxdueduufxXpxFxxu----===222)(21)()()(正态分布密度曲线特点:密度曲线以x=μ直线为对称;x=σ和x=-σ所确定的点为曲线的两个“拐点”;曲线向左、向右无限延伸,以x轴为渐近线;x=μ时,f(x)具有最大值,其值为;σ的大小,决定曲线的“胖”、“瘦”程度(展开程度),σ越小,曲线越“瘦”,数据越集中,σ越大,曲线越“胖”,数据越分散。σ固定时,μ值决定曲线的位置,当μ增大时曲线向右平移,当μ减少时曲线向左平移,但曲线形状不变。21二、标准正态分布--==udeuUPuF2221)()(μ=0,σ=1时的正态分布称为标准正态分布。密度函数:分布函数:-=-ueufu,21)(22-=xu标准正态分布有以下特性:μ=0时,概率密度值最大;概率密度曲线向左、向右无限延伸,以x轴为渐近线;左右对称u=1和u=-1是概率分布曲线的两个拐点;曲线与横坐标轴所夹的图形面积为1;累积分布函数曲线从-∞到0平稳上升,围绕点(0,0.5)对称;标准正态分布的偏斜度γ1和峭度γ2均为零。以下一些特征值很重要:68.27%95.45%99.73%123-3-2-1P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545P(-3≤u<3)=0.9973以下一些特征值很重要:90%95%1.6451.962.58-2.58-1.96-1.64599%P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.99三、正态分布表的查法对于标准正态分布,其累积分布函数值F(u)可直接查表(书p315附表1)得到,其值等于标准正态曲线与横坐标轴从-∞到u所夹的面积,该曲线下的面积即表示随机变量U落入区间(-∞,u)的概率;标准正态分布查表常用的几个关系式:•P(0Uu1)=F(u1)-0.5•P(Uu1)=F(-u1)=1-F(u1)•P(∣U∣u1)=2F(-u1)•P(∣U∣u1)=1-2F(-u1)•P(u1Uu2)=F(u2)-F(u1)uxμ=5σ=109.2正态分布42.01052.9=-=-=xuuμ=0σ=10.42标准正态分布对于一般正态分布,要先进行标准化,再查表;标准化的公式为:-=xu例3.7查标准正态分布u=-0.82及u=1.15时的F(u)的值例3.8随机变量u服从正态分布N(0,1),问随机变量u的值落在(0,1.21)区间的概率?例3.9已知随机变量u服从正态分布N(0,1),问随机变量u的值落在(-1.96,1.96)区间的概率是多少?例3.10已知某高粱品种的株高X服从正态分布N(156.2,4.822),求:00.182.42.156161=-=-x(1)X161cm的概率;(2)X164cm的概率;(3)152X162的概率。62.182.42.156164=-=-x20.182.42.156162=-=-x87.082.42.156152-=-=-x利用公式P(0Uu)=F(u)-0.5利用公式P(∣U∣u)=1-2F(-u)或P(u1Uu2)=F(u2)-F(u1)四、正态分布的单侧分位数和双侧分位数上侧分位数:P(uua)=α时的ua值;下侧分位数:P(u-ua)=α时的ua值;双侧分位数:P(∣u∣ua/2)=α时的ua值(从附表2中以α/2查出的ua即可);大数定律与中心极限定理的应用•样本容量越大,样本统计数与总体参数之差越小。•对于容量大于30的样本,样本均值的分布可以较好地用一个正态分布近似(其中均值为μ,即,样本均值的平均值,标准差为,即,样本均值的标准差)样本容量越大,近似的效果越好。•如果原始总体就是正态分布,则对于任意样本容量n,样本均值都将是正态分布的。nEXCEL在本章内容的应用EXCEL电子表格提供的粘帖函数BINOMDIST计算二项式分布的概率值NORMDIST计算正态分布的累积函数NORMINV计算正态分布累积函数的逆函数NORMSDIST计算标准正态分布的累积函数NORMSINV计算标准正态分布累积函数的逆函数POISSON计算泊松分布的概率AVERAGE计算算术平均值GEOMEAN计算几何平均数MAX计算最大值MEDIAN计算一组给定数字的中位数STDEV计算样本标准差STDEVP计算样本总体的标准差VAR计算样本的方差VARP计算样本总体的方差各种分布函数计算1、二项分布工具mnmmnqpCmP-=)()!(!!mnmnCmn-=平均数、方差和标准差np=npq=2npq=二项分布的概率函数为二项分布函数的概率及累积概率的计算实例已知某种猪病的死亡率为30%,现有10头病猪,如不给予治疗,问死亡4头及死亡4头和4头以下的概率为多少?解:死亡4头的概率计算公式为:200.07.03.0)4(64410=
本文标题:几种常见的概率分布率
链接地址:https://www.777doc.com/doc-3756397 .html