您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 4. 第三章 几种常见的概率分布律
概率的定义统计定义古典定义概率的运算加法法则条件概率乘法法则随机变量/分布离散型连续型总体特征数数学期望(理论平均数)方差1第三章几种常见的概率分布律23.1二项分布二项分布的概率函数满足二项分布的条件在一随机试验中,每次试验都有两种不同的结果。两种结果是互不相容的。每一种结果在每次试验中都有恒定的概率。试验间应是独立的。(放回式抽样)问题:独立地将此试验重复n次,求在n次试验中,一种结果出现x次的概率是多少?3例3-1:从雌雄各半的100只动物中进行放回式抽样实验,抽样共进行10次,问其中出现3只雄性动物的概率是多少?出现3只及3只以下的概率是多少?即求P(X=3)和P(X≤3)4•抛10次硬币,其中3次国徽朝上的概率是多少?出现3次及3次以下的概率是多少?•抛3次硬币,3次国徽都朝上的概率是多少?规定以下一组符号n=试验次数(或样本含量)抽样进行了10次x=在n次试验中事件A出现的次数3只雄性φ=事件A发生的概率(每次试验都是恒定的)50/100=0.51-φ=事件发生的概率1-0.5=0.5p(x)=X的概率=P(X=x)出现3只雄性的概率函数x=3F(x)=P(X≤x)出现3只及3只一下的概率5A从雌雄各半的100只动物中进行放回式抽样实验,抽样共进行10次,问其中出现3只雄性动物的概率是多少?出现3只及3只以下的概率是多少?即求P(X=3)和P(X≤3)上例中:n=10x=3φ=0.5求p(3)和F(3)若某次抽样中抽到的结果为:mmmfffffff,它的概率为P(mmmfffffff)=φ3(1-φ)7那么抽到3雄7雌的数目相当于从10个元素中抽出3个元素的组合数67331013Cp组合数从m个不同元素中,任取n(n≤m)个元素并成一组7对于任意n和x有以下通式上式称为二项分布的概率函数。该式正是二项展开式的第x+1项,因而产生“二项分布”这一名称。因为φ+(1-φ)=1,所以nxCxpxnxxn,...,2,1,0,)1()(8110nnxxp将x=0,1,2,3代入二项分布概率函数,可得出出现0,1,2,3只雄性动物的概率。P(0)=0.0009766P(1)=0.0097656P(2)=0.0439453P(3)=0.1171876抽到3只和3只以下雄性动物的概率为:F(3)=P(0)+P(1)+P(2)+P(3)=0.17187519服从二项分布的随机变量的特征数平均数:μ=nφ或μ=φ(以比率表示)方差:σ2=nφ(1-φ)或(以比率表示)10n12二项分布应用实例例3-2以杂合基因型Wvwv的小鼠为父本,隐性纯合子小鼠wvwv为母本杂交(wv波浪毛,Wv直毛),后代两种基因型的数目应各占一半(φ=1/2)。实际观察32窝小鼠,只选每窝8只的,多于8只和少于8只的都淘汰(n=8)。试比较样本平均数与总体参数。11表3-2调查结果直毛后代数观测频数(x)(f)fxfx2p(x)Np(x)00000.0039060.12499211110.0312501.00000022480.1093753.5000003412360.2187507.000000412481920.2734378.74998456301500.2187507.00000065301800.1093753.5000007214980.0312501.00000080000.0039060.124992总数N=321396650.99999931.9996812样本平均数、总体平均数;样本方差、总体方差如下21974798.131321396651000000.4218343750.43213922222nNNfxfxsnNfxx13例3-4用棕色正常毛(bbRR)的家兔和黑色短毛(BBrr)兔杂交,F1代为黑色正常毛长的家兔(BbRr),F1代自交,F2代表型比为:9/16B_R_:3/16B_rr:3/16bbR_:1/16bbrr。问最少需要多少F2代家兔,才能以99%的概率得到一个棕色短毛兔?14解:由题意可知棕色短毛兔的概率为1/16,非棕色短毛兔的概率为15/16。设φ=15/16,则1-φ=1/16。在两项分布展开式(p41)中前面n项中每项都包含至少一只棕色短毛兔,因此前n项之和应为99%。最后一项不包含(1-φ),即没有棕色短毛兔,因此该项应等于1%。15于是:n(lg15-lg16)=lg0.01-0.02803n=-2.00000n=71.4即需要72代1601.0)1615()1(0nnnnnC01.0)1615()161(1)1(000nnnC若设φ=1/16,则:3.2泊松分布泊松分布的概率函数在二项分布中,当某事件出现的概率特别小(φ→0),而样本含量又很大(n→∞)时,二项分布就变成泊松分布泊松分布是描述在一定空间、长度、面积、体积或一定时间间隔内,点子散布状况的理想化模型17泊松分布的概率函数为服从泊松分布的随机变量的特征数μ=μ,σ2=μ即:概率函数中的μ不但是它的平均数,而且是它的方差18,2,1,0,!xexxpx例3.5在麦田中,平均每10m2有一株杂草,问每100m2麦田中,有0株、1株、2株、…杂草的概率是多少?19解:先求出每100m2麦田中,平均杂草数μμ=100/10=10株将μ代入泊松分布的概率分布函数中,p(x)=10x/x!e10,即可求出x=0,1,2,…时所相应的概率。20结果如下:21xp(x)≦x≧x10.00050.00051.000020.00230.00270.999530.00760.01030.997340.01890.02920.989750.03780.06700.970860.06310.13010.933070.09010.22020.869980.11260.33280.779890.12510.45790.6672100.12510.58300.5421110.11370.69670.4170120.09480.79150.3033130.07290.86440.2085140.05210.91650.1356150.03470.95120.0835有x颗杂草的概率p(x)=10x/x!e10有小于等于x颗杂草的概率(累加)有多于于等于x颗杂草的概率(1-上一个数值的累计)3.4正态分布两头少,中间多,两侧对称正态分布曲线22μ正态分布的密度函数和分布函数对于平均数是μ,标准差是σ的正态分布,其密度函数为以符号N(μ,σ2)表示平均数为μ,标准差为σ的正态分布0,,21222xexfx23随机变量的值落在任意区间(a,b)内的概率累积分布函数24dxedxedxxfbXaPbaxbaxba222222)(2121dzedzzfxXPxFxzx22221标准正态分布μ=0,σ=1时的正态分布称为标准正态分布,记为N(0,1)标准正态分布的密度函数为累积分布函数25ueuu,2122dueuUPuuu2221-标准正态分布的分布曲线26ueuu,2122-标准正态分布的特性在u=0时φ(u)达到最大值。当u不论向哪个方向远离0时,φ(u)的值都减小。曲线两侧对称,即φ(u)=φ(-u)。曲线在u=-1和u=1处有两个拐点。曲线与横轴所夹面积等于1。27-标准正态分布的累积分布曲线28累积分布曲线围绕点(0,0.5)对称dueuUPuuu2221•标准正态分布表的查法简化计算随机变量(U)的值(u)落在区间(a,b)内的概率正态分布表(附表2):不同u值的Ф(u)值列成表根据以下关系式可以扩展正态分布表的使用范围2912212125.00uuuUuPuuUPuuUPuuUPuuUP例1查u=-0.82及u=1.15时的Ф(u)值30解:由附表2:Ф(-0.82)=0.20611Ф(1.15)=0.87493例2随机变量U服从正态分布N(0,1),问随机变量的值落在0,1.21间的概率是多少?落在-1.96,1.96间的概率是多少?31解:1)P(0Uu)=Ф(1.21)-0.5=0.88686-0.5000=0.386862)P(|U|u)=1-2Ф(-u)=1-2Ф(-1.96)=1-0.05000=0.9500000对于服从N(μ,σ2)的随机变量X,首先要进行标准化变换,使之变为标准正态分布,再按上述方法查表。变换的方法:对于随机变量X32xuxxUPxXP把曲线挪到u=0处例已知高粱品种“三尺三”的株高X服从正态分布N(156.2,4.822),求:1)X161厘米的概率;2)X164厘米的概率;3)X在156-162厘米间的概率。解:由题可知μ和σ分别为156.2cm和4.82cm,3369278.019215.088493.087.02.182.42.15615282.42.156162162152)305262.094738.0162.1182.42.1561641164)284134.0182.42.156161161)1XPXPXP•正态分布的单侧临界值附表2列出的是Uu时标准正态曲线下的面积很多情况下需要求:曲线右侧尾区一定面积(α)下,所对应的u值uαuα称为α的上侧临界值,由附表3查出满足:P(Uuα)=α对于左侧尾区,-uα称为α的下侧临界值满足:P(U-uα)=α34将α平分到两个尾区,每一尾区的曲线下面积只有α/2,记为uα/2,称为α的双侧临界数满足:P(|U|uα/2)=α注意符号的使用:uα——上侧临界值-uα——下侧临界值uα/2——双侧临界值3536正态分布的单侧(上侧)和双侧临界点(α=0.05)u0.05=1.645u0.025=1.9603.6中心极限定理假设所研究的随机变量X可以被表示为许多相互独立的随机变量Xi的和,如果Xi的数量很大,而且每一个别的Xi对于X所起的作用很小,则可以认为X服从或近似地服从正态分布。推论:若已知总体平均数为μ,标准差为σ,那么,不论该总体是否正态分布,对于从该总体所抽取的含量为n的样本,当n充分大,其平均数渐近服从正态分布N(μ,σ2/n)。37作业3.3,3.4,3.12,3.133.15,3.1638
本文标题:4. 第三章 几种常见的概率分布律
链接地址:https://www.777doc.com/doc-3509879 .html