您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第三节连续型随机变量及其分布
1第三节连续型随机变量及其分布上一节我们研究了离散型随机变量,这类随机变量的特点是它的可能取值及其相对应的概率能被逐个地列出.这一节我们将要研究的连续型随机变量就不具有这样的性质了.连续型随机变量的特点是它的可能取值连续地充满某个区间甚至整个数轴.例如,测量一个工件长度,因为在理论上说这个长度的值X可以取区间(0,+∞)上的任何一个值.此外,连续型随机变量取某特定值的概率总是零(关于这点将在以后说明).例如,抽检一个工件其长度X丝毫不差刚好是其固定值(如1.824cm)的事件{X=1.824}几乎是不可能的,应认为P{X=1.824}=0.因此讨论连续型随机变量在某点的概率是毫无意义的.于是,对于连续型随机变量就不能用对离散型随机变量那样的方法进行研究了.为了说明方便我们先来看一个例子.例2.8一个半径为2米的圆盘靶,设击中靶上任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离,试求随机变量X的分布函数.解1°若x<0,因为事件{X≤x}是不可能事件,所以F(x)=P{X≤x}=0.2°若0≤x≤2,由题意P{0≤X≤x}=kx2,k是常数,为了确定k的值,取x=2,有P{0≤X≤2}=22k,但事件{0≤X≤2}是必然事件,故P{0≤X≤2}=1,即22k=1,所以k=1/4,即P{0≤X≤x}=x2/4.于是F(x)=P{X≤x}=P{X<0}+P{0≤X≤x}=x2/4.3°若x≥2,由于{X≤2}是必然事件,于是F(x)=P{X≤x}=1.综上所述F(x)=,2,1,20,41,0,02xxxx它的图形是一条连续曲线如图22所示.图22另外,容易看到本例中X的分布函数F(x)还可写成如下形式:F(x)=ttfxd)(,其中f(t)=.,0,20,21其他tt这就是说F(x)恰好是非负函数f(t)在区间(∞,x]上的积分,这种随机变量X我们称为连续型随机变量.一般地有如下定义.定义2.3若对随机变量X的分布函数F(x),存在非负函数f(x),使对于任意实数x有F(x)=xxtfd)(,(2.8)则称X为连续型随机变量,其中f(x)称为X的概率密度函数,简称概率密度或密度函数2(Densityfunction).由(2.8)式知道连续型随机变量X的分布函数F(x)是连续函数.由分布函数的性质F(∞)=0,F(+∞)=1及F(x)单调不减,知F(x)是一条位于直线y=0与y=1之间的单调不减的连续(但不一定光滑)曲线.由定义2.3知道,f(x)具有以下性质:1°f(x)≥0;2°xxfd)(=1;3°P{x1<X≤x2}=F(x2)F(x1)=21d)(xxxxf(x1≤x2);4°若f(x)在x点处连续,则有F′(x)=f(x).由2°知道,介于曲线y=f(x)与y=0之间的面积为1.由3°知道,X落在区间(x1,x2]的概率P{x1<X≤x2}等于区间(x1,x2]上曲线y=f(x)之下的曲边梯形面积.由4°知道,f(x)的连续点x处有f(x)=.}{)()(limlim00xxxXxPxxFxxFxx这种形式恰与物理学中线密度定义相类似,这也正是为什么称f(x)为概率密度的原因.同样我们也指出,反过来,任一满足以上1°、2°两个性质的函数f(x),一定可以作为某个连续型随机变量的密度函数.前面我们曾指出对连续型随机变量X而言它取任一特定值a的概率为零,即P{X=a}=0,事实上,令Δx>0,设X的分布函数为F(x),则由{X=a}{aΔx<X≤a},得0≤P{X=a}≤P{aΔx<X≤a}=F(a)F(aΔx).由于F(x)连续,所以)(lim0xaFx=F(a).当Δx→0时,由夹逼定理得P{X=a}=0,由此很容易推导出P{a≤X<b}=P{a<X≤b}=P{a≤X≤b}=P{a<X<b}.即在计算连续型随机变量落在某区间上的概率时,可不必区分该区间端点的情况.此外还要说明的是,事件{X=a}“几乎不可能发生”,但并不保证绝不会发生,它是“零概率事件”而不是不可能事件.例2.9设连续型随机变量X的分布函数为F(x)=.1,1,10,,0,02xxAxx试求:(1)系数A;(2)X落在区间(0.3,0.7)内的概率;(3)X的密度函数.解(1)由于X为连续型随机变量,故F(x)是连续函数,因此有31=F(1)=20101limlim)(AxxFxx=A,即A=1,于是有F(x)=.1,1,10,,0,02xxxx(2)P{0.3X0.7}=F(0.7)F(0.3)=(0.7)2(0.3)2=0.4;(3)X的密度函数为f(x)=F′(x)=.,0;10,2其他xx由定义2.3知,改变密度函数f(x)在个别点的函数值,不影响分布函数F(x)的取值,因此,并不在乎改变密度函数在个别点上的值(比如在x=0或x=1上f(x)的值).例2.10设随机变量X具有密度函数f(x)=.,0,43,22,30,其他xxxkx(1)确定常数k;(2)求X的分布函数F(x);(3)求P{1X≤72}.解(1)由xxfd)(=1,得xxxkxd)22(d4330=1,解得k=1/6,故X的密度函数为f(x)=.,0,43,22,30,6其他xxxx(2)当x0时,F(x)=P{X≤x}=xttfd)(=0;当0≤x3时,F(x)=P{X≤x}=xttfd)(=00d)(d)(xttfttf=12d620xttx;当3≤x4时,F(x)=P{X≤x}=xttfd)(=0303()()()xftdtftdtftdt=2303(2)23;624xttxdtdtx4当x≥4时,F(x)=P{X≤x}=xttfd)(=030434d)(d)(d)(d)(xttfttfttfttf=ttttd)22(d64330=1.即F(x)=.4,1,43,324,30,12,0,022xxxxxxx(3)P{1X≤7/2}=F(7/2)F(1)=41/48.下面介绍三种常见的连续型随机变量.(1)均匀分布若连续型随机变量X具有概率密度f(x)=.,0,,1其他bxaab(2.9)则称X在区间(a,b)上服从均匀分布(Uniformdistribution),记为X~U(a,b).易知f(x)≥0且baxabxxfd1d)(=1.由(2.9)可得1°P{X≥b}=bxd0=0,P{X≤a}=axd0=0,即P{aXb}=1P{X≥b}P{X≤a}=1;2°若a≤cd≤b,则P{cXd}=abcdxabdcd1.因此,在区间(a,b)上服从均匀分布的随机变量X的物理意义是:X以概率1在区间(a,b)内取值,而以概率0在区间(a,b)以外取值,并且X值落入(a,b)中任一子区间(c,d)中的概率与子区间的长度成正比,而与子区间的位置无关.由(2.8)易得X的分布函数为F(x)=.,1,,,,0bxbxaabaxax(2.10)密度函数f(x)和分布函数F(x)的图形分别如图23和图24所示.5图23图24在数值计算中,由于四舍五入,小数点后第一位小数所引起的误差X,一般可以看作是一个服从在[0.5,0.5]上的均匀分布的随机变量;又如在(a,b)中随机掷质点,则该质点的坐标X一般也可看作是一个服从在(a,b)上的均匀分布的随机变量.例2.11某公共汽车站从上午7时开始,每15分钟来一辆车,如某乘客到达此站的时间是7时到7时30分之间的均匀分布的随机变量,试求他等车少于5分钟的概率.解设乘客于7时过X分钟到达车站,由于X在[0,30]上服从均匀分布,即有f(x)=.,0,300,301其他x显然,只有乘客在7∶10到7∶15之间或7∶25到7∶30之间到达车站时,他(或她)等车的时间才少于5分钟,因此所求概率为P{10<X≤15}+P{25<X≤30}=15103025d301d301xx=1/3.(2)指数分布若随机变量X的密度函数为f(x)=.00,,0,exxx(2.11)其中λ0为常数,则称X服从参数为λ的指数分布(Exponentiallydistribution),记作X~E(λ).显然f(x)≥0,且xxxfxded)(0=1.容易得到X的分布函数为F(x)=.00,,0,e1xxx指数分布最常见的一个场合是寿命分布.指数分布具有“无记忆性”,即对于任意s,t0,有P{Xs+t|Xs}=P{Xt}.(2.12)如果用X表示某一元件的寿命,那么上式表明,在已知元件已使用了s小时的条件下,它还能再使用至少t小时的概率,与从开始使用时算起它至少能使用t小时的概率相等.这就是说元件对它已使用过s小时没有记忆.当然,指数分布描述的是无老化时的寿命分布,但“无老化”是不可能的,因而只是一种近似.对一些寿命长的元件,在初期阶段老化现象很小,在这一阶段,指数分布比较确切地描述了其寿命分布情况.(2.12)式是容易证明的.事实上,(){,}{}{}{}{}1()ee{}.1()esttλsPXsXstPXstPXstXsPXsPXsFstPXtFs-(3)正态分布若连续型随机变量X的概率密度为6f(x)=222)(eπ21x,∞<x<+∞,(2.13)其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ的正态分布(Normaldistribution),记为X~N(μ,σ2).显然f(x)≥0,下面来证明xxfd)(=1.令ux=t,得到.deπ21deπ2122)(222txtx记I=ttde22,则有I2=dsde222tst.作极坐标变换:s=rcosθ,t=rsinθ,得到I2=22π202rredrdπ,而I0,故有I=2π,即有.π2de22tt于是.1π2π21de21222)(xx正态分布是概率论和数理统计中最重要的分布之一.在实际问题中大量的随机变量服从或近似服从正态分布.只要某一个随机变量受到许多相互独立随机因素的影响,而每个个别因素的影响都不能起决定性作用,那么就可以断定随机变量服从或近似服从正态分布.例如,因人的身高、体重受到种族、饮食习惯、地域、运动等等因素影响,但这些因素又不能对身高、体重起决定性作用,所以我们可以认为身高、体重服从或近似服从正态分布.参数μ,σ的意义将在第四章中说明.f(x)的图形如图25所示,它具有如下性质:图25图261°曲线关于x=μ对称;2°曲线在x=μ处取到最大值,x离μ越远,f(x)值越小.这表明对于同样长度的区间,当区间离μ越远,X落在这个区间上的概率越小;3°曲线在μ±σ处有拐点;4°曲线以x轴为渐近线;75°若固定μ,当σ越小时图形越尖陡(图26),因而X落在μ附近的概率越大;若固定σ,μ值改变,则图形沿x轴平移,而不改变其形状.故称σ为精度参数,μ为位置参数.由(2.13)式得X的分布函数F(x)=txtdeπ21-2)(22.(2.14)特别地,当=0,=1时,称X服从标准正态分布N(0,1),其概率密度和分布函数分别用)(x,x表示,即有22eπ21)(xx,(2.15)xtxtdeπ2122.(2.16)易知,(x)=1(x).人们已事先编制了
本文标题:第三节连续型随机变量及其分布
链接地址:https://www.777doc.com/doc-2183652 .html