您好,欢迎访问三七文档
当前位置:首页 > 机械/制造/汽车 > 机械/模具设计 > 李贤平-概率论基础-Chap3
第三章随机变量与分布函数3.1随机变量及其分布3.2随机向量,随机向量的独立性3.3随机变量的函数及其分布§3.1随机变量及其分布一、随机变量及分布函数的定义二、分布函数的性质三、离散型随机变量四、连续型随机变量一、随机变量的定义在随机试验中,有些试验结果本身与数值有关(本身就是一个数).例如,掷一颗骰子面上出现的点数;六月份广州的最高温度;每天进入地铁站的人数;昆虫的产卵数;在有些试验中,试验结果看来与数值无关,但我们可以引进一个变量来表示它的各种结果.也就是说,把试验结果数值化.1A=1,如果A发生0,如果A不发生一般地,对任意的随机事件A,都可以引进一个函数({0,1})来表示A是否发生:例如,在抛硬币的试验中,我们可以如下方法将试验结果与数值联系起来,当出现正面时对应数“1”,当出现反面时对应数“0”.这种对应关系在数学上理解为定义了一种实值单值函数..x.Rξ()若对于随机试验E的每一个可能结果ω∈Ω,都有唯一的一个实数值ξ(ω)相对应,则称实值函数ξ(ω)为随机变量,简记为ξ.随机变量(randomvariable,r.v.)的概念12341x2x3x4x而表示随机变量所取的值时,一般采用小写字母x,y,z,w,n等.随机变量通常用大写字母X,Y,Z,W,N,…,或希腊字母,η,ζ,…,等表示在试验之前只知道ξ可能取值的范围,而不能预先肯定它将取哪个值.它的取值与试验结果形成对应,(1)随机变量ξ是定义在样本空间上的实值函数,(2)由于试验结果的出现具有一定的概率,ξ的取值情况;它取值的概率的分布情况.随着实验结果的不同而取不同的值,所以随机变量取每个值和每个确定范围内的值也有一定的概率.如何把握一个随机变量ξ?随机变量的取值既具有可变性,也有随机性。这种双重性正是随机变量与普通变量(函数)的本质区别。引入随机变量的意义?以函数为工具研究随机事件的概率规律通过将随机事件数值化转化为研究随机变量取值的概率规律使概率可转化为我们所熟知的函数形式分析工具有了用武之地随机变量概念的产生是概率论发展史上的重大事件.引入随机变量后,随机试验中的任一随机事件就可以通过随机变量的取值关系式表达出来,对随机现象统计规律的研究,就由对事件及事件概率的研究扩大为对随机变量及其取值规律的研究.事件及事件概率随机变量及其取值规律我们用变量X表示,2.抛一枚硬币,结果分为“正面”、“反面”1.生化检验结果分阳性和阴性,X=0表正面;X=1表反面。X=0表阴性;X=1表阳性。Example:3抛掷骰子,观察出现的点数.(1)1,(2)2,(3)3,(4)4,(5)5,,(6)61{},(1,2,3,4,5,6).6PiiΩ={1,2,3,4,5,6}样本点本身就是数量恒等变换且有:()则有{:()}B,F.则称()为随机变量,而P(()B)称为随机变量()的概率分布.定义3.1.1设()是定义于概率空间(,F,P)上的单值实函数,如果对于直线上任一Borel点集B,有下面给出随机变量的严格数学定义.)(1BB例3.1.3对于={1,2,3},构造σ代数-代数F={,F,{1,2},{3}},再定义概率:P()=1,P(F)=0,P({1,2})=2/3,P({3})=1/3.这里(,F,P)显然是一个概率空间,但实值函数(k)=k,1≤k≤3不是随机变量,例如取Borel点集B=(0,1.5),则因为有{:()B}={1}F.另外,注意到,{()}{()}{()}.PabPbPax所以只要对一切实数给出概率,就能算出落入某个区间的概率,再利用概率的性质还可以算出属于某些相当复杂的直线点集的概率。{()}Px()()特别地,若取,则有(,)Bx{:()}.xF.定义3.1.2称(){()},FxPxx为随机变量()的(累积)分布函数((cumulative)distributionfunction,c.d.f.)。记作()~().Fx按定义,随机变量是样本点的函数,因此在试验前我们只能知道它可能取那些值,而不能确知它将取何值,这就是随机性;但到了试验之后,它的取值就明确了.为了计算概率,必须要求随机变量具有可测性,而分布函数的引进则把对于随机变量的概率计算化为对分布函数的数值运算。由测度论的方法还可以证明:分布函数可以唯一决定概率分布.(测度扩张的唯一性—见《现代概率论基础》,汪嘉冈,P48.)二、分布函数的性质⑴单调性:若ab,则F(a)≤F(b);()lim()0,xFFx()lim()().txFxFtFx⑶左连续性:⑵有界性:0≤F(x)≤1,且()lim()1;xFFx注:在第三节中我们将证明:满足上述三条性质的函数必为某个随机变量的分布函数。因此,以后我们把满足这三条性质的函数称为分布函数。如果分布函数定义中的“”改为“≤”,则为右连续.由于F(x)的单调有界性,证明:(1).()(){.}0FbFaPab[(1)()]lim()lim().nmnFnFnFnFmlim()lim(),lim()lim()xmxnFxFmFxFn存在。因为0≤F(x)≤1,根据概率的可列可加性可知0011()(){}[()()]nnnFxFxPxxFxFx0lim()()nnFxFx,()lim()().nnFxFxFx因而(3)由于F(x)是单调函数,只须证明对于任意一列单调上升的数列,成立即可。lim()()nnFxFxnxx1(){:()}{(:())}nnFxPxPxlim{:()}lim()().nnnnPxFxFx另证:利用概率的下连续性2.{()}{()}{()}()().PaPaPaFaFa有了分布函数,关于随机变量的许多概率都能方便算出:11lim{()}lim()().nnPaFaFann3.{()}1{()}1().PaPaFa4.{()}{()}{()}1().PaPaPaFa5.{()}{()}{()}()().PabPbPaFbFa111.{()}{(())}nPaPan两类重要随机变量:•离散型随机变量;•连续型随机变量。三、离散型随机变量定义1.若随机变量的全部可能取值是有限个或可列无限多个,则称是离散型随机变量。定义2.设离散型随机变量的所有可能取值为,其中事件的概率:称为的概率分布或分布律。1,2,,k分布律也可用如下表格的形式表示:性质:称之为随机变量的分布列.离散型分布函数的图像1x2x3x4x1p2p3p5x4pxyo1可见,ξ为离散型随机变量当且仅当ξ的分布函数F(x)为阶梯型函数.进一步,ξ的取值点恰为F(x)的间断点,且常见的离散型随机变量及其分布1.退化(degenerate)分布:单点分布随机变量只取常数值c,即P{=c}=1.这时分布函数为伯努利分布可以看成为n=1的二项分布。~(,).Bnp作简记2.伯努利(Bernoulli)分布若以记一次伯努利试验中事件A出现的次数,则1{}(;1,),0,1,kkPkbkppqk称为伯努利分布,亦称两点分布或(0-1)分布。3.二项(binomial)分布若以μ记n重伯努利试验中事件A出现的次数,则{}(;,),0,1,,knknPkbknppqknk4.超几何(hyper-geometric)分布N件产品中共有M件次品,若以ν记从这批产品中(不放回地)抽取n件产品中出现的次品数,则{}.,0kMNMknkPkhknMNn5.泊松(Poisson)分布若随机变量ξ可取一切非负整数值,且{}(,),0,1,2,!kPkpkekk记为 ~().P其中λ0,则称ξ服从泊松分布.如果nN以及nM,可用二项分布近似.6.几何(geometric)分布1{}(;),1,2,kPkgkpqpk在事件A发生的概率为p的伯努利试验中,若以记A首次出现时的试验次数,则称为几何分布,它是一种等待时间分布.几何分布的无记忆性定理.取值于自然数的随机变量服从几何分布,当且仅当有无记忆性:或者Remark:几何分布是唯一无记忆性的离散型分布.在伯努利试验中,等待首次成功的时间服从几何分布。无记忆性表明:已知试验了m次未获得成功,再加做n次试验仍不成功的条件概率,等于从开始算起做n次试验都不成功的概率。就是说,已做过的m次失败的试验被忘记了。产生几何分布这种无记忆性的根本原因在于,我们进行的是独立重复试验。如果真的在做“独立重复试验”,那么不管已经失败过多少次,也不会为今后地试验留下可借鉴的东西。直观解释:{}0,1.nQPnn{}{|}{}mnnmPmnqPmnmqPmq证明:【必要性】11{},1,2,1nknknpqPnqpqnq因为服从几何分布,故于是,对任意的有,1mn因而具有无记忆性。【充分性】设,,1.mnmnQQQmn因而,1.mmQQ且对任意的有1k111{}.kkkkkPkQQqqqp至此得证服从几何分布。证毕.由乘法公式知:{}{}{|},PmnPmPmnm因为具有无记忆性,故有令则1,Qq,mmQqP(m+n)=P(m)P(n),7.帕斯卡(Pascal)分布在事件A发生的概率为p的伯努利试验中,若以记第r次成功出现时的试验次数,则1{},,1,1rkrkPkpqkrrr称为帕斯卡分布.显然,当r=1时,即为几何分布.若以记从第次成功之后的第一次试验算起至第i次成功为止共进行的试验次数,则服从几何分布:i1iii1{},1,2,3,.kiPkqpk相互独立,并且i1.r因而,参数为r的帕斯卡分布可以分解为r个独立同分布的几何分布的随机变量的和。另一方面,若记则表示为等待第次成功所经历过的失败次数,那么,rr1{}(),0,1,2,rlrlrlrPlpqpqlll注:不少书上把这个分布作为帕斯卡分布的定义。另一个则只记失败的次数,它们描述的是同样的随机模型,因而它们本质上是相同的。显然,与只是计数方式的不同,一个记全部试验数,特别地,取,考察为等待第1次成功所经历过的失败次数,那么,1r{},0,1,2,.lPlqpl这也是一个分布,表示等待首次成功所经历过的失败数,也称为几何分布。8、负二项分布对于任意的实数,称0r为负二项分布.四、连续型随机变量定义.设F(x)是随机变量ξ的分布函数,若存在非负可积函数p(x),使对对任意实数x有则称ξ为连续型随机变量,称p(x)为ξ的概率密度函数,简称概率密度或密度函数(probabilitydensityfunction,pdf).Reamrk:连续型r.v.的分布函数F(x)是绝对连续的,且F(x)几乎处处可导,即概率密度的性质:⑵规范性:⑴非负性:注:概率密度函数的充要条件:性质(1)+(2)。另外,因为故注意到,故给定密度函数p(x),便可以算出r.v.落入某个区间的概率.概率近似为:特别地,在p(x)的连续点处,ξ落在小区间上的进一步可以证明,r.v.落入任何Borel点集B的概
本文标题:李贤平-概率论基础-Chap3
链接地址:https://www.777doc.com/doc-5315673 .html