您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第4章概率与概率分布
1第4章概率与概率分布本章的主要目的:掌握随机事件的含义、事件的概率计算方法及其运算法则;掌握随机变量的含义及正态分布、二项分布、泊松分布的特性及应用。了解大数定律及中心极限定理的含义。4.1概率基础这节主要内容是随机事件、概率的含义、概率的运算规则等。有人说:如果一艘船即将沉没,一个著名的规则就是,救生艇会先载满妇女和小孩。我们先看在1912年4月15日(星期一)沉没的泰坦尼克号上的死亡人数表,这条规则是否被遵守?男人妇女男孩女孩总计幸存3323182927706死亡136010435181517总计169242264452223从本章起,我们将用样本数据来对总体做一些推论(或结论)。那些推论中有很多将在事件概率的基础上得到。统计学家一般这样认为:如果某种解释基于非常小的概率,他们就拒绝这种解释,小概率事件法。1.随机事件我们的现实生活中有两类不同的现象:确定性现象和随机现象。随机现象是指在一定条件下可能发生也可能不发生的现象。随机现象通过大量的观察会发现其有明显的统计规律性,这个观察的过程叫试验,试验有三个条件:试验可以在相同条件下重复进行;试验的所有可能结果是明确可知的;每次试验之前不能肯定哪一个结果会出现。随机试验的每一个可能的结果称为随机事件,简称事件;若一个事件不可能再分解为更简单成分的结果或事件,就称之为基本事件或简单事件(样本点);基本事件的全体(全集)称为样本空间Ω;由某些基本事件组合而成的事件(子集)称为复合事件。必然事件和不可能事件不是随机事件,但可以作为随机事件的两个极端情形来处理。实例一:掷骰子观察点数的试验。掷一个骰子和两个骰子。2.随机事件的关系和运算随机事件之间通常有一定的联系。⑴事件的包含与相等。若事件A发生必然导致事件B发生,则称事件B包含事件。⑵事件的并(和)。事件A与事件B至少有一个发生。A+B或A∪B。⑶事件的交(积)。事件A与事件B同时发生。AB或A∩B⑷事件的差。事件A发生而事件B不发生。A-B。⑸互不相容(互斥)事件。事件A和事件B不能同时发生。AB=φ。⑹补(逆、对立)事件。样本空间中所有不属于事件A的样本点组成的事件。实例二:抽零件。3.事件的概率随机事件发生可能性大小的数值称为随机事件的概率。我们将学习三种定义概率的方法。概率的古典定义。假设一个已知过程包括n种不同的基本事件,那些基本事件中的某一个发生的可能性都是相同的。如果在这n种方式中有m种是属于事件A的,那么P(A)=m/n。这里要强调指出两个共同的特点:有限基本事件(可能结果n);各结果出现的可能性相同。实例三:书中例4-1;例行4-2。概率的统计定义:相对频数近似。对一个过程观察许多次,计算出事件A实际发生的次数。基于这些实际结果,P(A)可按公式“P(A)=A发生的次数/试验重复的次数”2来估计。大数法则告诉我们当观测的次数增加时,相应的估计就趋近于精确的概率。当一个过程一次又一次地重复时,一个事件的相对频数概率就趋近于实际概率。也就是说只有很少试验的概率估计可能与真实数值背道而驰,但如果基于很多的试验,估计就会更精确。概率的主观定义。人们根据自己的经验和所掌握的有关信息,对事件发生的可能性大小给以主观的估计。如教师对学生考取大学的判断;计算一个随机选择的人在今年将被闪电击中的概率。4.概率的性质任何事件数学上的概率都是0、1或位于0与1之间的一个数字。建议:当表达一个概率值时,要么给出一个确切的分数或小数,要么将最终十进制的结果四舍五入到3位有效数字。概率有如下性质:对任一随机事件A,有0≤P(A)≤1;一个不可能事件的概率为0;一个必然事件的概率为1;对于两两个互斥的随机事件Ai(i=1,2,…),则有P(A1+A2+…)=P(A1)+P(A2)+…。要理解,一个概率接近于0的值反映的是那些非常不可能的事件,而那些接近于1的值反映的是非常有可能发生的事。5.概率的运算法则概率的加法公式。对任意两个随机事件A、B,有P(A+B)=P(A)+P(B)–P(AB)要计算事件A发生或事件B发生的概率时,计算A能够发生的所有方式的个数和B能够发生的所有方式的个数,但没有结果被计算多次。文氏图显示。实例四:书中例4-3;例4-4。课堂练习一:假设从2223名登上泰坦尼克号的乘客中随机地选出一人,请计算P(选出了一个男人或一个男孩);P(选出了一个男人或一个幸存者)。概率的乘法公式。对任意两个随机事件A、B,有P(AB)=P(A)P(B︱A)这里P(B︱A)是条件概率,指在事件A已经发生的条件下事件B发生的概率。两个事件A和B,如果一个的发生不影响另一个的发生概率,就称这两个事件是独立的,也就意味着P(B)=P(B︱A)或P(A)=P(A︱B);否则就是非独立的。实例五:书例4-5;例4-6。一般地,独立事件的任何一种次序的概率就是其对应的概率的简单乘积。这里注意“有放回和无放回”的区别。但有一个一般性的指导原则:“如果一个样本的容量没有超过总体容量的5%,就将选择看作是独立的(即使选择是没有放回的,从技术上讲选择是非独立的)。”课堂练习二:如果从泰坦尼克号2223人中随机选择1人,已知是一个男人,这个人是幸存者的概率是多少?已知是一个幸存者,这个人是男人的概率又是多少?课堂练习三一个质量控制经理声称一种新的数字相机加工程序更好,因为次品率低于过去的次品率5%。加工1000个数字相机,其中12个随机选出做检测,结果是没有次品。假设新方法的次品率和过去一样,都是5%,计算这12个数字相机没有次品的概率。基于这个结果,是否有强大的证据说明,新程序更好?全概率公式与贝叶斯公式。对于一些复杂事件,单独用加法公式或乘法公式还不能计3算其概率,为此可以反它分解为若干互斥的基本事件。实例六:请先看例4-8。全概率公式:设事件Ai(i=1,2,…,n)两两互斥,且∑Ai=Ω,则P(B)=∑P(Ai)P(B|Ai)。贝叶斯公式:P(Ai|B)=P(AiB)/P(B)实例七:例4-9;例4-10。4.2随机变量及离散概率分布1.随机变量及概率分布这一节我们讨论随机变量及其概率分布,概率分布描述的是什么将可能发生,而不是什么已经实际发生了。一个随机变量是指这样的一个变量,对于过程中的每个结果(事件),都有一个由可能性决定的惟一的数值。一个概率分布是指表示随机变量每个值的图、表或公式。实例八:一项研究的内容是,随机选择4个新生儿,看女孩有多少个。如果我们假设男孩和女孩是等可能的,并且令x=14个孩子中女孩的个数,那么x就是一个随机变量,因为它的取值取决于可能性。X的可能性取值有0,1,2,…,14。下表列出了x的值以及相应的概率。这个表也就描述了一个概率分布。X(女孩)P(x)X(女孩)P(x)X(女孩)P(x)00.00050.122100.06110.00160.183110.02220.00670.209120.00630.02280.183130.00140.06190.122140.000按取值特点不同,随机变量可分为离散随机变量和连续随机变量。一个离散随机变量是指数量值有限,或可数的随机变量;一个连续随机变量有无限多的数值,这些数值能够和一种连续刻度的度量联系起来,这种刻度没有缝隙或间断。每一个概率分布必须满足下面两个必要条件:ΣP(x)=1其中x表示所有可能的取值。0≤P(x)≤1对于x的每个值。分布函数F(m)描述的是x取值不超过m的的情况上的累积概率,即F(m)=P(x≤m)=ΣP(x)2.数学期望和方差常用的随机变量的数字特征有数学期望、方差和标准差。数学期望就是随机变量的平均值,是所有随机变量所有可能取值的平均水平,E(x)或μ。随机变量的方差是随机变量的各可能取值偏离其均值的离差平方的均值,D(x)或σ2。E(x)=μ=∑xP(x)D(x)=σ2=∑[(x-μ)2P(x)]实际上,一个概率分布就是一个理论上完美的总体频数分布。课堂练习四:在实例八中我们描述了14个随机选择的新生儿中女孩数量的概率分布,请计算女孩数量的均值、标准差,并用这些结果来计算最大正常值和最小正常值。?在14个新生儿中若有13个女孩是正常的吗?根据课堂练习四的结果,我们发现13是异常的!我们可用另一种方法来说明,如果P(13或更多的女孩)非常小,那么14个新生儿中有13个女孩就是异常的。P(13或更多的女孩)=P(13)+P(14)=0.001因为0.001这个数好小,所以我们认为,在14个新生儿中有13个女孩是异常的。也就是4在14个新生儿中有13个女孩这样的结果偶然发生是非常不可能的。一般地,使用概率来确定结果是否是异常的如果P(x或更多)很小(如小于0.05),n次试验中有x次成功就是异常的高;如果P(x或更少)很小(如小于0.05),n次试验中有x次成功就是异常的低。3.二项概率分布简称二项分布,它能帮助我们处理结果为两种相关类型的问题。二项分布来自于满足下列必要条件的过程:这个过程包括一个固定次数n的试验。试验必须是独立的,即每次试验结果不受其他各次试验结果的影响。每次试验的结果都可分为两类,“成功”或“失败”。每次试验中的概率必须是常数。“成功”概率为p,则“失败”概率为q=1-p。实例九:某电信公司声称,当用户给查号台打电话查询电话号码时,90%的情况下会得到正确的电话号码。假设回答的正确率为90%,假如我们想计算在5次询问中有3次回答正确的概率。这个过程是二项分布吗?如果这个过程的结果是二项分布,请说明n、k、p和q的值。二项分布也称贝努里分布,其计算我们可用三种方法:公式法。查表法。软件工具法。E(x)=μ=npD(x)=σ2=npq二项分布最可能“成功”的次数(众数k),即P(k)为最大,为(n+1)p=k为整数时,最可能成功的次数有两个即k和k-1;当(n+1)p不为整数时,最可能成功的次数是k=[(n+1)p],实例十:书中例4-11。4.泊松分布泊松分布经常作为一个数学模型来描述这样一些问题:一个队伍里到来的排队者;一个加油站到来的汽车;一个饭店里到来的就餐者;一个书店到来的学生;以及一个网站到来的因特网用户等。泊松分布是一种离散概率分布,应用于一个区间内某一事件的发生。随机变量x是这个事件在此区间内发生的次数。这个区间可以是时间、距离、面积、体积或其他类似单位。事件在一个区间内发生了k次的概率可用公式P(λ)=λke-λ/k!λ0泊松分布服从下列条件:随机变量k是一个事件在某区间内发生的次数。事件的发生必须是随机的。事件的发生必须是相互独立的。在所有的区间内,事件的发生必须是统一的分布。泊松分布的最可能值:当λ为整数时最可能值有两个x=λ或x=λ-1;当λ不是整数时,x=[λ]。E(x)=μ=λD(x)=σ2=λ泊松分布可以作为二项颁布的近似,一般要求n≥20,p≤0.25。实例十一:书中例4-12;例4-13。课堂练习五:在对二战期间的V-1飞弹击中地区的分析中,伦敦南部被分割为576个小区域,每个小区域的面积为0.25km2,一共有535枚炸弹击中了由这576个小区域组成的地区。如5果随机选择一个小区域,计算它恰好被击中2次的概率。4.3正态概率分布1.概率密度与分布函数由于连续随机变量的取值不能一一列举,其概率分布就不能象离散随机变量那样用点的概率表示,只能用数字的函数形式来描述。对于任意连续随机变量,任何一个精确值的概率都是0,因此也就有P(a≤x≤b)=P(axb)。P(a≤x≤b)=P(axb)=P(a≤xb)=P(ax≤b)=∫abf(x)这里f(x)就是概率密度函数。密度曲线下的面积总和为1,其面积与概率之间有一种对应关系。分布函数F(a)=P(x≤a)=∫-∞bf(x)dx分布函数具有如下性质:P71:1-4。数学期望与方差计算公式。2.标准正态分布如果一个连续随机变量的分布的图形是对称的,并且是钟形的,我们就称之为正态分布。正态分布之所以重要,一是因为许多随机现象服从或近似服从正态分布,其最大特点是与均值较接近的数值
本文标题:第4章概率与概率分布
链接地址:https://www.777doc.com/doc-2195014 .html