您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第八讲概率及概率分布.
第八讲概率及概率分布——统计推断的理论基础投掷一枚正规的一元硬币25次而得到23次图朝上和2次字朝上。当接着投掷第26次时,得到图朝上的可能性有多大?主要内容概率的基本概念和基本性质概率分布类型二项分布正态分布抽样分布一、概率的基本概念与性质随机现象及其统计规律性在一定条件下具有多种可能发生的结果,某一结果可能发生也可能不发生事先不能肯定,这种现象我们称其为随机现象或偶然现象。例如,某工厂一天产品中废品的多少;电话局每日接到用户呼叫的次数;一条河流每年出现洪峰的时间和最大洪水流量;新生婴儿的性别;……随机现象虽然就每次观察来说具有不确定性,但是进行大量的观察,它的结果却呈现出一种完全确定的规律性,称之为随机现象的统计规律性。例如,投掷硬币正面向上的比率为1/2;新生儿的性别比例为女:男=1:1.03;降水概率;命中率;及格率;死亡率……随机试验与随机事件在概率论中,我们把对随机现象的一次观测或一次实验都称作它的一次试验,如果这个试验具有下列二个特征:(1)可以在相同条件下重复进行;(2)每次试验之前不能确定会出现哪一个结果,那么,就称这个试验为随机试验。随机试验的某些结果所构成的集合称为随机事件,通常用大写英文字母表示。例如,“某学生参加一次英语考试”“投掷一枚均匀的硬币”“抽检一件产品的质量”在一个试验中,它的每一个可能出现的结果都是一个随机事件,他们是这个试验的不可再分解的最简单的随机事件,我们称之为基本事件。应该注意的是:(1)在一次试验中所有基本事件中必出现其中一个,而且只能出现其中一个;(2)一个随机试验中基本事件的个数可以是有限个,也可以是可数个,还可以是不可数个,其个数的确定都是相对试验目的而言的。如某箱子中装有红、白、蓝三种颜色的同一样产品,当试验是检查产品的质量时,则基本事件有“正品”和“次品”二个,当试验是弄清产品的颜色时,则基本事件就有“红”、“白”、“蓝”三个。(3)事件是某些基本事件的集合,每当试验条件实现后,我们说某个事件A发生了,意指:这个集合A中的一个基本事件在这次试验中出现了。为了方便,我们把随机试验必然会发生的事件叫做必然事件,用大写希腊字母Ω来表示;把随机试验一定不发生的事件叫做不可能事件,用符号φ表示。对于事件A,”A不发生”这一事件称为事件A的逆事件(或对立事件),记做。例如,一道正误判断题,用“T”表示“正确”,用“F”表示“错误”。若事件A与B不能同时发生,即“A与B同时发生”是不可能事件,则称A与B互斥(或互不相容),记作AB=φ。显然,两个互逆事件一定互斥,反之未必。A新生儿会讲话;明天要下雨;每一个孕妇都可以生四胞胎;甲、乙、丙三人参加某项测验,设A表示三人都合格,B表示三人中仅有一人合格,C表示三人中至少有一人合格。掷一粒骰子,设事件A表示“出现奇数点”,事件B表示“出现偶数点”,事件C表示“出现点数2”。随机事件的概率在一个随机试验中,有许多基本事件,我们常常需要知道这些基本事件或由这些事件组成的随机事件在试验中出现的可能性有多大。比如某学生参加一次英语考试,我们更关心的是“该学生在考试中得90分”的可能性有多大?投掷一枚硬币“出现字面朝上”的可能性有多大?抽检一件产品是“合格品”的可能性有多大?简单地说,概率就是描述某事件出现的可能性大小的一个数。概率的定义设A为某试验下的一个事件,若将此试验在相同条件下重复进行n次,事件A出现了m次,那么我们称比值m/n为n次试验中A出现的频率,记为fn(A)。频率fn(A)从某种意义上说也反映了事件A出现的可能性的大小,但是它随试验次数在变化,因此直接用频率来描述事件本身固有的不依人的意志为转移的属性:事件出现的可能性大小是不能令人满意的。单独进行一次试验,其结果难以预料,但当多次重复这个试验时,就会呈现出某种规律性。例如,做一次试验:将一枚均匀硬币投掷n次,观察在n次试验中“字面朝上”这个事件A出现的可能性有多大。由表5.1可知,尽管投掷一次硬币,不是“字面朝上”就是“花面朝上”无规律可言,但多次抛掷,也不论谁去抛掷,出现“字面朝上”的频率总是在0.5附近摆动,而逐渐稳定于0.5,所以0.5这个数能反映A出现的可能性大小。我们把这种特性叫做频率的稳定性,把数值0.5称为稳定值。表5.1试验者投掷次数nA出现次数mA出现频率m/n浦丰皮尔逊皮尔逊4040120002400020486019120120.50690.50160.5005概率的统计定义在大量重复试验下,设试验的次数为n,事件A出现的次数为m,如果事件A出现的频率m/n总是在某个常数p附近摆动,我们便把这个常数p称为A的概率,记作P(A)=p。后验概率:0,,NnNnpN,存在当有统计概率易于理解,然而其先决条件是在相同条件下进行大量重复试验,这带来很大的局限性。事实上,有一种特殊的概型可以不必进行大量重复试验,而只要通过一次试验中可能出现的结果的分析便可求出事件的概律,这就是古典型试验。它具有两个特点:(1)有限性:每次试验,基本事件具有有限个;(2)等可能性:每次试验,各基本事件出现的可能性相同。有关古典型试验中的概率模型称为古典概型。古典概型在实际中是常见的,如:从装有5份考题的袋中任抽一份进行测验,有5个基本结果。由于抽取是随机的,各份试题外观又一样,那么抽到任意一份试题当然是等可能的,即抽到任何一份试题的概率均为1/5。从编上号码的20名学生中随机抽取一人,有20个可能的基本结果,由于抽到20名学生中的任何一个机会均等,因此抽到每个学生的可能性都是1/20。概率的古典定义设某古典概型的一次试验中总共有n个基本事件,其中某事件A包含m个基本事件,那么,我们就把比值m/n称为A的概率,记作P(A)。先验概率:nmAAP基本事件总数中包含的基本事件个数)(例1例2:某年级甲班33人,乙班36人,丙班31人,从中随机抽取学生,甲班被抽到的概率是多少?例3:从54张扑克牌中随机抽取一张,求抽到红桃的概率?例4从一个装有7枚黑球和4枚白球的口袋中,随机抽出一球。求这一枚是白球的概率。例5一次同掷两枚骰子,求以下概率:①得总数为9;②总数不为9。概率的基本性质概率的公理系统(1)任何一个随机事件A的概率都是非负的。(2)在一定条件下必然发生的必然事件的概率为1。(3)在一定条件下必然不发生的事件,即不可能事件的概率为0。概率的基本性质概率的加法定理两个互不相容事件A、B之和的概率,等于两个事件概率之和,写作P(A+B)=P(A)+P(B)概率的乘法定理两个独立事件同时出现的概率等于这两个事件概率的乘积,写作P(AB)=P(A)×P(B)练习某一学生从5个试题中任意抽取一题,进行口试,则抽到试题l或试题2的概率是多少?抽到试题1或试题2或试题5的概率是多少?如果第一个学生把抽过的试题还回后,第二个学生再抽,则两个学生都抽到试题1的概率是多少?如果前一个学生把抽过的试题还回后,后一个学生再抽,则4个学生都抽到试题l的概率是多少?二、随机变量及其概率分布在许多随机现象中,事件可以表现为取某个值或某个范围内的值的变量,我们称之为随机变量。例如,在100张有奖销售中有5张三等奖,现从中抽取10张,问抽得三等奖的张数是多少?显然,抽得三等奖券的张数是一个变量,它可以取1,2,3,4,5,0等值,其取值是随试验的结果而改变的,而在试验前无法预言它将抽得什么数值。随机变量的定义对于随机试验的每一个可能结果都对应于一个实数值ξ(ω),称ξ(ω)为随机变量,简记作ξ。有些定性的试验结果也可以“数值化”,比如掷一枚硬币出现字面或花面,我们可以用{ξ=1}表示“出现字面”,用{ξ=0}表示“出现花面”。在理解随机变量这一概念时要注意:(1)它是随试验结果而变的量,是“因变量”,是随机试验结果的函数;(2)随机变量取每一个值都是一个随机事件。所以说随机变量实际上是随机事件进一步的抽象和概括,是用随机变量的函数关系式来表示随机事件。(3)对于一个随机变量,我们更关心的是它取某个数值或在某个范围内取值的概率有多大?通常我们把随机变量ξ取某一数值a的概率记做P{ξ=a},在区间[a,b)内取值的概率,记做P{a≤ξ<b}。随机变量的类型如果一个随机变量只可能取有限个或无穷可数个数值,则称之为离散性随机变量。所谓无穷可数个数值是指这些数值可按一定的顺序排列,从而可表示为数列x1,x2,…xn…。如果一个随机变量的取值充满数轴的某些区间,而不是集中在有限个或可数个离散的点上,则称之为非离散型随机变量(或连续型随机变量)。研究离散型随机变量,一是要知道它可能取哪些数值,二是它取这些数值的概率是多大。这样才能确切地掌握它取值的概率规律。而对于连续型随机变量来讲,考察其取值于一点的概率意义不大,只有知道它取值于任一区间上的概率,才能把握其取值的概率规律性。概率分布是指对随机变量取值的概率情况用数学方法(函数)进行描述。离散型随机变量及其分布列连续型随机变量及其概率密度函数设离散型随机变量ξ取值为x1,x2,x3,…,xn,…,取这些值相应的概率为p1,p2,…,pn,…,则称P{ξ=xi}=pi,I=1,2,…,n,…为ξ的概率分布列。ξx1x2…xn…Pp1p2…pn…根据概率的基本含义,易见(1)(2);,,,2,1,0nipi.11iip例:某学生参加一次智力竞赛,共回答了三个问题,求该生答对题数的分布列。二项试验与二项分布二项试验必须满足以下几个条件:1.任何一次试验恰好有两个结果,成功与失败。2.共有N次试验,并且N是预先给定的任一正整数。3.每次试验各自独立,各次试验之间无相互影响。4.某种结果出现的概率在任何一次试验中都是固定的。二项分布二项分布即二项试验的概率分布,其概率函数为:knkknqpCkP)(变量X的二项分布X(或r)P012……R……nnq1nnpq222nnqpCrnrrnqpCnp二项分布的性质二项分布是离散型分布。当p=q时图形是对称的。当p≠q时,直方图呈偏态,p<q与p>q的偏斜方向相反。当p<q且np≥5,或p>q且nq≥5时,二项分布就可以当作一个正态分布的近似形。二项分布的极限就是正态分布。二项分布的平均数与标准差。npqnp;二项分布的性质例:如果出10道用正误选择的测验题目,应如何判断学生的真实成绩?例1:有10道是非题,若一考生完全不懂,全凭猜测回答,问分别答对5题、6题、7题、8题、9题、10题的概率各为多少?至少答对5题的概率又是多少?例2:有一份10道四选一的多项选择题的试卷,若考生对试题作完全猜测,问考生分别猜中8题、9题、10题的概率各有多大?至少猜中一题的概率又有多大?例3:在10道多重选择题,每道题有5个答案,其中只有一个正确,让学生作出选择,用这种方法测验,应怎样确定学生的真实成绩?练习正态分布正态曲线函数其中x在-∞到+∞之间变化,而μ代表均数,σ表示分布的标准差。正态分布曲线由μ和σ唯一确定。22221)(xexf标准正态分布N(0,1)2221Zey标准正态分布的平均数为0、标准差为1。XZ正态分布的特征正态分布的形式是对称的(但对称的不一定是正态的),它以直线X=μ(Z=0)为对称轴。当X=μ(Z=0)时曲线处于最高点,即当X=μ时,为最大值;x=μ±σ两点是拐点,整条曲线呈现“中间高,两边低”的形状。正态曲线与x轴所围成区域的面积为1。正态分布是由均值μ和标准差σ唯一决定的分布。21)(f正态分布表正态分布表一般包括三栏:Z分数单位,即横坐标,一般标为Z(或(X-μ)/σ)纵高Y,即曲线的高度概率值P,表示某一Z值与Z=0之间的面积正态分布表的使用依据Z分数求概率P从概率P求Z分数已知概率或Z值,求概率密度Y正态分布表的使用例1某校480个学生的语文测验分数呈正态分布,其平均数为75,标准差为10,问从理论上说65至83分之间应当有多少人?例2某次
本文标题:第八讲概率及概率分布.
链接地址:https://www.777doc.com/doc-2087127 .html