您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 概率22_随机变量的数字特征
§2.4随机变量的数字特征第二章随机变量1山西大学数学科学学院每个随机变量都有一个分布(分布列、密度函数或分布函数),不同的随机变量可能有不同的分布,也可能有相同的分布。分布全面的描述了随机变量取值的统计规律性,由分布可以算出有关随机变量的概率。除此之外有分布还可以算的相应随机变量的均值、方差、分位数等特征数,这些特征数从各个侧面描述分布的特征。2.4§2.4随机变量的数字特征【一】随机变量的数学期望(Mean)1、离散型定义:山西大学数学科学学院第二章随机变量2设离散型随机变量X的概率分布为若级数绝对收敛,即则称为随机变量X的数学期望(或均值),记作E(X)。即()(1,2,),kkPXxpk1kkkxp1,kkkxp1kkkxp1()iiiEXxp§2.4随机变量的数字特征随机变量的数学期望(Mean)2、连续型定义:()()EXxfxdx山西大学数学科学学院第二章随机变量3设连续型随机变量X的密度函数为,若绝对收敛,即,则称为随机变量X的数学期望(或均值),记作E(X)。即()px()xpxdx()xpxdx()xpxdx§2.4随机变量的数字特征数学期望的性质:①C为常数,则E(C)=C②C为常数,E(C*X)=C*E(X)③E(X+Y)=E(X)+E(Y)④设X,Y相互独立,则E(X*Y)=E(X)*E(Y)山西大学数学科学学院第二章随机变量4说明:在离散情形下,数学期望是随机变量取值的加权平均值,每个值所对应的“权”就是其出现的概率,这个结果比算术平均更能合理预测随机变量的可能取值,这也就是“期望”这个名称的由来。§2.4随机变量的数字特征【二】随机变量的方差(Variance)山西大学数学科学学院第二章随机变量51、离散型定义设离散型随机变量X的概率分布为若级数则称此级数的和为X的方差,记作D(X),即()(1,2,),kkPXxpk21(()),kkkxEXp21()(()).kkkDXxEXp2、连续型定义设连续型随机变量X的分布密度函数为p(x),若则称此无穷积分值为X的方差,记作D(X),即2(())(),xEXpxdx2()(())().DXxEXpxdx§2.4随机变量的数字特征方差(Variance)统一定义:Def:称为随机变量X的方差,而称为标准差或均方差(meansquareerror,MSE)。计算方差的常用公式说明:D(X)=0,表示X以概率1取常数值,此时X已不是随机变量了。2()[()]DXEXEX()DX山西大学数学科学学院第二章随机变量622()()(())DXEXEX§2.4随机变量的数字特征方差的性质:①常数的方差为0;②D(C*X)=C2*D(X),其中C为常数;③若X,Y相互独立,则。一个重要的结论——方差是所有偏差中最小的。设函数,则当x=E(X)时,f(x)达到最小值。()()()DXYDXDY2()(),fxEXxxR山西大学数学科学学院第二章随机变量7§2.4随机变量的数字特征第二章随机变量8山西大学数学科学学院说明:方差和标准差的功能相识,都是用来描述随机变量取值的集中与分散程度(即散布范围大小)的两个特征数,方差与标准差愈小,随机变量的取值愈集中;方差与标准差愈大,随机变量的取值愈分散。方差与标准差之间的主要差别在量纲上,由于标准差与所讨论的随机变量、数学期望有相同的量纲,所以实际中,人们比较乐意选用标准差,但标准差的计算必须通过方差才能得出。§2.4随机变量的数字特征第二章随机变量9山西大学数学科学学院常见随机变量期望和方差的计算(1)0-1分布设XB(1,p),则()10(1).EXppp0().nkknknkEXkCpqnp(2)二项分布设XB(n,p),则22()()(()).DXEXEXpq22()()(()).DXEXEXnpq§2.4随机变量的数字特征第二章随机变量10山西大学数学科学学院(3)泊松分布设XP(),则0().!kkEXkek22()()(()).DXEXEX§2.4随机变量的数字特征第二章随机变量11山西大学数学科学学院(4)均匀分布设XU(a,b),则().2baxabEXdxba(5)指数分布设XE(),则01().xEXxedx222()()()(()).12baDXEXEX2221()()(()).DXEXEX§2.4随机变量的数字特征第二章随机变量12山西大学数学科学学院(6)正态分布设XN(,2),则22()21().2xEXxedx2()[(())]DXEXEX22()2221()2.xxedx§2.4随机变量的数字特征常见分布的期望和方差表:MeanVariance两点分布b(1,p)pp*q二项分布B(n,p)n*pn*p*q泊松分布P()均匀分布U(a,b)(a+b)/2(b-a)2/12正态分布N(,2)2指数分布E()1/1/2山西大学数学科学学院第二章随机变量13*22**22221()()()0()()()[()]1XEXEEXXEXDXEXE§2.4随机变量的数字特征2*XX一般变量的标准化或无量钢化:为便于比较不同单位或不同量级的数据,常需要将其标准化或无量钢化。若随机变量X有E(X)=,D(X)=,则有E(X*)=0,D(X*)=1。事实上,山西大学数学科学学院第二章随机变量14§2.4随机变量的数字特征【三】矩的概念:设随机变量X,Y,正整数k,l,称E(Xk)为X的k阶原点矩,简称k阶矩;E{[X-E(x)]k}为X的k阶中心矩;E(|X|k)为X的k阶绝对原点矩;E(|X-E(X)|k)为X的k阶绝对中心矩;E[X-E(X)]k[Y-E(Y)]l为X、Y的k+l阶混合中心矩。易知,一阶原点矩是期望,二阶中心矩是方差。山西大学数学科学学院第二章随机变量15§2.4随机变量的数字特征第二章随机变量16山西大学数学科学学院若记()(())kkkkEXEXEX则k阶原点矩和k阶中心距之间有一个简单的关系:1110(())()[()]()kkkkkikkiiiEXEXEXkEXiki§2.4随机变量的数字特征第二章随机变量17山西大学数学科学学院【四】变异系数设随机变量X的二阶矩存在,则称比值:为X的变异系数。因为变异系数是以其数学期望为单位去度量随机变量取值波动程度的特征数,标准差的量纲与数学期望的量纲是一致的,所以变异系数是一个无量纲的量。()()()()()vVarXXCXEXEX§2.4随机变量的数字特征第二章随机变量18山西大学数学科学学院说明:方差(或标准差)反映了随机变量取值的波动程度,但在比较两个随机变量的波动大小时,如果仅看方差(或标准差)的大小有时会产生不合理的现象。这有两个原因:(1)随机变量的取值有量纲,不同量纲的随机变量用其方差(或标准差)去比较它们的波动大小不太合理;(2)在取值的量纲相同的情况下,取值的大小有一个相对性问题,取值较大的随机变量的方差(或标准差)也允许大一些。所以在比较两个随机变量的波动大小时,在一些场合使用变异系数更具可比性。§2.4随机变量的数字特征第二章随机变量19山西大学数学科学学院【五】分位数设连续型随机变量X的分布函数为F(x),密度函数为p(x),对任意,称满足条件的为此分布的p分位数,又称下侧p分位数。同理我们称满足条件的为此分布的上侧p分位数。进一步,称满足条件的和为此分布的双侧分位数。()()()pxppFxPXxpxdxppx(0,1)p1()()()ppxFxPXxpxdxppx1/2/2/21/2()()1xxPxXxpxdx/2x1/2x§2.4随机变量的数字特征第二章随机变量20山西大学数学科学学院例:求标准正态分布的水平为0.05的上侧及双侧分位数即p=0.5,由,并查表得标准正态分布的上侧0.05分位数为同理,由即得标准正态分布的双侧0.05分位数为:10.05()10.050.95u10.051.645u。0.05/2()0.05PUu0.02510.025()0.025()0.975uu,0.02510.0251.961.96uu,。§2.4随机变量的数字特征第二章随机变量21山西大学数学科学学院【六】中位数(特殊的分位数)称p=0.5的时分布函数的p分位数x0.5为此分布的中位数,即x0.5满足。例如:1、的中位数为;2、的中位数为;3、的中位数为。0.50.5()()0.5xFxpxdx2~(,)XN0.5x~()XExp0.5ln2x~()XU0.5()2xba§2.4随机变量的数字特征第二章随机变量22山西大学数学科学学院【七】偏度系数设随机变量X的三阶矩存在,则称比值*为X的分布的偏度系数,简称偏度。偏度系数可以描述分布的形状特征:*0,分布正偏或右偏(右边尾巴长);*=0,分布关于其均值对称;*0,分布负偏或左偏。例如,正态分布是关于均值对称的,偏度为0。331232322(())[(())]()EXEXEXEx§2.4随机变量的数字特征第二章随机变量23山西大学数学科学学院【七】峰度系数设随机变量X的四阶矩存在,则称比值**为X的分布的峰度系数,简称峰度。峰度系数也是描述分布的形状特征,但偏度系数刻画的是分布的对称性,而峰度系数刻画的分布的峰峭性。例如:正态分布的峰度为0,事实上,有4422222(())33[(())]()EXEXEXEx4422423330()§2.4随机变量的数字特征第二章随机变量24山西大学数学科学学院峰度系数的高低含有随机变量取值的集中程度,非消除这个因素,我们不妨考察“标准化”后分布的峰峭性,即用的四阶原点矩考察密度函数的峰值,与标准正态分布的四阶原点矩3作比较:**0,标准化后的分布形状比标准正态分布更平坦;**=0,标准化后的分布形状比标准正态分布相当;**0,标准化后的分布形状比标准正态分布更尖峭,称为高峰度。*()()XEXXVarX*4[()]EX1、掌握概念:分布列、分布密度,分布函数2、熟悉常见离散随机变量的分布列和分布函数二项分布(两点分布)、泊松分布3、熟悉常见连续随机变量的分布密度和分布函数平均分布、正态分布、指数分布4、会计算常见随机变量的数字特征数学期望、方差、矩、分位数、中位数山西大学数学科学学院第二章随机变量25第二章小结Exercise1山西大学数学科学学院26第二章随机变量已知某种疾病的发病率为0.001,某单位共有5000人,问该单位患有这种病的人数不超过5人的概率是多少?解:设该单位患有这种疾病的人数为X,则有X~B(5000,0.001),而我们所求的概率为这个概率的计算量很大。由于n很大,p很小,且5500005000(5)*0.001*0.999.kkkPXk5505(5)0.616!kkPXekExercise2某人乘车到机场搭乘飞机,现有两条路线可选择.第一条路线较短,但交通比较拥挤,到达机场所需时间(单位:分)服从正态分布N(50,100).第二条路线较长,但出现阻塞较少,所需时间服从正态分布N(60,16).(1)若有70分钟可用,问应选走哪一条路线?解:在规定时间内,哪条路线到达机场的概率大就选哪条路(1)有70分钟可用,则走第一条路线及时到达机场的概率为7050050(070)()()(2)(5)(2)0.
本文标题:概率22_随机变量的数字特征
链接地址:https://www.777doc.com/doc-2302742 .html