您好,欢迎访问三七文档
1第四章常用概率分布韩国君教授2第一节正态分布NormalDistribution3定义若连续型随机变量x的概率分布密度函数为其中μ为平均数,σ2为方差,则称随机变量x服从正态分布,记为x~N(μ,σ2)。相应的概率分布函数为正态分布(normaldistribution)222)(21)(xexfxxdxexF222)(21)(4正态分布1.正态分布密度曲线是单峰、对称的悬钟形曲线,对称轴为x=μ;2.f(x)在x=μ处达到极大,极大值;3.f(x)是非负函数,以x轴为渐近线,分布从-∞至+∞4.曲线在x=μ±σ处各有一个拐点,即曲线在(-∞,μ-σ)和(μ+σ,+∞)区间上是下凸的,在[μ-σ,μ+σ]区间内是上凸的21)(f5正态分布正态分布有两个参数,即平均数μ和标准差σ6正态分布分布密度曲线与横轴所夹的面积为1,121)(222)(dxexPx7标准正态分布(standardnormaldistribution)μ=0,σ2=1的正态分布为标准正态分布(standardnormaldistribution)随机变量u服从标准正态分布,记作u~N(0,1)2221)(ueudueuuu22121)(8标准正态分布对于任何一个服从正态分布N(μ,σ2)的随机变量x,都可以通过标准化变换u=(x-μ)/σ将其变换为服从标准正态分布的随机变量uu称为标准正态变量或标准正态离差(standardnormaldeviate)9三、正态分布的概率计算设u服从标准正态分布,则u在[u1,u2)何内取值的概率为:=Φ(u2)-Φ(u1)而Φ(u1)与Φ(u2)可由附表1查得。dueduedueuuuPuuuuuuu122221221212121212121)(10标准正态分布正态分布的对称性可推出下列关系式,再借助附表1,便能很方便地计算有关概率:P(0≤u<u1)=Φ(u1)-0.5P(u≥u1)=Φ(-u1)P(|u|≥u1)=2Φ(-u1)P(|u|<u1==1-2Φ(-u1)P(u1≤u<u2)=Φ(u2)-Φ(u1)11计算已知u~N(0,1),试求:(1)P(u<-1.64)=?(2)P(u≥2.58)=?(3)P(|u|≥2.56)=?(4)P(0.34≤u<1.53)=?12计算查附表1得:(1)P(u<-1.64)=0.05050(2)P(u≥2.58)=Φ(-2.58)=0.024940(3)P(|u|≥2.56)=2Φ(-2.56)=2×0.005234=0.010468(4)P(0.34≤u<1.53)=Φ(1.53)-Φ(0.34)=0.93669-0.6331=0.3038913关于标准正态分布,以下几种概率应当熟记:P(-1≤u<1)=0.6826P(-2≤u<2)=0.9545P(-3≤u<3)=0.9973P(-1.96≤u<1.96)=0.95P(-2.58≤u<2.58)=0.9914计算u变量在上述区间以外取值的概率分别为:P(|u|≥1)=2Φ(-1)=1-P(-1≤u<1)=1-0.6826=0.3174P(|u|≥2)=2Φ(-2)=1-P(-2≤u<2)=1-0.9545=0.0455P(|u|≥3)=1-0.9973=0.0027P(|u|≥1.96)=1-0.95=0.05P(|u|≥2.58)=1-0.99=0.0115由表4—2可见,实际频率与理论概率相当接近,说明126头基础母羊体重资料的频率分布接近正态分布,从而可推断基础母羊体重这一随机变量很可能是服从正态分布的16双侧概率和单侧概率随机变量x落在平均数μ加减不同倍数标准差σ区间之外的概率称为双侧概率(两尾概率),记作α。对应于双侧概率可以求得随机变量x小于μ-kσ或大于μ+kσ的概率,称为单侧概率(一尾概率),记作α/2。例如,x落在(μ-1.96σ,μ+1.96σ)之外的双侧概率为0.05,而单侧概率为0.025。P(xμ-1.96σ)=P(xμ+1.96σ)=0.02517x落在(μ-2.58σ,μ+2.58σ)之外的双侧概率为0.01,而单侧概率P(xμ-2.58σ)=P(xμ+2.58σ)=0.00518第二节卡方分布Chi-squareDistribution19定义如果随机变量zi(i=1,...,n)为相互独立,都服从标准正态分布,则定义:,i=1,...,n变量2服从自由度等于n卡方分布(chi–squaredistribution)。iiz2220卡方分布曲线图4-1不同自由度下的2分布图4-22分布的上侧和下侧分位数示意图21卡方分布特征1.卡方分布于区间[0,+),并且呈反J形的偏斜分布。2.卡方分布的偏斜度随自由度的降低而增大,当自由度等于1时,曲线以纵轴为渐近线。3.随自由度的增大,卡方分丰曲线渐趋左右对称,当df30时,卡方分布已接近正态分布。22第三节t分布23定义如果z~N(0,1),2服从自由度等于n的卡方分布,则为自由度为n的t分布t分布的形状与正态分布相似nzt224t分布不同自由度下的t分布t分布双侧分位数示意图25t分布密度曲线特点t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布密度函数取得最大值。与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df越小这种趋势越明显。df越大,t分布越趋近于标准正态分布。当n30时,t分布与标准正态分布的区别很小;n100时,t分布基本与标准正态分布相同;n→∞时,t分布与标准正态分布完全一致。26第四节F分布27定义28F分布图(2,6)(6,10)(10,20)29F分布有以下特征F分布的平均数等于1,取值区间为[0,+)。F分布曲线的形状仅决定于df1和df2。当df1=1或2时,F分布曲线呈严重倾斜的反向J形,当df13时,转为左偏曲线。30第五节样本平均数的抽样分布31定义样本变异性(samplingvariability):简单随机样本平均数间存在差别。或抽样误差(samplingerror)样本分布(samplingdistribution):指样本的概率分布。32样本平均数的分布从N个总体中随机抽取样本含量为n的样本,共抽m次,求样本平均数的分布(sampledistributionforthemean)。计算每个样本的平均数列出每次抽样的平均数,并列出每个平均数的频率直观观察33例题1一个骰子掷两次算一次抽样,求所有样本的样本平均数和方差12345611,11,21,31,41,51,622,12,22,32,42,52,633,13,23,33,43,53,644,14,24,34,44,54,655,15,25,35,45,55,666,16,26,36,46,56,634例题2平均数频率相对频率1.010.0281.520.0562.030.0832.540.1113.050.1393.560.1674.050.1394.540.1115.030.0835.520.0566.010.028总和361.00035样本平均数的分布1.01.52.02.53.03.54.04.55.05.56.036定理情况1.如果总体服从正态分布,平均数为,方差为2,样本含量为n,则样本为:正态分布平均数等于方差等于2/n,SQRT(2/n)称为平均数的标准差(standarderrorofthemean),或简称标准误37定理情况2:当总本不是服从正态分布,平均数为,方差为2,样本含量为n,则样本为:近似服从正态分布,随样本越大,近似越好。与总体分布的形状有关。一般地,样本数30或者30以上,近似会比较好(中心极限定理,CentralLimitTheorem,CLT)。平均数等于方差等于2/n,SQRT(2/n)为平均数的标准误(standarderrorofthemean)或标准误38总体平均数的期望39样本平均数的方差
本文标题:标准正态分布
链接地址:https://www.777doc.com/doc-3233589 .html