您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 正态分布及其应用-sms
随机变量及其概率分布概述连续型随机变量(continousrandomvariable)数据间无缝隙,其取值充满整个区间,无法一一列举每一可能值例如:身高、体重、血清胆固醇含量离散型随机变量(discreterandomvariable)数据间有缝隙,其取值可以列举例如:抛硬币10次,正面的可能取值x为0、1、2、3、4、5、6、7、8、9、10概率分布(probabilitydistribution)概率分布:描述随机变量值xi及这些值对应概率P(X=xi)的表格、公式或图形连续型随机变量概率分布正态分布离散型随机变量概率分布二项分布Poisson分布一、正态分布正态分布概念、特征正态曲线下的面积分布规律标准正态分布正态分布的应用估计频数分布制定医学参考值范围质量控制统计方法的理论基础140名成年男子的红细胞数的频数分布01020303.904.104.304.504.704.905.105.305.505.705.90正态分布的概念和特性频数分布特点:频数集中在均数周围左右基本对称离均数愈近数据愈多离均数愈远数据愈少正态分布及其应用Std.Dev=.37Mean=4.78N=140.006.105.905.705.505.305.104.904.704.504.304.103.90403020100正态分布的概念和特性某地用随机抽样方法检查了140名成年男子的红细胞数,当取组距为0.2时正态分布及其应用Std.Dev=.37Mean=4.78N=140.006.055.955.855.755.655.555.455.355.255.155.054.954.854.754.654.554.454.354.254.154.053.953.8520100正态分布的概念和特性某地用随机抽样方法检查了140名成年男子的红细胞数,当取组距为0.1时正态分布及其应用Std.Dev=.37Mean=4.78N=140.00121086420正态分布的概念和特性某地用随机抽样方法检查了140名成年男子的红细胞数,当取组距为0.05时正态分布及其应用正态分布的概念和特性正态分布及其应用0.000.010.020.030.040.050.060.0748~52~56~60~64~68~72~76~80~84~88体重(kg)频率密度Xf(X)图3-1临产母亲体重频率密度图图3-2概率密度曲线示意图频率密度直方图就近似地反映了一个变量的分布复习:频数分布表的编制步骤组段(1)组中值Xi(2)频数(3)频率fi(%)(4)累计频率(%)(5)48~5060.40.452~54543.84.256~5816211.615.860~6229320.936.764~6635925.662.368~7029821.383.672~7414010.093.676~78705.098.680~82171.299.884~888630.2100.0合计-1402100.0-表2-11402名临产母亲的体重(kg)频率表图2-11402名临产母亲体重(kg)的频率分布图0.000.010.020.030.040.050.060.0748~52~56~60~64~68~72~76~80~84~88体重(kg)频率密度复习:频率直方图每一直条的面积就是相应各组段的频率,所有组段的频率之和就是相应各直条的面积之和,整个直方图面积之和为1。频率密度=频率/组距面积=直方的长×宽面积=频率/组距×组距面积=频率当样本量n越来越大,而组距越来越小时,就得到该连续变量所在总体的概率分布。可以设想,如果观察例数逐渐增多,组段数也不断增多,就会形成一条光滑曲线[图(3)],称为正态分布曲线。正态分布的概念和特性这条呈中间高、两边低、左右基本对称的“钟形”曲线数学上称为正态分布曲线由于纵坐标相当于概率密度,故叫做正态分布的概率密度曲线正态分布及其应用Xf(X)图3-2概率密度曲线示意图-5-4-3-2-1012345msm-sm+sm96.1-sm96.1+sm58.2-sm58.2+%0.99%0.95%3.68正态分布曲线略呈钟形,中间高,两头低,以均数μ为中心,左右对称,均数处最高正态分布的曲线在横轴上方,向两侧逐渐减低,两侧都以横轴为其渐近线正态分布有两个参数,即①均数μ和②标准差σ正态分布的特性正态分布及其应用把服从正态分布的变量表示为:X~N(μ,σ2)-4-3-2-1012345671m2m3m321mmm正态分布的特性正态分布曲线的参数的意义—①均数μ(位置参数)表示正态分布曲线峰(集中趋势)的位置σ固定时,μ增大,曲线沿横轴向右移动μ减小,曲线沿横轴向左移动正态分布及其应用-5-4-3-2-10123451s2s3s321sss正态分布的特性正态分布曲线的参数—②标准差σ(变异度参数)表示正态变量取值的离中程度μ固定时,σ越大,曲线越宽,表示数据越分散σ越小,曲线越窄,表示数据越集中正态分布及其应用正态分布的概率密度函数正态分布及其应用222)(21)(sms--xexf式中,μ为总体均数;σ为总体标准差;π=3.14159为圆周率;e为自然对数的底(e≈2.71828),X为变量服从正态分布的变量X的概率密度函数f(x)为22()21()()2πtxFxPXxedtmss---图1正态分布的概率密度函数与分布函数X取值落在区间(-∞,x)内的累积概率为概率密度曲线下位于(-∞,x)的图形面积,等于其概率密度函数f(x)在-∞到x上的积分,记作xF为正态分布的分布函数。其值表示变量X落在区间(-∞,x)内的概率,对应于从-∞到x概率密度曲线下的阴影面积(常称为左侧尾部面积)xF2,smN图1正态分布的概率密度函数与分布函数22()21()()2πtxFxPXxedtmss---22()21()()2πtxFxPXxedtmss---图1正态分布的概率密度函数与分布函数图2正态分布的概率利用分布函数可以计算正态分布变量取值在任意区间[a,b)的概率为P(a≤X<b)=F(b)-F(a)(其几何意义如图2中阴影部分所示)。由图可得P(X≥b)=1-P(X<b)=1-F(b)xF正态分布曲线下面积的分布规律正态分布及其应用服从正态分布的随机变量在一区间上曲线下的面积与该随机变量在同一区间内取值的概率相等正态曲线与横轴所夹面积为1正态分布曲线下面积的规律正态分布及其应用1)正态曲线与横轴所夹的面积为12)位于(μ-1.64σ,μ+1.64σ)内的面积为0.90,说明正态变量在μ±1.64σ范围内取值的概率为0.9,在该区间以外取值的概率(两侧的阴影面积之和)为0.1,左右两侧各0.053)位于(μ-1.96σ,μ+1.96σ)内的面积为0.95,说明正态变量在μ±1.96σ范围内取值的概率为0.95,在该区间以外取值的概率(两侧的阴影面积之和)为0.05,左右两侧各0.0254)位于(μ-2.58σ,μ+2.58σ)内的面积为0.99,说明正态变量在μ±2.58σ范围内取值的概率为0.99,在该区间以外取值的概率(两侧的阴影面积之和)为0.01,左右两侧各0.005正态分布曲线下面积分布规律示意图正态分布曲线下的面积分布规律-5-4-3-2-1012345msm-sm+sm96.1-sm96.1+sm58.2-sm58.2+%0.99%0.95%3.68正态分布曲线下的面积分布规律正态分布及其应用标准正态分布当参数μ和σ已知时,依据正态分布N(μ,σ2)的分布函数公式,正态变量取值落在各区间的概率[都归结为正态分布曲线下的面积,只需知道分布函数F(x)在区间端点处的函数值]就可以算出,但要通过该公式计算F(x)是困难的实际应用中,要把服从一般正态分布N(μ,σ2)的随机变量X作如下标准化变换:变换后新的随机变量z服从,μ=0,σ=1的正态分布,即Z~N(0,1)sm-xZ正态分布及其应用标准正态分布指数据经标准化变换后,μ=0,σ=1时的正态分布标准正态分布(又称Z分布):Z~N(0,1)公式任何一个正态分布,都可以通过变换,成为标准正态分布SXXZ-sm-xZ正态分布及其应用mm+sm-sX~N(m,s2)01-1X-msZ=~N(0,1)正态分布及其应用标准正态分布图中阴影部分的面积[表示标准正态变量Z落在(-∞,z)内的概率]即为分布函数的值z标准正态分布的概率密度曲线与分布函数示意图z0zz10z212zz-1-z正态分布及其应用标准正态分布图中阴影部分的面积[表示标准正态变量Z落在(-∞,z)内的概率]即为分布函数的值z标准正态分布的概率密度曲线与分布函数示意图正态分布的应用1、估计频数分布标准正态分布sxxz-正态分布及其应用查标准正态分布表(附表C1)得标准正态变量z落在(-∞,z)内的概率值zz.00.01.02.03.04.05.06.07.08.09-3.0.0013.0013.0013.0012.0012.0011.0011.0011.0010.0010-2.9.0019.0018.0018.0017.0016.0016.0015.0015.0014.0014-2.8.0026.0025.0024.0023.0023.0022.0021.0021.0020.0019-2.7.0035.0034.0033.0032.0031.0030.0029.0028.0027.0026-2.6.0047.0045.0144.0043.0041.0040.0039.0038.0037.0036-2.5.0062.0060.0059.0057.0055.0054.0052.0051.0049.0048-2.4.0082.0080.0078.0075.0073.0071.0069.0068.0066.0064-2.3.0107.0104.0102.0099.0096.0094.0091.0089.0087.0084-2.2.0139.0136.0132.0129.0125.0122.0119.0116.0113.0110-2.1.0179.0174.0170.0166.0162.0158.0154.0150.0146.0143-2.0.0228.0222.0217.0212.0207.0202.0197.0192.0188.0183-1.9.0287.0281.0274.0268.0262.0256.0250.0244.0239.0233-1.8.0359.0351.0344.0336.0329.0322.0314.0307.0301.0294-1.7.0446.0436.0427.0418.0409.0401.0392.0384.0375.0367-1.6.0548.0537.0526.0516.0505.0495.0485.0475.0465.0455-1.5.0668.0655.0643.0630.0618.0606.0594.0582.0571.0559-1.4.0808.0793.0778.0764.0749.0735.0721.0798.0694.0681表C1标准正态分布(z-分布)密度曲线下的面积[Φ(z)值]自-∞到-z的面积Φ(-∞,-z),Φ(z,+∞)=1-Φ(-∞,-z)-1.4.0808.0793.0778.0764.0749.0735.0721.0798.0694.0681-1.3.0968.0951.0934.0918.0901.0885.0869.0853.0838.0823-1.2.1151.1131.1112.1093.1075.1056.1038.1020.1003.0985-1.1.1357.1335.1314.1292.1271.1251.1230.1210.1190.1170-1.0.1587.1562
本文标题:正态分布及其应用-sms
链接地址:https://www.777doc.com/doc-4072216 .html