您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 六西格玛测量培训教材-冠卓
1测量第2页知识要点测量阶段是项目工作的关键环节,是以事实和数据驱动管理的具体体现测量阶段确定测量系统稳定性现状确认确认项目目标本章三大知识点基本统计学:随机变量及分布、常用离散型随机变量分布、连续型随机变量分布,中心极限定理与常用统计量分布测量系统分析过程能力分析基本统计学第4页模块目的通过学习,学员将:掌握统计学有关的基本概念和术语掌握各类数据分布的应用掌握数据分布的检验方法第5页随机现象与变量随机现象在一定条件下,并不总出现相同结果的现象称为随机现象随机现象的两个特点随机现象的结果至少有两个至于哪一个出现,事先并不知道随机变量:表示随机现象结果的变量称为随机变量随机变理的取值有两种不同的类型第一种是离散型随机变量第二种是连续型随机变量第6页随机变量的特征随机变量的取值是随机的,但内在还是有规律,这个规律性可以用分布来描述。分布包含如下两方面内容:X可能取哪些值,或在哪个区间上取值X取这些值的概率各是多少,或X在任一区间上取值的概率是多少位置或者中心趋势反映了分布的中心或者分布数据的中点。离散程度反映了分布数据的变化范围。离散型随机变量和分布如果随机变量X只取有限个值:x1,x2,x3,…,且P(X=xi)=pi,则称X为离散型随机变量。其可用分布列表示如下:X=xix1x2…xn…P(X=xi)=pip1p2…pn…第8页连续型随机变量和分布如果随机变量X只取值是无限个,称X为连续型随机变量其分布图可以根据绘制频率直方图得出。随着数据的不断增加,频率趋于稳定,频率的稳定值就是概率,单位长度上的概率简称概率密度,这条曲线的函数称为概率密度函数4647484950515253540510152025distributionsFrequencyHistogramofdistributions,withNormalCurve(process=QCNArro)分布曲线和直方图直方图示例某银行对其所属的某营业网点进行抽样调查,其中测量了网点在2月8日(周五)从上午10点至下午3点间所有顾客(共40人)的等候时间,试绘制直方图。数据如下:3115282915143875622741492123322096222518562311422710148211928436235247356512915直方图示例利用MINITAB实现方法选择“图形>直方图”中的“简单”指定“图形变量”即可得出如下:100806040200121086420C1频率形状1.752尺度38.01N40C1的直方图Weibull第11页连续型随机变量和分布概率密度函数是描述连续型随机变量分布的最重要和最基本的工具,令P(x)为连续型随机变量X的概率密度函数,则P(X)满足:P(x)≥0,概率密度函数为非负函数;概率密度函数曲线与实轴围成的面积为1;区间[a,b]上的概率可由概率函数在该区间上求积分得到随机变量X小于或等于实数x的概率F(x)=P(X≤x)有badxxpbxaP)()(1)(dxxpxdttpxXP)()(F(x)又称累积分布函数,或分布函数随机变量的数字特征均值:表示分布的中心位置,反映分布的集中情况,用E(X)表示。方差:可用来表示分布的波动大小,用var(X)表示。离散型随机变量均值、方差表达式:连续型随机变量均值、方差表达式:ÞÞ-xp(x)dx)(xEÞÞ-2p(x)dxE(X)]-[x)var(xiiipxxE)(iiipxExx2)()var(第13页例题(一)产品重量服从均值为15g,标准差为0.12g的正态分布,问出现大于15.3g的概率是多少?小于14.8g的概率是多少?大于14.8g而小于15.3g的产品占所有产品的比例是多少?解:用MINITAB分析“图形>概率分布图>查看概率”在分布与阴影区域输入如下值选择正态分布输入均值与标准差选择X值输入值例题(一)从分析可以看出,出现大于15.3g的概率为0.621%。见下图:同理可以求得:出现小于14.8g为4.78%,大于14.8g而小于15.3g的概率为94.6%3.53.02.52.01.51.00.50.0X密度15.30.0062115分布图正态,均值=15,标准差=0.12例题(二)航班每次飞行坠机率为十万分之一,每位乘客保费为20元,死亡赔付金额为40万元。问保险公司从每位顾客手中平均获取多大利润?解:其分布表排列如下:平均收益为:E(x)=20×0.99999+(-400000)×0.00001=15.9998x01p0.999990.00001y20-400000随机变量的均值与方差运算基本公式:E(aX+b)=aE(X)+bVar(aX+b)=a2Var(X)E(X1+/-X2)=E(X1)+/-E(X2)Var(X1+/-X2)=Var(X1)+Var(X2)设随机便量X与Y相互独立,均值分别为5与9,方差分别为2与2.5,求:求U=3x+5的均值与方差求V=2x+4y的均值与方差求W=x-y的标准差以下为绿带经常使用的离散性分布:0-1分布二项分布泊松分布超几何分布大纲要求描述和应用下述经常为绿带使用的离散性分布:1)0-1分析,2)二项分布,3)泊松分布,常用的离散分布0-1分布事件只有两表现形式,其分别记为0与1,若0的概率为P,1的概率则为1-P,则称随机事件X服从0-1分布,记为X~B(1,P):0-1分布的均值、方差与标准差为:E(X)=P,Var(X)=P(1-P),X01P(X=xi)=pi1-PP)1(pp0-1分布二项分布离散型二元事件(发生/没发生)发生次数的概率分布,抛硬币过程为典型的二项分布,设每次抛硬币的过程中,正面向上的概率为p,则在抛n次硬币的过程中出现x次正面向上的概率为:二项式分布是属性控制图p图和np图的基础:二项式分布的均值、方差、标准差如下:xnxxnPpCxp)1()()1()1()var(pnppnpxnp二项分布二项式分布的表达式:B(n,P)例题从一批产品中随机抽取进行检测,根据历史数据知,产品的不合率为10%。假设要求产品检测人员每抽取一件产品,检测完毕后,要放回这批产品中(又称为有放回抽样)。检验人员共检测了6件产品,问检测到的不合格品数分别为0,1,2,…6的概率?并画出概率分布图。解:1)没有不合格品的概率为:2)有一个不合格品的概率为:3)同理可求2、3、4、5、6件不合格品的概率,分布列表如下:5314.09.0)!06(!0!6)1.01(10.0)0(60606CXP3543.09.0)!16(!1!6)1.01(10.0)1(51616CXPX0123456P0.53140.35430.09840.01460.00120.00010.0000泊松分布泊松分布是反应特定时间或空间里某件随机事件发生次数的概率分布。其密度函数为:泊松分布是属性控制图u图和c图的基础:!)(xxpxe:总体平均值e=2.718282泊松分布的重要特点:可叠加性泊松分布例题一条生产导弹的流水线,当每枚导弹制造完成时,要通过一个空气动力模型进行检查,对照设计要求把各处不合格记录下来。任何严重的不合格都可能成为拒绝接受的理由。过去的历史数据显示,每枚导弹平均有三个次要的不合格项。问:生产的导弹没有次要不合格项的概率是多少?解:请问有4个缺陷的概率有多大?%505.011!03)0(3330eeXP第23页超几何分布(Hypergeometricdistribution)应用场合用来描述属性数据总体N相对于样本n较小不放回抽样总体已知在N个产品中有d个缺陷品,那么抽出n个产品,在这n个产品里发现x个缺陷品的概率是:超几何分布的均值、方差分别为:nNxndNxdCCCxp)(常用的离散型分布以下为绿带经常使用的连续型分布:正态分布均匀分布指数分布对数正态分布威布尔分布大纲要求描述和应用下述经常为绿带使用的连续型分布:1)正态分布,2)均匀分布,3)指数分布,4)对数正态分布,5)威布尔分布常用的连续型分布正态分布正态分布钟型概率分布,由两个参数(,)决定。也称Z分布正态分布的密度函数为:标准正态分布=0,=1,记为X~N(0,1)一般正态分布转化为标准正态分布的转化式为:即:xZ22122xexfx~N(0,1)第26页常用的连续型分布正态分布应用例子:例:产品的长度服从N(5,4),随机抽查一件产品发起其长度大于9的概率有多高?长度大于1,小于8的概率有多少?均匀分布:概率密度函数为:均匀分布的分布函数为:均匀分布U(a,b)的均值、方差与标准差分别为:均匀分布第28页练习电话应答等待时间服从0—60秒的均匀分布,则应答等待时间的均值和标准差分别是多少?指数分布指数分布应用场合首次产品首次发生故障的时间或发生故障需要维修的时间;指数分布的密度函数为:指数分布的分布函为:指数分布的均值、方差分别为:1)(x0)(1)(xpeexpxx12210)()(1)()(xXPxFexXPxFx0,0,xx0,0,xx连续型分布练习一家城市水资源管理公司,平均每年发生500次泄漏。假定两次泄漏的间隔时间服从指数分布。问:周未(从周五晚上6点至周一早上6点)工作人员没有接到报修电话的概率是多少?并画出其分布图。解:平均间隔时间λ的值为周五晚6点至周一早6点之间共有60个小时,这60个小时内发生泄漏的概率为:未接到泄漏的概率为:52.1750024365MTBF057.052.171%7.961)60(52.17/60eXP%3.3%7.961第31页常用的连续型分布威布尔分布威布尔分布用途寿命试验与可靠性威布尔分布的概念密度函数威布尔分布的形状参数α往往与失效机理联系。例如,工作寿命分布,常常α<1的情况下为“早期失效期”,α=1为“偶然失效期”,α>1为“耗损失效期”。威布尔尺度参数β起到放大与缩小常数比例的作用。位置参数γ是一个平移参数,有时又称为最小保证寿命。产品在γ以前不会失效,即失效的概率为零)(1)xex(0xx)(xp以下为绿带经常使用的统计量分布:均值分布-中心极限定律t分布卡方-c2分布F分布大纲要求描述和应用下述经常为绿带使用的常用统计量分布:1)均值分布-中心极限定律,2)t分布,3)卡方-c2分布,4)F分布常用统计量分布总体与样本总体研究对象的全体称为总体个体构成总体的每个成员称为个体统计学的主要任务总体是什么分布总体的均值,方差,标准差样本从总体中抽取部分个体所组成的集合称为样本一般采用样本来推断总全统计量统计量的概念不含未知参数的样本函数称为统计量描述样本集中位置的统计量样本均值:其缺点是受极端值的影响比较大样本中位数:中位数不受极端的影响,但不能反应数据全体的信息样本众数:样本数据中出现频率最高的值描述样本分散程度的统计量样本极差样本方差样本标准差样本变异系数样本标准差与样本均值之比称为样本变异系数第36页总体参数样本统计量x平均值标准差(方差)比例(百分比)s(s2)p(2)P1.总体参数是唯一的,但通常是不知道的,如全国所有人的平均身高。2.样本统计量被用来估计总体参数。总体参数vs样本统计量中心极限定理和抽样分布中心极限定理个体X服从平均值为,方差为2的分布,则无论个体X服从何种分布,当样本量n增加时,样本平均值X接近于正态分布,并且:中心极限定理的用途:使得控制图成为可能xnx22第38页应用举例电话应答等待时间服从0—60秒的均匀分布,每天抽取100个电话应答的等待时间并计算其平均值,则:
本文标题:六西格玛测量培训教材-冠卓
链接地址:https://www.777doc.com/doc-420635 .html