您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 6sigma统计数据分析教程培训教材
16Sigma数据及统计基础数据介绍2六西格马突破步骤定义测量分析改进控制步骤1-选择输出特性-定义过程输入/输出变量步骤2-确定绩效标准步骤3-定义测量系统步骤4-建立过程能力步骤5-定义绩效目标步骤6-定义差异来源步骤7-查找潜在因素步骤8-发掘变量之间相互关系步骤9-建立操作公差范围步骤10-重新验证测量系统步骤11-重新计算过程能力步骤12-实施过程控制3数据基础:需要考虑的问题•什么是数据?•什么是不同类型的数据?•为什么连续性的数据更好?•什么是数据采集计划?•怎样是一个合理的分组?5l计数型数据(不连续的数据)-类别-是,否-通过,不通过-合格/不合格-好的/有缺陷的-计算机设备故障,缺陷的次数l计量型(连续性)数据-连续性数据小数的位数反映出数与数之间的绝对距离时间,财务费用,长度,宽度数据的类型6离散型数据和连续性数据不合格合格电路温度温度计时间连续性数据样例离散型数据样例NO-GOGO卡尺数量单价描述共计1$10.00$10.003$1.50$4.5010$10.00$10.002$5.00$10.00装货单7离散型数据和连续性数据•对于某一过程为获得相同的理解水平•离散型数据•提供有限的信息•连续性数据•提供丰富的信息8这是什么?•假设:我每班生产3000-4000件零件,一天3班我通过目视检查零件合格/不合格–问题:我是否可以只认为这是离散型数据吗?•也许不是:我可以计算每班的缺陷百分比,这样每周就可获得15个“连续性”的读数–如果你有类似的数据,请同你的黑腰带一起谈论此类数据的局限性/注意事项。9或者这种情况?•我可将我的产品分成10类,1代表最好,10代表报废–问题:我可以采用此法吗?–是的,但必须值得注意的是你只有10个分类•指导:–至少有10中类别.–每一种类别之间的“距离”应该是尽可能是一致的。11数据&统计重要性:•数据,自身,并不提供信息.•你必须对数据进行处理来提供信息.•我们采用统计对数据进行处理.12不连续性(计数)连续性(计量)连续性(计量)不连续性(计数)输出输入Chi-square变差分析,T-检验判别式分析逻辑性回归分析相关性分析简单回归分析统计技术•统计技术适用于不同数据类别的组合。这些统计工具通常用于过程改善。你们会即将了解这些工具。比例测试13好,但哪里才能得到我们的数据呢?•若完成真实的项目,我们需要真实的数据•真实的数据可能是散乱的,糟糕的,并难于寻找•其中一个基本的工具是明确什么是你所需要的,并设计出简单明了的计划或表格进行收集相关数据14数据采集计划所需回答的问题•你想知道过程的什么方面?•你如何计划你所需要知道的?•什么样类型的工具会产生你所期望的情形?•什么类型的数据需要收集工具?•在生产过程中造成变差可能的原因有哪些?(X’s)•在生产过程存在循环吗?•谁负责收集数据?15数据采集计划所需回答的问题(继续)•你将用多长时间来获得你所需要的数据?•你将怎样对测量系统进行评价?•操作定义是否足够详细?•你将怎样展现数据?•数据是否可以得到?如果不行,你将会怎样制定你的数据采集表?•数据采集将发生在何处?•你的数据采集计划是怎样的?16数据采样计划模型回答关键问题计划执行数据采集计划17合理的分组一个合理的分组是将相似类别的事物进行逻辑性的筛选,例如:工序,天数,班次,小时,操作工,单位,零件,原材料批,等。•一个确定的合理化分组必须是用于制定的工序或项目•一旦合理化分组在数据采集计划中建立,研究的周期就很容易确定。•采用合理化分组可以帮助我们确定在研究过程中所出现变差的原因。18更多的关于合理化分组•合理分组之所以被这样定义是因为它们仅包括普通原因所产生的变差。(正态随机变差)•合理化分组代表短期数据。一般来讲,合理化分组的类型包括:操作工变更,工装变更,材料变更,启动循环,午饭前后,等.–如果收集的数据超过上述条件,其中就可能会包含一些隐藏的或不确定的应被归于特殊原因的因素–另外,合理化分组仅适用于正常的生产方式,而不需人为的添加写特殊因素,例如:试生产21数据基础:课程总结•一个周全、严密的数据采集计划能够确保记录正确的数据并观测到所有变差的原因•当可靠的数据用于分析,统计的意义将会被得到验证。•对于数据采集人员,数据收集计划必须浅显易懂•数据采集练习是必须的22数据基础:输出•根据你项目中所涉及的问题拟订一个周全的数据采集计划。•小组的所有成员必须对为什么,何处,何时和怎样采集数据有一致的理解•可靠数据的采集是对项目进展的推动•对数据的处理可以提供所需的相关信息23数理统计基础统计基础24六西格马突破步骤定义测量分析改进控制步骤1-选择输出特性-定义过程输入/输出变量步骤2-确定绩效标准步骤3-定义测量系统步骤4-建立过程能力步骤5-定义绩效目标步骤6-定义差异来源步骤7-查找潜在因素步骤8-发掘变量之间相互关系步骤9-建立操作公差范围步骤10-重新验证测量系统步骤11-重新计算过程能力步骤12-实施过程控制25数据基础:所需解答的问题•什么是统计?•什么是居中趋势的测量?•任何测量变差?•为什么我们须关注稳定性?•什么是分布,什么是正态分布?•为什么“曲线下方的区域”是重要的?•Z-bench和Cpk有何区别?•样本同母体之间的关系是怎样的?26统计•统计是对数据的组织,分析和解释–每步的码数–每加仑英里数•统计使成百上千的的单个数据便得有意义。27统计–测绘数据的益处统计是工具.象其它工具一样,它们同样可以被误用,导致令人误解的,歪曲的,或不正确的结论。仅能够计算是不够的,我们必须对数据作出正确的解释。统计中一项重要的分析工具就是不断描绘数据。28变异性,中心度,和稳定性•变异–某一过程的差异有多大?众所周知,每一过程都会有一定的移动,但不是每一个移动都会得到完全相同的结果。–通常我们采用标准变差对过程的差异进行衡量。这是我们的重点。–其它关于差异的参数有:•极差(最大之与最小值之差)•偏差•平方和291n)X(Xn1i2isminmaxRange1n)X(Xn1i2i2s变异性的测量-公式•极差:在某一数据集合中最大值同最小值之间的数字化的距离•样本方差(s2;s2):每一单个数据同均值的差的平方和的平均值•标准偏差(s;s):方差的平方根。通常表示数据的分散程度。它越小,数据分散程度越小,加工精度越好。计算机可以胜任所有艰难的工作31变差的组成部分•普通原因:–任何过程中都有“活跃的因素”–这正是我们在3组/班每组内所看到的–为减少此类的变差,我们通常需要对过程或技术进行变更•特殊原因:–该变差是由于某一“确定”的输入,如:每班采用不同的标准值,材料供应商发生变更,工装变更等–这正是我们在组与组之间所看到的–为减少此类变差,我们通常需要改善和加强对过程的控制32变异性,中心度,和稳定性•居中–中心趋势的测量–过程处于何处?“平均数”位于何处?–通常对中心趋势的测量为均值(m)(发音为mu),经常被称为X•这是传统的算术平均法,全部相加再平均。–其它中心趋势的测量值:•中数:表示数据的分布中心位置•众数:在一组数发生频率最高的值nnnnxx133测量中心度-练习•计算下列每组数的均数,中数和众数。并记录在指定位置序号数列1数列2数列3A539B661C431D548E531F746G41610H741I657J331K3410统计数列1数列2数列3中位数中值重数34变异性,中心度,和稳定性•稳定性(在改善之前其过程必须是稳定的)–过程长期的表现如何?–稳定性是代表恒定的平均数并可预测未来变异如果过程是稳定的,其变差将会围绕一定的平均值来回摆动。过程可能好可能坏,但是你可以对其发展趋势进行预测并对取得进步进行测量。只有稳定的过程才能被测量。某一过程过程能力每天都有差异,你又如何确定其能力呢?35有关稳定性的问题5152523242526ObservationmetersRunChartformeters21222253545ObservationFeetRunChartforFeet这两个过程大概的均值是多少?如果该数据来源于某一周,那在下周这两个过程的均值会如何?36201001451351251151059585756555SampleNumberSampleMeanX-barChartforMachineAX=100.7138.462.932010011010090SampleNumberSampleMeanX-barChartforMachineB11X=101.0108.593.4220100120115110SampleNumberSampleMeanX-barChartforMachineCX=115.0119.7110.4统计–一般练习•机器A,B,C生产同样的产品(极差图受控),每个产品输出差异的目标值为100mm。1.哪些设备显现出变异?2.每台设备中值在何处?3.哪些设备具有可预测性?4.哪些设备具有特殊原因的变异?5.对于今天的工令你将采用哪台设备进行生产?6.大体哪台设备最容易稳定?37统计-改进过程流程•依据下列步骤采用数据对过程进行改善。首先进行步骤1(稳定性),步骤二通常为(差异),需在步骤3(中心定置)之前完成。•1)确定过程是否稳定。如果不稳定,确定并剔除导致不稳定的因素。•2)评估所有变异性的级别.根据计数规范要求是否可接收?如果不能接收,确定变异性的来源并消除或减少其对过程的减少。•3)确定过程中值所在的位置。若没有达到目标,确定影响中值的相关因素并优化设置以达到目标值。38变异是敌人•今天早上你所在教室的温度为50华氏度,你是否感觉舒适?•那么,现在我将温度提高之90华氏度,你现在又感觉如何?•你有什么问题吗?今天,室平均温度已为70华氏度客户对变异的敏感度要高于中值39如果设置相关工程目标分别为1.000”及1.002”;那么每边的间隙为.001”。(.002”总共)转轴技术规范轴套1.002”-.000”/+.005”轴1.000”-.005”/+.000”轴套内径-轴外径=间隙1.002”-1.000”=.002”(total)ExactlytoNominal=OK4轴套间隙轴与轴套的实例40•如果你采用全公差,那么你可能会有.995”的轴,及1.007”的轴套,对于每边的间隙为.006”(总共为.012”)•TakeAway:变异是敌人,其加大了间隙使其发出异响并过早磨损。(但在公差之内就是合格的吗?)转轴轴套内径-轴外径=间隙1.007”-.995”=.012”(总共)在公差范围之内,但是预期间隙的6倍轴套间隙实例继续41分布•我们可以对相同的变差,多次、通过产品、不同的机器等,以点绘数据描述或归纳任何过程特性•这些数据的积累可被视为一种数据的分配并通过点图,柱状图,或正态分布来显现。42::...:..::::::.::::.::.:...:.:.:::::::::::::::.::.::::..::.-------+---------+---------+---------+---------+-------GPM49.0049.5050.0050.5051.00点图&柱状图51.350.850.349.849.348.8403020100GPMFrequency4352.051.551.050.550.049.549.048.548.0正态分布•正态分布假设使有限数据采集近似于无限数据采集。44正态分布•世上大部分的过程都属于正态分布–大部分的数据多集中在中心线附近–离中心线或中值越远,相关的数据点也会越少。•确定一个完整的正态分布,你只需要两条信息:–你需要知道该分布的中心位于何处。我们通常用中值来表示–你需要知道该分布的宽度。宽度即为变差,这些点同中心的距离。我们通常用标准偏差来反映。45正态分布-属性正态分布的两种属性:(1):我们已经阐述过通过中值和标准偏差对正态分布进行完整描述。(2):曲线下面的区域通常用于估计某一事件发生的可能的
本文标题:6sigma统计数据分析教程培训教材
链接地址:https://www.777doc.com/doc-1235966 .html