您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据结构与算法 > 数据统计分析方法和应用
数据统计分析方法及应用品质管理部数据统计数据分析Part1Part2Part3分析报告数据化培训内容概要01PARTONE数据统计1、数据统计的重要性美国杜邦公司的总经理理查德曾经指出“现代公司在许多方面是根据统计来行事的。我国著名经济学家、人口学家马寅初先生曾说过一句话“学者不能离开统计而研究,政治家不能离开统计而施政,事业家不能离开统计而执业。香港城市大学管理科学系介绍统计专业时用了四句话:1、各大国际机构和企业均设立完善的信息系统2、统计是信息系统不可缺少的一项功能3、所有具有规模的企业均视数据库为“金矿”4、统计分析便是开采这个“金矿”的最有效武器1、数据统计整理的含义和内容含义将调查得到的统计数据根据分析的目的进行审核、分类、汇总等加工处理,使之系统化、条理化,能够反映事物总体特征的综合资料的工作过程。内容包括数据处理和数据管理。数据处理包括分类、汇总、表现(制图、表);数据管理包括输入、贮存、更新、输出。统计整理的步骤编制统计表或统计图。通过日常的统计图,我们有时候可以直观地看出生产中的异常点。数据处理,数据的处理环节至关重要,数据的处理是否科学合理,直接决定分析的结果是否科学有效。数据的审核、筛选和排序,发现数据的基本特征,要发现数据中的错误,比如数据输入失误造成的数据错误,计算出现的错误等,这些数据必须规避,否则会对分析结果造成错误的影响。制定系统的整理方案,主要包括指标体系的设计,统计表、图的设计,具体工作计划的安排(人员、时间、培训)等。4321常用的数据统计方法1234EWMA指数加权移动平均值法高斯正态分布图SPC统计过程控制法VLOOKU函数一、EWMA指数加权移动平均值法EWMA是一种在一系列数据中显示趋势变化的方法。该方法为一数据处理模型,当一段时间内数据较多,且较为分散,散点图和折线图无法准确的表现出该组数据的变化趋势,我们这时候采用EWMA指数加权移动平均值法来确定该组数据的变化趋势。根据实际的观测值(或量测值)我们可以求取EWMA数值如下:1、En-1:前n个测量值的平均值,n=1/(1-λ);2、En=(1-λ)Mn+λEn-1;Mn为第n个测量值一、EWMA指数加权移动平均值法λ(0λ1)﹐表EWMA对于历史量测值之权重系数﹐其值越接近1,表对过去量测值的权重较高。从另一个角度看,λ决定了EWMA数值和跟踪实际数据突然发生变化的能力即时效性。显然随着λ增大,估计器的时效性就越弱,反之越强;另一方面,由于λ的存在,EWMA还表现出一定的吸收瞬时突发的能力,这种能力称为平稳性。显然随着λ减小,估计器的平稳性减弱,反之增强。一、EWMA指数加权移动平均值法—应用实例•EWMA趋势图二、高斯正态分布法高斯正态分布法的作用就是把同一指标两个时间段内的数据按正态分布处理,分别计算两组数据的平均值和标准偏差。通过做成的柱状图表示出两组数据的差别。方法是分别计算两组数据的平均值和标准偏差做成柱状图,柱状图中心越高,表明该组数据平均值越大,柱状图越长,表明该组数据标准偏差越大,数据波动较大,控制能力较差。对于数据的比较非常有用,可以对比不同时期指标的控制和波动情况。二、高斯正态分布法—应用实例•高斯分布图三、SPC趋势图1、定义SPC即统计过程控制是利用统计方法对过程中的各个阶段进行控制,从而达到改进与保证质量的目的。首先表现出指标的变化趋势,其次表现出指标偏离目标值得距离。u-2σ和u+2σ的宽度表示指标和目标值差值的标准偏差,首先宽度和指标和目标值的偏差大小相关,偏离目标值越大;宽度越大其次和指标的分散程度相关,分散程度越大,宽度越大。位于u-2σ和u+2σ两条线之内的点属于正常波动,但是位于u-2σ和u+2σ两条线之外的点要实际去调查是否属于正常波动。u-2σ和u+2σ可能比较严格,因为正态分布在u-2σ和u+2σ之间占64%左右,可以用u-3σ和u+3σ来表示这两条线,如果点在这两条线之外,那么就有可能不是指标的偶然波动,而属于工艺事故,这就要求我们要实地去调查该批次的生产情况。2、表现意义•SPC趋势图三、SPC趋势图—应用实例四、VLOOKUP函数VLOOKUP函数是Excel中的一个纵向查找函数,按列查找,最终返回该列所需查询列序所对应的值。该函数的语法规则如下:VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)数简单说明输入数据类型lookup_value要查找的值数值、引用或文本字符串table_array要查找的区域数据表区域col_index_num返回数据在查找区域的第几列数正整数range_lookup模糊匹配TRUE(或不填)/FALSE四、VLOOKUP函数—语法重点Lookup_value是一个很重要的参数,它可以是数值、文字字符串、或参照地址2括号里有四个参数是必需的13Table_array是搜寻的范围,col_index_num是范围内的栏数在使用该函数时,lookup_value的值必须在table_array中处于第一列4•VLOOKUP函数四、VLOOKUP函数—应用实例02PARTTWO数据分析一、方差分析•方差分析是从观测变量的方差入手,研究诸多控制变量中哪些变量对观测变量有显著影响的变量。通过分析不同来源的变量对指标变异的贡献大小,从而确定可控因素对产品变异指标影响的有效性。•可以通过对比同一因素不同影响的两组数据,确定在同样的范围内波动或是有明显的差别,确定该变量是否为指标变异的有效变量。一、方差分析数值小于0.05,说明该因素差异比较显著,对产品变异的影响是有效的。一、方差分析数值大于0.05,说明该因素差异不显著,对产品变异的影响是无效的。•方差分析—数据处理•方差分析一、方差分析—应用实例因果图就是当一个问题的特性受到一些要因的影响时,我们将这些要因进行整理,成为有相互关系且有系统的图形。简言之它是一种将造成某项结果的诸多原因,以系统的方式(图表)来表达结果与原因之间的关系,又称为“特性要因图”。由于因果图其形状与鱼骨相似,故又常被称为“鱼骨图”。二、因果图二、因果图因果图1、原因追求型:列出可能会影响过程的相关因子,以便进一步从其中找出主要原因,以此图形表示结果与原因之间的关系。2、对策追求型:目的在于追寻问题点应该如何防止,目标结果应如何达成的对策,故以因果图表示特性与要因间的关系。1、整理问题;2、追查真正的原因;3、寻找对策。将问题及造成问题的原因按父项及子项分类罗列后,选择“分析”--“质量和过程”--“关系图”--“确定”--“为选定列指定角色”--“确定”。具体步骤如下图:二、因果图二、因果图•因果图二、因果图—应用实例三、相关性分析0301能了解原因与结果(即两个变量)之间是否存在某种相关的关系检查孤岛现象是否存在相关性分析的作用02两个变量相关性高时,二者可互为替代变量,从原因或结果中选择较经济性的变量予以控制,通过观察某一变量的变化而知另一变量的变化。线性拟合根据变量的个数可分为两个变量、三个连续变量以及多个变量的拟合。首先介绍2元变量拟合图的做法:将两个相关变量的数据输入JMP后,选择“分析”--“以X拟合Y”--“为选定列指定角色”--“确定”。具体步骤如下图:三、相关性分析—二元拟合选择“拟合线”拟合置信区间着色拟合置信带三、相关性分析—二元拟合多元拟合图(油条大饼图)的做法:将多个变量的数据输入JMP后,选择“分析”--“多元方法”--“多元”--“为选定列指定角色”--“确定”。具体步骤如下图:三、相关性分析—多元拟合三、相关性分析—多元拟合•二元线性拟合•多元拟合三、相关性分析—应用实例•目前,各生产单位物料周期均根据日常生产经验判断,在判断过程中存在不可预知的因素,在生产发生变化的情况下,可能对物料的周转周期存在误判,缺乏科学性。•因此,要准确判断生产工序物料周转时间,必须依靠数据分析,科学化地找出精准的时间周期,从而为查找导致生产出现异常的原因提供科学的方法和依据。三、相关性分析—生产周期分析法原理根据不同物料周期不同数据之间的线性相关性,确定物料最合适的周转时间。目的精确计算不同工序间的生产周期分析工具1、EXCEL数据软件2、Vlookup函数3、JMP数据软件三、相关性分析—生产周期分析法•生产周期分析法—应用实例三、相关性分析—生产周期分析法1、了解数据分布的形态;2、研究和分析过程能力;3、判断数据的真实性;4、计划产品的不良率;5、求分布的平均值与标准差;6、确定控制规格界限;7、与规格或标准值比较。直方图法的应用目的B通常用来对某些需要加强控制的工序进行观察、分析,为工序调整和控制提供依据。直方图法的作用A四、直方图的作用和应用目的(a)正常型正常型,又称对称型,它的特点是中间高,两边低,左右基本对称,说明工序处于受控状态(b)孤岛型孤岛型,它的特点是在远离分布的地方出现小的直方图形,犹如孤岛,“孤岛”的存在表示在短时间内有异常因素在起作用,使加工条件发生了变化。四、直方图——常见直方图及其意义(c)偏向型偏向型,它的特点是直方图的顶峰偏向一侧,也叫偏坡型,当技术标准要求是单一侧向时,常出现此种情况,有的是由于操作者的加工习惯引起的。如:在加工轴的时候往往偏大,而在加工孔的时候往往偏小等。(d)双峰型双峰型,它的特点是有两个高峰。这往往是由于两种不同分布的数据混在一起引起的,例如把两个工人加工的同种产品或两台设备加工的产品混在一起等。发生双峰型应把数据先进行分层,然后再做直方图。四、直方图——常见直方图及其意义(e)平顶型平顶型,它的特点是直方图呈平顶型,这往往是由于生产过程中有缓慢变化的因素在起作用,如刀具的正常磨损、操作者的疲劳等。应采取措施控制诸因素稳定地处于良好状态。锯齿型,它的特点是直方图高低参差不齐,但整个图形整体看起来还是中间高两边低,左右对称。造成这种情况,往往不是生产上的问题,主要是分组组数过多或测量仪器精度不够,读数有误等原因引起的。(f)锯齿型四、直方图——常见直方图及其意义以上图表我们可以获取以下信息:1、当落窑品指标合格率高时,白度、7.5m温度、21.5m温度、窑尾温度和二次风温度均比较集中于某个范围;2、当落窑品指标合格率低时,白度、7.5m温度、21.5m温度、窑尾温度和二次风温度分布比较宽,范围跨度大。通过以上分析我们可以找出当落窑品指标合格率高时各指标控制范围,有利于稳定生产。四、直方图—应用实例•直方图•多元直方图四、直方图—应用实例控制图是对过程数据加以测定、记录和绘图,从而进行控制管理的一种用统计方法设计的控制图型。图上有中心线(CenterLine)、上控制界限(UCL)和下控制界限(LCL),并有按时间顺序抽取的样本统计量数值的描点序列.参见下列控制图示图:上控制限中心线下控制限五、控制图μ+1σ+2σ+3σ-1σ-2σ-3σ68.26%99.73%95.45%五、控制图——设计原理图示说明五、控制图——单值-移动极差控制图五、控制图——单值极差控制图—应用实例•单值极差图五、控制图——取样树首先,学习一下取样树相关知识,我们将会有以下收获:1、理解交叉与嵌套取样实验设计之间的不同点。2、在制定的方案中找出最佳的途径。五、控制图——取样树FactorRelationshipDiagrams(FRDs)因素关系表CrossedFactors交叉因素AB112212NestedFactors嵌套因素AB112234CrossedFactors交叉因素11221211122122ABCNestedFactors嵌套因素ABC11212343562478五、控制图——取样树FactorRelationshipDiagrams(FRDs)因素关系表CrossedthenNested先交叉后嵌套11223411562782ABCNestedthenCrossed先嵌套后交叉ABC11221213124122均值极差图是最常用、最基本的SPC计量型
本文标题:数据统计分析方法和应用
链接地址:https://www.777doc.com/doc-7032430 .html