您好,欢迎访问三七文档
第3章项目质量数据主要内容熟悉质量数据采集的概念及方法掌握质量数据统计处理方法掌握质量数据变异的数字特征及其度量理解质量数据的统计规律3.1概述项目质量数据的类型:根据项目质量数据特性的不同,可将其分为两类:(1)计量值数据,即可以连续取值的数据。(2)计数值数据,即不能连续取值,只能数出个数、次数的数据。根据使用目的不同,项目质量数据大体可分为以下几类:(1)掌握项目质量状况的数据。(2)分析问题原因用的数据。(3)管理工序、活动或作业质量用的数据。(4)判定项目质量水平的数据。项目质量数据的重要特点:(1)波动性质量数据并非同一,而是在一定的范围内存在差异。质量数据的这种特性称之为波动性。(2)规律性从表面上看,质量数据是杂乱无章的,但若作进一步分析处理,就可以看出:在正常情况(即稳定状态)下所获取的质量数据,往往呈现出一定的规律性。3.2质量数据采集方法3.2.1与质量数据采集有关的几个概念质量数据的采集方法:(1)全数采集:是指对所要管理的项目或工序中的所有“个体”都进行相关质量数据的采集工作。(2)抽样采集:是指从所要管理的项目或工序中抽取若干“样品”进行相关质量数据的采集工作。抽样采集涉及到以下几个概念:1.总体提供数据的原始集团(观察对象),或研究对象的全体。总体中的一个单元称为个体。有限总体:总体所含个体的数量是有限的。无限总体:总体所含个体的数量是无限的。2.样本与样品样本:是指从总体中抽取的一部分个体所构成的集合。样品:组成样本的每一个个体称。抽样:抽取样本的过程。样本容量:样本中所含样品的数量。总体、样本、样品之间的关系如图3-1所示。3.2.2质量数据采集方法在项目质量管理中,主要采取抽样的方法采集质量数据。抽样方法分成两类:(1)非随机抽样,即进行人为的有意识的挑选取样。(2)随机抽样。随机抽样排除了人的主观因素,使总体中的每一个个体都具有同等的机会被抽取到。这类方法所得到的质量数据可靠性好、代表性强,是一种科学的抽样方法。实现随机抽样的方式:1.单纯随机抽样:在总体中,直接抽取样本的方法就是单纯随机抽样。2.系统抽样:有系统地将总体分成若干部分,然后从每一部分抽取一个或若干个个体,组成样本。3.分层抽样:将项目或工序分为若干层,以便了解每层的质量状况,分析每层产生质量问题的原因。关于抽样误差:无论采用何种抽样方法,抽样误差是客观存在的。样本所提供的质量信息不一定恰与总体的质量状况相一致的误差,称之为代表性误差。代表性误差的大小主要取决于三个因素:(1)总体中的数据的离散程度,即总体质量的均一性。离散程度愈小,抽样代表性误差就愈小,代表性就愈好。(2)样本容量的大小。样本容量愈大,代表性误差就愈小。(3)抽样方法的随机性。随机性愈好,误差就愈小3.3质量数据统计处理方法3.3.1频数分布表基量整理:以数据的大小为基础,不考虑数据出现的先后顺序和时间的整理方法。例如:频数分布表示一种基量整理方法。基时整理:若要获得的某种质量信息与数据出现的先后顺序有关,则应按时间先后顺序加以整理的方法。例如:控制图则是一种基时整理方法。频数分布表:按数据大小排列后,以一定的间隔分组,然后计算每一组内的频数和频率,用表格表示频数分布状况。设:不同的数据为一个变量,以x表示,则这批数据即为x的一个变异数列。表示任一变量。fi表示出现的次数,在统计学中称fi为频数。全部频数之和为∑fi变量的频数fi占全部频数之和∑fi的比值称之为频率,用Pi表示,称之为相对频数。讲一个示例,以说明上述概念。iXiXiXiX频数分布表编制步骤:1.确定分组数(K)按组距相等的原则确定。一般来说,K的选取范围常在6~25之间,K=10最常用。通常应保持按K分组后,平均每组至少能有4~5个数据为宜。2.确定组距(h)分组数K确定后,组距h也就随之而定。h=1minmaxKxx3.确定组的边界值以一批数据中的最小值为第一组(从小往大排列)的组中值,加减1/2组距,即可得到第1组的下限和上限。第1组的上限即为第2组的下限,加组距即得到第2组的上限。依此,即可得到各组的边界值。4.计算组中值组中值=5.作频数分布表用频数符号表示出每个组的数据个数。结合具体例子讲上述步骤。2该组下限值该组上限值3.3.2直方图定义:为了能够比较准确地反映出质量数据的分布状况,可以用横坐标标注质量特性值,纵坐标标注频数或频率值,各组的频数或频率的大小用直方柱的高度表示,这种图形称为直方图。1.直方图的类型按纵坐标的计量单位不同,直方图可分为两种:(1)频数直方图以频数为纵坐标的直方图称之为频数直方图,它直接反映了质量数据的分布情况,故又称质量分布图。(2)频率直方图以频率为纵坐标的直方图为频率直方图。该图中,各直方柱面积之和为1,其纵坐标值与正态分布的密度函数一致,故可在同一图中画出标准正态分布曲线,可以形象地看出直方图与正态分布曲线的差异。质量特征值(X)频率2.直方图绘制步骤(1)采集数据根据作图意图采集相关数据。为使直方图能够比较准确地反映质量分布情况,一批制作直方图用的数据个数一般应大于50。(2)确定组数、组距及组的边界值直方图实际上是将频数分布表转换为图形,因此,组数、组距及组的边界值的确定与频数分布表完全一致。(3)统计每组频数(计算频率)采用查数的方式确定每组频数,并计算出频率。(4)绘制直方图1426102030fi134.5138.5142.5130.5126.50281822271频数直方图0.10.20.3Pi134.5138.5142.5130.5126.500.020.080.180.220.27频率直方图3.直方图的观察与分析(1)观察图形的分布状态通过观察图形的分布状态,判断其属于正常型还是异常型。1)正常型分布状态图的中部有一峰值,两侧的分布大体对称且越偏离峰值其数值越小,符合正态分布。表明这批数据所代表的实施过程中仅存在随机变异。因此,从稳定正常的生产过程中得到的数据所做出的直方图,是一种正常型直方图。2)异常型分布状态与正常型分布状态相比,带有某种缺陷的直方图称之为异常型直方图。表明这批数据所代表的生产过程异常。常见的异常型直方图:①偏向型。直方的顶峰偏向一测。计数值或计量值仅对一侧加以控制;或一侧控制严另一侧控制宽等,常出现这种图形。根据直方的顶峰偏向的位置不同,有左偏峰型和右偏峰型。仅控制下限或下限控制严上限控制宽时多呈现左偏峰型。左偏峰型右偏峰型②双峰型。一个直方图出现两个顶峰,这往往是由于两种不同的分布混在一起所造成的。也就是说,虽然测试统计的是同一项目的数据,但数据来源条件差距较大。③平峰型。在整个分布范围内,频数(频率)的大小差距不大,形成平峰型直方图,这往往是由于生产过程中有某些缓慢变化的因素起作用所造成的。双峰型平峰型④高端型。制造假数据,或将超出某一界限的数据剔除后,易出现此种类型的直方图。⑤孤岛型。在远离主分布中心处出现孤立的小直方,这说明项目实施过程在某一段时间内受到异常因素的影响,使项目条件突然发生较大变化。⑥锯齿型。往往是由于分组不当所致。如数据少,分组多时就可能出现这种类型。高端型孤岛型锯齿型(2)直方图与公差(或标准)对比将直方图与公差或标准对比,可以判断是否能稳定地生产出合格的产品。对比的方法:在直方图上做出标准规格的界限或公差界限。观察直方图是否都落在规格或公差范围内,是否有相当的余地以及偏离程度如何。约T/8约T/8BT几种典型的直方图与标准比较情况:1)数据分布范围充分地居中,分布在规格上下界限内,且具有相当余地。这是一种理想状态,项目处于正常状态,不会出现不合格品。2)数据分布基本上填满规格上下界限内,没有多少余地,稍有波动就会超差。出现这种状况,虽未产生不合格品,但应采取措施减小分散。TB3)数据分布偏向一侧,有可能超差。这表明控制存在倾向性。出现这种状况,应采取措施使直方图居于规格界限之中。BTBT4)数据分布与标准规格相比留有太多余地。这种分布虽能保证项目质量,但在经济上是不合理的。应考虑适当放宽控制,在保证质量的同时使项目的经济性更为合理。此外,若要求进一步提高项目质量,则可缩小标准规格。BT5)数据分布极为偏向一侧,部分数据已超出规格界限,产生了不合格品。这时应考虑是否有异常因素在起作用或重新研究标准规格是否合理。6)数据分布过于分散,超出标准规格上下界限,产生了不合格品。应采取措施减小分散或研究标准规格是否合理。BTBTBT7)绝大多数数据分布正常,但有少量数据超出标准规格界限成为孤岛,产生了部分不合格品。说明有异常因素在起作用,应加以查明并消除。BT3.3.3直线图与折线图1.直线图直线图是直方图的简化形式,即以质量特性值为横坐标,以频数(或频率)为纵坐标,以直线的长短表示频数或频率的大小。直线图的制作过程与直方图一致,所不同的是,直线所对应的位置为组中值。2.折线图以质量特性值为横坐标,以频数或频率为纵坐标,将各组频数(频率)所对应的点用折线连接起来形成的图形,即为折线图。3.3.4累计频率及其分布曲线1.累计频数及累计频率累计频数:质量特性值等于或小于某一数值时的频数。累计频率:累计频数与总频数的比值。2.累计频率分布曲线在实际工作中,常用累计频率分布曲线表示累计频率。累计频率特性值频率曲线图:以横坐标表示质量特性值,纵坐标表示频率,将各组(各特性值)频率所对应的点,用平滑的曲线连接起来形成的图形。频率特性值若设质量特性值为x,频率函数为P(x),累计频率函数为Y(x),a、b分别表示x的变异下限和变异上限,则P(x)、Y(x)之间的关系为:在质量管理工作中,若已求得频率分布函数P(x),通过积分即可得到累计频率分布函数Y(x);若已知Y(x),通过微分则可得到P(x)。xadx)x(P)x(Ydx)x(dY)x(Pba1dx)x(P)b(Y3.4质量数据变异的数字特征及其度量变异的数字特征,常采用集中性、离散性、偏度与峰度来度量。3.4.1集中性变异的数据所表现出的集中的趋势称之为集中性。集中性是反映数据变异情况的一种典型特征。度量集中性的主要指标有:平均数、中位数和众数。1.平均数)n,,2,1i(xn1nxxxxn1iin21k1iik1i)i(ik21)k(k)2(2)1(1ifxffffxfxfxfx加权平均数:平均数是一批数据的中心,围绕这一中心集合着众多的数据,它反映出大量现象的典型特征。2.中位数(中值)一批数据按大小顺序排列,其中间的数值即为中位数。若k是奇数,中间的数只有一个,就是中位数;若k是偶数,中间的数有两个,则这两个数的平均数为中位数。用中位数表示数据的集中性比较粗略,但计算比较简单,当只需对数据集中性进行粗略描述时,可使用中位数。3.众数一批变异数据中,与最高频数所对应的数值即为众数。4.平均值、中位数、众数三者关系若一批数据的频率分布图完全对称,则三点重合(即三者相等);若频率曲线不对称,则三者不等。曲线越不对称,三者的差别就越大。三者都反映了变异数据的集中性。平均值定义较严谨,能较好地反映数据的集中性,因此,在质量管理中用的较多。3.4.2离散性离散性,反映了数据相对集中的程度或分散程度。主要指标有极差、标准差和变异系数。1.极差R极差,是指一批数据中最大值与最小值之差,一般用R表示2.标准差标准差也称之为均方差,是每个数据以平均值为基准相差的大小,比较全面地代表了一批数据的分散程度。minmaxxxR当数据个数很多即n很大时,标准差的计算公式为:n)xx(n)xx()xx()xx(n1i2i2n2221n)xx(n1i2i2当n较小时,则:n1i2i)xx(n1Sn1i2i2)xx(n1S3.变异系数C应用标准差与平均值的相对数值进行比较。该相对数值称
本文标题:第3章项目质量数据
链接地址:https://www.777doc.com/doc-781644 .html