您好,欢迎访问三七文档
第五章质量数据的统计处理一、质量数据的搜集控制现场分析数据调节数据检查数据搜集数据的目的数据的分类:计量数据计数数据统计数据的取样统计推断:从整批产品中随机抽取一定数量的样品进行测试,将样品测试的结果组成样本数据,通过对样本数据的分析来推断整批产品的质量。总体:研究对象的全体。组成总体的每一个单位称为个体。总体中包含个体数量称为总体容量,常用N表示。总体可以是有限的,也可以是无限的。样本:由总体抽取的部分个体组成。样本包含的个体数量称为样本容量。常用n表示。一般我们用X1,X2,…,Xn表示总体的一个样本,样本数值的取值记为x1,x2,…,xn,称为样本的观测值。随机抽样:从总体中随机抽取一定数目的个体单位作为样本进行观察,使每个个体单位都有一定的概率被选入样本,从而使根据样本所作出的结论,对总体具有充分的代表性。随机抽样能有效的避免主观性导致的倾向性误差(系统误差)。常用的抽样方法即指总体中的每个个体被抽入的机会是相同的。在简单随机样本中,X1,X2,…,Xn是相互独立的随机变量并与总体具有相同的分布概率。简单直观但抽样程序复杂。简单随机抽样系统随机抽样将总体单位按某一标志(如时间)排序,然后按一定间隔来随机抽取样本单位。实施方便,同时能够保证样本对总体的代表性,适合大批量生产的流水线上产品的抽查。若总体单位排序后呈现一定的规律性甚至周期性,而抽样间隔的周期正好于之吻合,依赖于这样排列的系统抽样就会产生系统性的偏差。分层随机抽样分层随机抽样也称为类型随机抽样,即先将总体按某些重要的标志分成互不交叉重叠的若干层,然后在各层中间采用随机抽样或其他抽样方式抽取若干样本单位,由各层的样本单位组成一个样本。样本代表性好,抽样误差小;缺点是抽样手续较繁琐。这种方法通常用于产品质量验收。整群随机抽样整群随机抽样也称为集团随机抽样,即在总体中,不是抽取个别样品,而是随机抽取整群的产品。这种方法是将总体按某个标志分成若干群,然后随机的的抽取若干群,并由抽中的群中所有个体组成样本。抽样实施比较方便;缺点是:由于样本只是来自个别几个群,而不能均匀的分布在总体中,因而代表性差,抽样误差大。这种抽样方法通常用于工序控制中。二、质量数据的整理与显示直方图,是用一系列宽度相等,高度不等的矩形来表示数据分布的图。矩形的宽度表示数据范围的间隔,矩形的高度表示在定间隔内数据出现的次数。条形图,条形图与直方图不同,互不相邻的矩形组成,矩形的宽度没有意义。三、质量变异及统计特征量描述产品质量的4M1E:操作人员(Man),一定的环境(Environment),运用机器设备(Machine),按照规定的操作方法(Method),对原材料(Material)加工制造的。质量的波动性质量的统计观点产品质量的变异的统计规律产品质量的变异规律:产品质量变异的幅度、不同大小的变异幅度出现的可能性。产品质量的统计观点:把产品的质量看成是受一系列因素影响,并遵循一定的统计规律不停变化的。质量因素偶然因素:偶然因素又称为随机因素。影响微小;始终存在;逐件不同;难以除去。异常因素:异常因素又称为系统因素。影响较大;有时存在;一系列产品受到同一方向的影响;不难除去。质量数据统计特征描述样本均值样本中位数:当样本容量n为奇数时,它恰为中间一个数,当n为偶数时,它是中间两个数据的平均值。集中程度特征量niixnx11离散程度特征量样本极差:样本方差样本标准差:1xxRnniixxns122)(11niixxns12)(11质量统计中常见的概率分布概率分布是指将随机变量在总体中的取值与其发生的概率二者相联系的数学模型。超几何分布nNxnNPNxNPPx)(nPEx)(1)1()(NnNPnPDx二项分布xnxxPPxnP)1()(nPEx)()1()(PnPDx泊松分布!)(xePxX泊松分布的典型用途是用于单位产品上发生的缺陷数的数学模型。)(xE)(xD正态分布u为总体均值,б为总体标准差,正态分布常记为x~N(u,б2)任一正态分布仅由u和б完全决定。μ称为分布位置参数,б称为分布形状参数,б越小曲线越抖,б越大,曲线越扁平。2)(21)(21uxxefμ+3δ99.73%95.46%68.26%μ-3δμ-2δμ+2δμ-δμ+δz=(x-μ)/б,则:)(ucPcx)(1cPczczPPczczPPcz)()(1221cccZcP例题:包装纸抗拉强度是一个重要的质量特性。假定包装纸抗拉强度服从正态分布,均值为μ=3.0kg/cm2,方差为σ=0.2kg/cm2。现购买厂家要求包装纸抗拉强度不低于2.5kg/cm2,问购买该包装纸能多大概率满足厂家要求。四、过程质量的抽样分布设是来自总体X的一个随机样本,是相应与的样本测量值,g()为样本构造函数,称为样本统计量。样本统计量的分布称为抽样分布。nXXX,...,,21nxxx,...,,21nxxx,...,,21中心极限定理无论总体服从什么分布,只要样本容量n足够大,来自这个总体的随机样本的均值具有近似正态性抽样分布。样本容量越大,样本均值抽样分布的正态性越好。样本比率分布总体中具有某种特征的单位占全部单位的比率称为总体比率,记为P;样本中具有此特征的单位占全部样本单位的比率称为样本比率,记为。p五、过程参数估计参数估计:从样本出发去构造某些适当的统计量来对总体的某些未知参数进行估计。参数估计可以分为点估计和区间估计。点估计矩估计法极大似然估计点估计的优良性准则通常考虑以估计量的均方误差MSE(MeanSquareError),因为它反映了估计量和参数真实值θ的差异大小。无偏性点估计量的期望等于被估计的总体参数。E()=θ通常称为以作为真实参数θ的估计量的系统误差。无偏性的实际意义就是无系统误差。有效性在满足无偏性的条件下的方差应该比其他估计量的方差小。2)(E区间估计参数的点估计法是用一个确定的值去估计未知的总体参数,存在一定的误差。因此采用估计参数在某一个区间的方法称为区间估计。区间估计是根据给定的可靠度要求,指出总体参数被估计的上限和下限。一般的说,对于总体待估计参数θ的两个估计量和其中(),使被估计参数落在(,)之间的概率为1-α,其中0α1。则称(,)为置信度为1-α置信区间。和均是样本估计量的函数,称为θ的置信下限和置信上限。1-α称为置信水平或置信概率,表示区间估计的可靠度;α称为显著性水平,通常取α为0.01,0.05,0.10。11112222置信区间的解释频率解释概率解释区间估计总是与一定的概率保证相对应。估计的区间越大,参数θ包含在该区间那的概率就越大,估计的可靠性就越大;统计量的方差越小,抽样误差越小,相同的概率下,估计的可靠性就越大,估计的精度就越高。单侧置信区间对于给定的显著性水平α,若由样本观测值确定的统计量()满足P(θ≥)=1-α则称置信区间[,‐∞)为θ的置信度为1-α的单侧置信区间,为单侧置信下限。nxxx,...,,21nxxx,...,,2111正态总体参数的区间估计总体方差已知,总体均值的置信区间总体方差未知,总体均值的置信区间2nZxnZxaa22,2nsnatxnsnatx12,12当为小样本情况下,要总体均值,用样本方差s2代替总体方差。2六、过程参数的假设检验参数估计和假设检验都是利用样本对总体进行某种推断,然而推断的角度不同。区间估计和假设检验的对偶性。对假设检验中的参数值的选择。假设检验原理检验对象的假设称为待假设或原假设,H0。例如,对总体均值是否为某一确定值的假设为H0:=。原假设的对立假设称为备选择假设,记为H1。假设检验的基本思想是:首先假定为真H0,考虑在H0成立的条件下,已经观测到样本信息的出现概率。如果这个概率很小,说明一个小概率时间在一次观测中发生了。而小概率原理认为,概率很小的事件在一次观测中几乎是不可能发生的,也就是所导致了一个违背小概率原理的不合理现象。说明事先假设H0为真是不正确的,因此拒绝原假设H0,否则不能拒绝原假设H0。0假设检验的两类错误由于作出推断的依据是样本信息,即根据部分去推断总体,因而假设实验过程不可避免的会引起两类错误。以真为假:p=α以假为真p=β将较严重的错误定义为一类错误,对α实施有效控制,将此类实验称为显著性实验。α称为显著性水平。双侧检验:H0:μ=μ0;H1:μ≠μ0单侧检验:右侧检验、左侧检验。单侧假设中,建立假设的原则原假设代表一种已存在的状态,而备选假设则反应改变。将不能轻易否定的事件作为原假设。例题:电视机显像管生产的质量标准为平均燃烧寿命1200小时,标准差300小时。某电视机厂宣称他们生产的显像管,质量远远超过规定的标准,为了进行验证,随即抽取了100件样品,测得平均寿命为1245小时。能否说明该厂显像管质量高于规定要求。检验功效曲线错误的接受H0的概率就是β就是第二类错误的概率,而1-β是作出正确判断的概率(H0为假的时候拒绝H0)。因此对接受H0这类的决策问题,β起着可靠性度量的作用。因此函数1-β(θ)称为检验的功效函数,β(θ)称为检验的操作特性函数或OC函数。n=1n=6n=15dβ七、相关与回归分析函数关系:变量之间依一定的函数形式形成一一对应的关系。即由一个或几个变量的值可以精确的求出另一个变量的值。相关关系:变量之间既存在较强的关系,但又不能由一个或几个变量去唯一确定的另一个变量的值的这种非确定性关系称为相关关系。相关与回归分析概念),...,,(21nxxxfy一元线性回归一元线性回归是研究一个自变量x与因变量y之间的线性相关关系的统计方法。自变量x是可以控制或精确测量的变量,y是一个确定的概率分布,因此y是一个随机变量,y的这些概率分布的均值随着x做有规律的变化,即有xyE10)(相关分析样本相关系数r就是用来描述两个变量习之间线性关系的密切程度的一个数量指标。相关系数r的符号与回归系数β一直。一般情况下当|r|=1时x与y完全线性相关,当r=0时,x与y完全线性无关,|r|越接近1,x与y之间的线性关系越强,回归效果越好,反之回归效果越差。niiniiniyyxxyyxxr12211)()())((
本文标题:质量数据的统计处理
链接地址:https://www.777doc.com/doc-5595520 .html