您好,欢迎访问三七文档
第一章统计学基本知识第一节统计的基本概念统汁技术是以概率理论为基础的应用数学的一个分支。统计技术是研究随机现象中确定的统计规律的学科。产品质量特性是一种随机现象,但这种随机现象在一定的范围内服从确定的统计规律——概率分布,其中最常见的是正态分布。按照实用型定义,统计技术是指与应用有关的统计方法,收集、整理、分析和解释统计数据,并对其所反映的问题的性质;程度和原因做出一定结论的科学技术。统计技术包括统汁推断和统计控制两大内容。统计推断是指通过对样本数据的统计计算和分析,提供表示事物特征的数据,比较两个事物之间的差异,分析影响事物变化的原因,找出产品形成全过程中质量变化的规律,对总体质量水平进行推断,预测尚未发生的事件;统计控制是指通过对样本数据的统计计算和分析,采取措施消除过程中的异常冈素,以保证产品质量特性的分布基本保持在设定值附近,使生产过程达到稳定受控状态。应用统计方法要掌握分布的理论,要符合大数定律,即只有对大量数据取得的统计平均值才具有稳定性和代表性,才能得出比较准确的统汁结论。因此,只有掌握基本的统计理论知识,才能较好地应用统汁方法,发挥统计技术在质量控制中的作用。一、统计数据数据是统计的对象。习惯上把由数字组成的数字数据称为数据。1.数字数据数字数据指由数字(0、1、2、3、4、5、6、7、8、9)和小数点组成的数据。数字数据是对可定量描述的特性的表达。可以通过抽样、测量、记录获得数字数据。任何数字数据又都可以形成(服从)一定的分布(统计规律)。2.数据的分类(1)计量值数据。计量值数据是指可以连续取值,在有限的区间内可以无限取值的数据。长度、面积、体积、质量、密度、电压、电流、强度等,大部分质量特性的数值都属于计量值数据。(2)计数值数据。计数值数据是只能间断取值,在有限的区间内只能取有限数值的数据。如到会的人数,今天生产的产品件数,产品表面的缺陷数等。所以计数值数据,是以正整数(自然数)的方式表现。计数值数据又分为计件值数据和计点值数据。二、统计技术、统计方法和统计工具统计技术中常使用三个名词:统计技术、统计方法和统计工具。这三种提法有其共性,即均是研究随机现象中确定的数字规律,但也有其各自的特点。1.统计技术统计技术是一个大的概念,是就整个学科而言,指的是一门技术的总概括。2.统计方法统计方法是指统计技术中的具体方法。如控制图,直方图,散布图等各是统计技术中的一种方法。原则上应称控制图、直方图、散布图等为统计方法。3.统计工具统计工具指简化的统计方法。统计工具的开发是日本质量管理专家对质量管理工作的重要贡献。统计技术的理论基础是概率论,但对这一理论,初级技术人员难以掌握,因此妨碍了统计技术的推广应用。为此,针对基层工人和初级技术人员的特点,20世纪60年代日本质量管理专家开发了因果图、排列图、调查表、直方图、散布图、控制图和分层法,称为质量管理七种工具。随着质量管理的不断深化,20世纪70年代日本质量管理专家又开发出系统图、关联图、矩阵图、矢线图、KJ法、PDPC法和矩阵数据解析法,称之为质量管理新七种工具。所谓工具,指不讲统计方法的原理和设计,也不讲对统计结果的分析,只讲操作步骤。第二节总体和样本一、总体研究或统计分析的对象的全体元素组成的集合称为总体或母体。总体具有完整性的内涵,是由某一相同性质的许多个别单位(元素或个体)组成的集合体。当总体内所含个体个数有限时,称为有限总体;当总体内所含个体个数无限时,称为无限总体。在统计工作中,可以根据产品的质量管理规程或实际工作需要,选定总体的范围,如每个月的出厂水泥,某一批进厂煤或原材料,都可视为一个总体。总体分布的特征值是指总体中单值x的分布特征值即分布中心u及单值x的分散程度即标准偏差O。标准偏差O的计算公式,如:总体的性质取决于其中各个个体的性质,要了解总体的性质,理论上必须对全部个体的性质进行测定,但在实际中往往是不可能的。一是在多数情况下总体中的个体数目特别多,可以说接近于无穷多,例如出厂水泥,即使按袋计数,也不可能对所有的袋进行测定;二是由无限个体组成的总体,例如对一种新分析方法的评价分析,每次测定结果即为一个个体,可以一直测定下去永无终止;三是有些产品质量的检测是破坏性的,不允许对其全部总体都进行检测。基于总体的这种种情况,在实际工作中只能从总体中抽取一定数量的、有代表性的个体组成样本,通过对样本的测量求出其分布中心和标准偏差,借助于数理统计手段,对总体的分布中心u和标准偏差,进行推断,从而掌握总体的性质。第二章试验误差与数据处理第一节误差及其表示方法一、误差与偏差通常一个物理量的真值是不知道的,需要采用适当的方法测定它。检测值并不是被检测对象的真值,只是真值的近似结果。真值虽然通常是不知道的,但是可以通过恰当的方法估计检测值与真值相差的程度。通常将检测值与真值之间的差异称为检测值的观测误差,简称为误差。误差(Error)和偏差(Deviation)是两个不同的概念。偏差是测量值相对于平均值的差异(绝对偏差,标准偏差等),或两个测量值彼此之间的差异(极差等);而误差是测量值与真值之间的差异。由于实际中真值往往是不知道的,习惯亡常将平均值作为真值看待,因此人们常将误差与偏差两个不同的概念相混淆。在把平均值当作真值时,实际上是包含了一个假设条件,即在测量过程中不存在系统误差。如果实际情况并非如此,即在测量过程中存在较大系统误差时,其算术平均值不能代表真值,因此,在数理统计和测量过程中,要注意误差和偏差这两个概念之间的区别。二、误差类型与产生误差的原因通常把误差分为系统误差和偶然误差两种类型。在化学分析的操作过程中,由于上作上的粗枝大叶或某种意外事故所造成的差错属于“过失误差”或称“粗大误差”,不包括在此处所讨论的范围之内,而是在第二节可疑数据的取舍中进行判断。1.系统误差在—定试验条什下,系统误差是一种有规律的、重复出现的误差。在每次测定中,此种误差总是偏向某—个方向,其大小几乎是一个恒定的数值,所以系统误差也叫做恒定误差。在化学分析中产生这种误差的主要原因,大体有如下几个方面:(1)由于分析方法本身所造成的系统误差。例如,用氯化铵重量法测定普通水泥熟料中的二氧化硅时,由于沉淀中吸附了铁、铝、钛等杂质和混有不溶物而使测定结果偏高,并且随试样中不溶物含量的增加,偏高的幅度亦随之相应增大。特别是立窑水泥熟料中不溶物的含量一般都较高,如采用通常酸溶样的方法,将给测定结果造成可观的正误差。另一方面,用氟硅酸钾容量法测定二氧化硅时,当样品中不溶物的含量高时,用酸溶解试样会使测定结果产生较大的负误差。此外,在各类配位滴定法中,溶液pH值、温度、指示剂等的选择若不恰当,都将使测定产生—定的系统误差。(2)由于使用的仪器不合乎规格而引起的系统误差。例如,一些要求准确刻度的量器,如移液管与容量瓶彼此之间的体积比不准确;滴定管本身刻度不准确或不均匀;天平的灵敏度不能满足称量准确度的需要,或砝码的质量不够准确等,都会给分析结果带来一定的正的或负的系统误差。(3)由于试剂或蒸馏水中含有杂质所引起的系统误差。例如,用以标定EDTA标准滴定溶液浓度的基准试剂的纯度不够或未烘去吸附水,使所标定的标准滴定溶液浓度值偏高,以致引起分析结果的系统偏高;在蒸馏水中含有某些杂质,也常常使测定结果产生一定的系统误差。(4)由于分析人员个人的习惯与偏向所引起的系统误差。例如,读取滴定管的读数时习惯于偏高或偏低;判断滴定终点时有的习惯于颜色深一些,有的习惯于颜色浅一些等等。在实际工作中,应根据具体的操作条件进行具体的分析,以便找出产生系统误差的根本原因,并采取相应的措施避免或减小系统误差。2.偶然误差(随机误差)偶然误差是在试验过程中由一些不定的、偶然的外因所引起的误差。它与系统误差不同,反映在几次同样的测定结果中,误差的数值有时大、有时小,有时正、有时负。如果测定的次数不是太多,看上去这种不定的可大可小、可正可负的误差,好像没有什么规律性。但当我们在同样条件下,对同一个样品中的某一组分进行足够多次的测定时,就不难看出偶然误差的出现具有如下规律:(1)正误差和负误差出现的几率大体相同,也就是产生同样大小的正误差和负误差的几率大体相等;(2)较小误差出现的几率大,较大误差出现的几率小;(3)很大的误差出现的几率极小。经过长期的科学试验和理论分析,证明上述偶然误差的规律性完全服从统计规律。因此,就可用数理统计方法来处理偶然误差的问题。三、误差的表示方法1.真误差正真误差为测量值与真值之差。由于真值一般难以求得,故可以认为误差在理论上是存在的,常在数理统计推导中使用。2.残余误差d残余误差又称残差、剩余误差。某一测量值与用有限次测量得出的算术平均值之差称为残差:第三章统计方法在水泥生产质量控制中的应用本章先介绍水泥生产过程质量控制指标合格率的计算方法,然后从数理统计方法的角度,进一步介绍产品合格率与检测数据分散度(正态分布中的标准偏差)之间的关系,由此推断水泥生产过程是否稳定,为从根本上提高产品质量提供科学的依据。第一节水泥生产过程质量控制指标合格率的计算按照《水泥企业质量管理规程》(以下简称《规程》)的要求,水泥企业必须在生产过程中对原、燃材料、半成品及出厂水泥的质量定期进行检测,对照各处规定的控制指标,计算该统计期某项质量指标的合格率。如合格率达不到要求,应立即查找原因,排除异常因素,确保达到规定的合格率。计算某一统计期(年、月、日),某项指标(如出磨生料氧化钙或碳酸钙滴定值、三氧化二铁、含煤量、细度,出磨水泥三氧化硫、细度、安定性、混合材掺加量等)合格率的公式如下:一、水泥生料质量合格率的计算【例3—1】《规程》规定:出磨生料氧化钙的质量控制指标为K+-0.3%(K为水泥企业配料方案确定的控制指标),合格率要求不小于60%。某水泥企业出磨生料氧化钙控制指标确定为K=39.00%。某月1号生料磨机共取样检测出磨生料氧化钙含量720次,其中有500次氧化钙含量在39.00%±0.3%之间。计算该月1号生料磨机出磨生料氧化钙合格率。符合《规程》的要求。注意,计算月过程质量控制指标合格率时,不能将当月每天的合格率相加和,然后除以开机天数,以商值做为月合格率,因为当月各天的检验次数未必完全相同。某一天因故停机若干小时,其检验次数比正常值少,如把这一天的合格率作为完整的1天,则不能反映当月合格率的实际情况。与月合格率的计算方法相同,计算年度过程质量控制指标合格率时,也是将全年合格数总做为分子,除以全年检验总数。如有多台磨机,应先分别计算某一统计期的合格率,然后按各磨机检验次数占所有磨机检验数之和的权数,加权计算其综合合格率。【例3—2】某厂某月1号生料磨共检测出磨生料氧化钙含量720次,合格次数为540次;1号生料磨检测480次,合格次数为341次。计算该月两台生料磨出磨生料氧化钙的综合合格率。解:1号磨月合格率为:2号磨月合格率为:更简单的方法是将各台磨的检测次数相加作为分母,各台磨检测合格数相加作为分子,按下式计算综合合格率:二、水泥熟料质量指标的计算1.熟料三率值合格率的计算熟料三率值KH、n、P值是根据各窑检测的熟料化学成分来计算的。窑型、规格相同,产量接近的可合并计算。其单窑月合格率的计算公式如下:统计全月合格个数时,其依据是本厂化验室所确定的控制指标(可用K表示)及其波动范围,且波动范围必须符合《规程》的要求:KH值为K±0.02,”、户值为K±0.10。如果确定的控制指标发生变动,则应分段计算。例如硅酸率n在某段时间控制指标及波动范围为2.0±0.10,另一段时间改为2.1+-0.10,统计合格个数时应根据控制指标的变动分别计算n值的合格率。2.熟料实际强度等级的计算(1)单窑熟料某龄期强度对应的实际平均等级的计算。熟料某龄期强度一般处于某两个等级的指标之间。计算其所对应的强度等级时,采用在两个等级指标之间内插的方法。其计算公式如下:第四章过程控制中的统计技术按照IS09000:2000标准的定义,所谓“过程”,即为使用资源将输入转化为输出的活动的系统。对这一转化过程必须实施必要
本文标题:统计学基本知识概要
链接地址:https://www.777doc.com/doc-5305075 .html