您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 工学 > 华北理工环境监测教案18环境监测质量保证2
第十八讲续第九章环境监测质量保证课程名称:《环境监测》第18讲次摘要授课题目(章、节)第六单元:环境监测质量保证第三节监测数据的统计处理和结果表述【目的要求】掌握监测数据的统计处理方法及结果的表示方法。【重点】分析结果的表达;分析数据的检验【难点】平均值置信区间【主要内容】误差和偏差、标准偏差和相对标准偏差、总体、样本和平均数;数据处理的方法及结果表示;【教学方法与手段】课堂讲授、提问、课堂练习【补充】利用常用办公软件计算回归方程作业:11、19。【本讲课程的内容】第四节监测数据的统计处理和结果表述【引言】监测中所得到的许多物理、化学和生物学数据,是描述和评价环境质量的基本依据。由于监测系统的条件限制以及操作人员的技术水平,测试值与真值之间常存在差异;环境污染的流动性、变异性以及与时空因素关系,使某一区域的环境质量由许多因素综合所决定;描述某一河流的环境质量,必须对整条河流按规定布点,以一定频率测定,根据大量数据综合才能表述它的环境质量,所有这一切均需通过统计处理。9.4.1基本概念一、误差和偏差1.真值(xt):真值可以分为:(1)理论真值:例如三角形内角之和等于180°(2)约定真值:包括计量学的约定真值和标准器具的约定真值。约定真值又称量的约定值,简称约定值。对于给定目的、具有适当不确定度的、赋予特定量的值。约定真值有时又称为指定值、最佳估计值、约定值或参考值。例如,阿伏伽德罗常数约定为6.0221367×1023mol-1就是典型的的计量学约定真值。标准器具的约定真值指在给定地点,由参考标准复现的量值。例如,标准砝码、标准物质、标准测量仪器等在其证书上给出的数值。在JJF1001《通用计量术语及定义》中给出的[量的]真值的定义:与量的定义一致的量值。《测量不确定度表示指南》(简称GUM)中,建议采用“被测量之值”代替“真值”。被测量真值是通过完善的测量得到的,或说是某一时刻和某一位置或状态下某量的效应体现出的客观值。因此,大多数情况下,被测量真值是无法获得的。2.误差及其分类测量误差指测量结果减去被测量的真值。任何测量结果都有误差,并存在于一切测量全过程之中。误差按其性质和产生原因,可分为系统误差、随机误差和过失误差。(1)系统误差:又称可测误差、恒定误差或偏倚(bias)。指测量值的总体均值与真值之间的差别,是由测量过程中某些恒定因素造成的,在一定条件下具有重现性,并不因增加测量次数而减少系统误差,它的产生可以是方法、仪器、试剂、恒定的操作人员和恒定的环境所造成。(2)随机误差:又称偶然误差或不可测误差。是由测定过程中各种随机因素的共同作用所造成,随机误差遵从正态分布规律。(3)过失误差:又称粗差。是由测量过程中犯了不应有的错误所造成,它明显地歪曲测量结果,因而一经发现必须及时改正。误差分绝对误差和相对误差。绝对误差是测量值(x,单一测量值或多次测量的均值)与真值(xt)之差,绝对值有正负之分。绝对误差E=x-xt相对误差指绝对误差与真值之比(常以百分数表示):相对误差Er=%100ttxxx(x-xt)/xt3.偏差偏差指个别测定结果xi与几次测定结果的平均值x之间的差别。具体分为相对偏差、平均偏差、相对平均偏差和标准偏差等。(1)绝对偏差(di)是测定值与平均值之差,即:di=xi-x(2)相对偏差(dr)是绝对偏差与平均值之比(常以百分数表示):dr=%100xdi(3)平均偏差(d)是各绝对偏差绝对值之和的平均值:(4)相对平均偏差(rd)是平均偏差与平均值之比(常以百分数表示):xddr(5)标准偏差和相对标准偏差①差方和:亦称离差平方或平方和。是指绝对偏差的平方之和,以S表示②样本方差用s2或V表示③样本标准偏差用s或sD表示④样本相对标准偏差:又称变异系数,是样本标准偏差在样本均值中所占的百分数,记为Cv。⑤总体方差和总体标准偏差分别以σ2和σ表示:式中:N——总体容量;μ——总体均值。⑥极差:一组测量值中最大值(xmax)与最小值(xmin)之差,表示误差的范围,以R表示R=xmax-xmin二、总体、样本和平均数1.总体和个体研究对象的全体称为总体,其中一个单位叫个体。2.样本和样本容量总体中的一部分叫样本,样本中含有个体的数目叫此样本的容量,记作n。3.平均数平均数代表一组变量的平均水平或集中趋势,样本观测中大多数测量值靠近(1)算术均数:简称均数,最常用的平均数,其定义为:样本均数:总体均数:(2)几何均数:当变量呈等比关系,常需用几何均数,其定义为:计算酸雨pH值的均数,都是计算雨水中氢离子活度的几何均数。(3)中位数:将各数据按大小顺序排列,位于中间的数据即为中位数,若为偶数取中间两数的平均值,适用于一组数据的少数呈“偏态”分散在某一侧,使均数受个别极数的影响较大。(4)众数:一组数据中出现次数最多的一个数据。平均数表示集中趋势,当监测数据是正态分布时,其算术均数、中位数和众数三者重合。(三)正态分布相同条件下对同一样品测定中的随机误差,均遵从正态分布(图9-1)。正态概率密度函数为:图2-1正态分布图式中:x——由此分布中抽出的随机样本值;μ——总体均值,是曲线最高点的横坐标,曲线对μ对称;σ——总体标准偏差,反映了数据的离散程度。在环境监测中重要的区间是“±3σ区间”,从统计学可以得到样本落在各区间内的概率,如表2-3所示。表2-3正态分布总体的样本落在下列区间内的概率区间落在区间内的概率/%μ+1.000σ68.26μ+1.645σ90.00μ+1.960σ95.00μ+2.000σ95.44μ+2.576σ99.00μ+3.000σ99.73正态分布曲线说明:(1)小误差出现的概率大于大误差,即误差的概率与误差的大小有关。(2)大小相等,符号相反的正负误差数目近于相等,故曲线对称。(3)出现大误差的概率很小。(4)算术均值是可靠的数值。样本监测数据的分布类型是否服从正态分布(或对数正态分布),需要用非参数检验法(如卡方检验、克尔莫格洛夫-斯米尔诺夫检验)进行检验后才能确定。实际工作中,有些监测数据呈正态分布,有些监测数据呈对数正态分布。例如,大气中SO2或颗粒物浓度较低时,监测数据一般呈对数的正态分布。9.4.2数据的处理一、数据修约规则环境监测中的数据修约规则采用GB/T8170《数值修约规则与极限数值的表示和判定》规定的方法。其主要内容可以简要概括为:四舍六入五考虑,五后非零则进一,五后皆零视奇偶,五前为偶应舍去,五前为奇则进一。[例]将下列数据修约到只保留一位小数:14.3426、14.2631、14.2501、14.2500、14.0500、14.1500解:按照上述修约规则(1)修约前修约后因保留一位小数,而小数点后第二位数小于、等于4者应予舍弃。(2)修约前修约后14.263114.3小数点后第二位数字大于或等于6,应予进一。(3)修约前修约后14.250114.3小数点后第二位数字为5,但5的右面并非全部为零,则进一。(4)修约前修约后14.250014.214.050014.014.150014.2小数点后第二位数字为5,其右面皆为零,则视左面一位数字,若为偶数(包括零)则不进,若为奇数则进一。若拟舍弃的数字为两位以上数字,应按规则一次修约,不得连续多次修约。[例]将15.4546修约成整数正确的做法修约前修约后15.454615不正确的做法修约前一次修约二次修约三次修约四次修约15.454615.45515.4615.516二、可疑数据取舍与正常数据不是来自同一分布总体,明显歪曲试验结果的测量数据,称为离群数据。可能会歪曲试验结果,但尚未经检验断定其是离群数据的测量数据,称为可疑数据。在数据处理时,必须剔除离群数据以使测定结果更符合客观实际。正确数据总有一定分散性,在实际工作,常常会遇到一组平行测量数据中有个别的数据较高或较低,这些数据是否属于同一分布总体,需要经过检验后才能确定。如果人为地删去一些误差较大但并非离群的测量数据,由此得到精密度很高的测量结果并不符合客观实际。因此对可疑数据的取舍必须遵循一定的原则。我国GB/T4883-2008《数据的统计处理和解释正态样本利群值的判断和处理》规定,当已知标准差时,使用奈尔(Nair)检验法(样本量3≤n≤100)。在未知标准差的情形下可使用格拉布斯(Grubbs)检验法和狄克逊(Dixon)检验法,后两种方法适用于限定检验离群值的个数不超过1。1.狄克逊(Dixon)检验法此法适用于一组测量值的一致性检验和剔除离群值,本法中对最小可疑值和最大可疑值进行检验的公式因样本的容量(n)不同而异,检验方法如下:(1)将一组测量数据从小到大顺序排列为x1、x2…xn,其中x1和xn分别为最小可疑值和最大可疑值;(2)按表2-4计算式求D值;表2-4狄克逊检验统计量D计算公式(当3≤n≤30)n值范围可疑数据为最小值x1时可疑数据为最大值xn时n值范围可疑数据为最小值x1时可疑数据为最大值xn时3~711210XXXXDn1110XXXXDnnn11~13111321XXXXDn2221XXXXDnnn8~10111211XXXXDn2111XXXXDnnn14~25121322XXXXDn3222XXXXDnnn(3)根据给定的检出水平(α)和样本容量(n),从表2-5查得临界值(Dα);(4)若D≤D0.05则可疑值为正常值;若D0.05<D≤D0.01则可疑值为异常值,一般宜舍去,必要时也可保留;若D>D0.01则可疑值为离群值,应舍去。表2-5狄克逊检验临界值(Dα)表n检出水平(α)n检出水平(α)0.050.010.050.0130.9410.988150.5250.61840.7650.889160.5050.59750.6420.782170.4890.58060.5620.689180.4750.56470.5070.637190.4620.55080.5540.681200.4500.53890.5120.635210.4400.526100.4770.597220.4310.516110.5760.674230.4220.507120.5460.642240.4130.497130.5210.617250.4060.489140.5460.640摘自GBT4883-2008《数据的统计处理和解释正态样本利群值的判断和处理》[例]一组测量值从小到大顺序排列为:14.65、14.90、14.90、14.92、14.95、14.96、15.00、15.01、15.01、15.02。检验最小值14.65和最大值15.02是否为离群值?解:检验最小值x1=14.65,n=10,x2=14.90,xn-1=15.0169.065.1401.1565.1490.141112XXXXDn查表2-5,当n=10,给定检出水平α=0.01时D0.01=0.597。D>D0.01,故最小值14.65为离群值应予剔除。检验最大值xn=15.02083.090.1402.150.1502.1521XXXXDnnn查表2-5可知,D0.05=0.477。D<D0.05,故最大值15.02为正常值。狄克逊检验的缺点是,没有充分利用测定数据,仅将可疑值与相邻数据比较,可靠性差。2.格拉布斯(Grubbs)检验本法可用于在一组测量数值中发现一个异常值,也可用于检验多组测量值的平均值中的离群均值。本文以一组测量数值中异常值检验为例。将观测值x1、x2…xn数据从小到大顺序排列,并计算数据组的x和s。格拉布斯的统计量为:sxxGnn和sxx1中的较大者在一定的检出水平α下,比较Gn与表2-6中的临界值G1-α,(n)。若Gn≤G0.05,则可疑值为正常值;若G0.05<Gn≤G0.01,则可疑值为异常值,一般应舍去,特殊情况下可以保留;若G>G0.01,则可疑值为高度异常值,应予剔除。例***实验室对一种标
本文标题:华北理工环境监测教案18环境监测质量保证2
链接地址:https://www.777doc.com/doc-10678512 .html