您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 第二章 误差与分析数据处理
1第二章误差与分析数据处理2有关误差的一些基本概念随机误差的分布有限数据的统计处理分析测试结果准确度的评价有效数字及运算规则3真值(truevalue)是客观存在的,用符号T表示。在实际工作中,真值包括:(1)理论真值:纯物质中各元素的理论含量(2)计量学约定真值:如由国际计量大会确定的相对原子质量、物理学常数等(3)标准试样的标准值:由技术权威机构发售的“标准试样”(简称“标样”或“标准物质”)。42.1.1误差的表征——准确度和精密度一、误差和准确度准确度──分析结果与真实值的接近程度准确度(accuracy)的高低用误差的大小来衡量;测量值与真实值越接近,测量误差越小,测量的准确度越高。误差一般用绝对误差和相对误差来表示。2.1有关误差的一些基本概念5(1)绝对误差(Ea):测量值与“真实值”T(truevalue)之差。Ea=x-T实验工作中,通常进行多次平等测定,所以用多次测定结果的平均值来表示测量结果。xEa=-Tx(2)相对误差(Er):绝对误差在“真实值”中所占的百分率。%100TarEEabsoluteerrorrelativeerror相对误差更适于比较测定的准确度。6例:滴定的体积误差VEaEr20.00mL0.02mL0.1%2.00mL0.02mL1.0%例:测定含铁样品中w(Fe),比较结果的准确度。xA.铁矿中,T=62.38%,=62.32%xEa=-T=-0.06%xB.Li2CO3试样中,T=0.042%,=0.044%xEa=-T=0.002%arA.100%EET=-0.06/62.38=-0.1%arB.100%EET=0.002/0.042=5%8二、偏差和精密度精密度──在相同条件下,几次测定结果彼此相符合的程度,即平行测定结果相互接近程度精密度的高低用偏差来衡量,偏差是指个别测定值与平均值之间的差值。偏差也分绝对偏差与相对偏差。(一)绝对偏差、平均偏差和相对平均偏差(1)绝对偏差:个别测量值与平均值之差叫做该次测量的绝对偏差(deviation)。di=xi-x(2)相对偏差:单次测量值的绝对偏差在平均值中所占的百分数。100%xdRdi9a基准物:硼砂Na2B4O7·10H2OM=381碳酸钠Na2CO3M=106选那一个更能使测定结果准确度高?(不考虑其他原因,只考虑称量)b:如何确定滴定体积消耗?0~10ml;20~25ml;40~50ml10为了度量测量结果的精密度,通常用平均偏差表示。平均偏差:表示各测量值对平均值的偏差的绝对值的平均。各次测量值的平均偏差为:d1=x1-d2=x2-:.dn=xn-xxx对d1、d2、…dn的绝对值进行算术平均即为平均偏差:niiniinxxndnndddd11211111相对平均偏差:100%xddRniixxnd11特点:简单;缺点:大偏差得不到应有反映。12(二)标准偏差和相对标准偏差标准偏差又称均方根偏差;标准偏差的计算分两种情况:当测定次数趋于无穷大时有限测定次数在数理统计中,把所研究对象的全体称为总体;自总体中随机抽出的一部分样品称为样本;样本中所含测量值的数目称为样本容量,用n表示。13ixnx1xnlimnxi2)(若样本容量为n,平行测定次数分别为x1,x2,x3,…,xn,则其样本平均值为当测定次数无限增多,既n→∞时,样本平均值即为总体平均值:若没有系统误差,且测定次数无限多(或实用上n>30次)时,则总体平均值就是真实值T。此时,用σ代表总体标准偏差(简称总体标准差),其数学表示式为:14但是,在分析化学中测定次数一般不多(n20),而总体平均值又不知道,故只好用样本的标准偏差s(简称样本标准差)来衡量该组数据的分散程度。样本标准偏差的数学表达式为:11)(1212ndnxxsniinii式中:(n-1)称为自由度(f)。指在n次测量中,只有n-1个可变的偏差。自由度也可以理解为:数据中可供对比的数目。例如,两次测定a值和b值,只有a与b之间的一种比较,三次测定可有两种比较(即其中任何两个数据之间及其平均值与第三个数据之间比较),n次测定n-1个可供对比的数目。15这里引入(n-1)的目的,主要是为了校正以代替μ所引起的误差。很明显,当测定次数非常多时,测定次数n与自由度(n-1)的区别就变得很小,→μ即此时,s→σxxnuxnxxnii22)(1)(lim另外,在许多情况下也使用相对标准偏差(亦称变异系数)来说明数据的精密度,他代表单次测定标准偏差(s)对测定平均值()的相对值,用百分率表示:x%100xs变异系数(CV)=16用标准偏差比用平均偏差更科学更准确。例:两组数据(1)x:0.11,-0.73,0.24,0.51,-0.14,0.00,0.30,-0.21,n=8d1=0.28s1=0.38(2)x:0.18,0.26,-0.25,-0.37,0.32,-0.28,0.31,-0.27n=8d2=0.28s2=0.29d1=d2,s1s217在实际工作中,常用样本的平均值对总体平均值μ进行估计。统计学证明,平均值的标准偏差与单次测定值的标准偏差σ之间有下述关系。nxxx(n→∞)对于有限次的测定则有:式中称样本平均值的标准偏差。由以上两式可以看出,平均值的标准偏差与测定次数的平方根成反比。因此增加测定次数可以减小误差的影响,提高测定的精密度。nssxxs18极差R(又称全距)是测定数据中的最大值与最小值之差其值愈大表明测定值愈分散。由于没有充分利用所有的数据,故其精确性较差。minmaxxxR19三、精密度和准确度的关系精密度是指多次测量值之间相互符合的程度;准确度是指测量值与真值之间相互符合的程度。两者含义不同,但相互有一定的关系。甲乙丙甲的准确度高,准确度也高;乙的精密度很高,但准确度较差;丙的准确度差,精密度也差。20结论:(1)精密度是保证准确度的先决条件。有时精密度不好,但准确度可能较高,对于这样的结果只能认为是巧合,不能信赖。(2)精密度高不一定准确度高。(3)对于一个好的分析结果,既要求精密度高,又要求准确度高。212.1.2误差产生的原因及其减免方法一、系统误差(systematicerror)系统误差是由分析过程中某些比较固定的原因造成的。对分析结果的影响比较固定。1.特点:(1)对分析结果的影响比较恒定,可以测定和校正(2)在同一条件下,重复测定,重复出现,具有单向性。(3)影响准确度,不影响精密度22精密度是保证准确度的先决条件;精密度高不一定准确度高;两者的差别主要是由于系统误差的存在。232.产生的原因:(1)方法误差——选择的方法不够完善例:重量分析中沉淀的溶解损失,滴定分析中指示剂选择不当(2)仪器误差——仪器本身的缺陷例:滴定管,容量瓶刻度不准。(3)试剂误差——所用试剂有杂质例:去离子水不合格;试剂纯度不够(4)主观误差——操作人员主观因素造成例:对指示剂颜色辨别偏深或偏浅;滴定管读数不准24二、随机误差(randomerror)也叫偶然误差或不可测误差。随机误差是由于一些无法控制的、不可避免的随机因素(或称偶然因素)造成的。特点:(1)不恒定,无法校正;(2)服从统计规律:大小相近的正误差和负误差出现的几率相等;小误差出现的频率较高,而大误差出现的频率较低,在平均值附近的测量值出现概率最大。(不存在系统误差的情况下,测定次数越多其平均值越接近真值。一般平行测定4-6次)25对于一次测定而言,系统误差和随机误差可能同时存在,这时测量值与真值之差(也称为真误差)等于系统误差与随机误差之和。过失(mistake):过失误差属于不应有的过失。是指由于操作者的粗心大意和错误操作产生的误差。例如加错试剂,记错数据,溅失溶液,流失沉淀等。凡含有过失误差的数据应一律弃去。应认真操作,防止过失。26(1)甲组4次测定的精密度和准确度都很好,无疑其结果可靠,或称结果精确。(2)乙组精密度虽高,但平均值与真值相差较远,准确度较差,存在较大的系统误差。(3)丙组精密度和准确度都较差,说明存在系统误差和随机误差。(4)丁组精密度很差,尽管平均值与真值较为接近,这是由于正负误差的抵消的结果,纯属巧合,不能认为准确度高,其结果是不可靠的。27三、误差的减免(一)系统误差的减免1.方法误差——采用标准方法作对照试验2.仪器误差——校准仪器3.试剂误差——作空白试验(二)随机误差的减免——增加平行测定的次数,取其平均值,可以减少随机误差。282.2随机误差的统计规律随机误差服从统计规律:大小相近的正误差和负误差出现的几率相等;小误差出现的频率较高,而大误差出现的频率较低,在平均值附近的测量值出现概率最大。一、正态分布正态分布又称高斯分布,是德国数学家(C.F.Gaus)于1795年推导出来的,又称Gaus方程。正态分布的概率密度函数方程可用下式表示:29222)(21)(xexfy式中x是测量值(随机变量),是总体标准偏差,是总体均值,y是概率密度(测定次数趋于无限时,测定值x出现的概率密度)。若以x值表示横坐标,y值表示纵坐标,就得到测定值的正态分布曲线。xy=f(x)曲线的最高点,它对应的横坐标值μ为总体平均值,这就说明了在等精密度的许多测定值中,平均值是出现概率最大的值。30σ为总体标准差,是曲线两侧的拐点之一到直线x=μ的距离,它表征了测定值的分散程度。标准偏差较小的曲线陡峭,表明测定值位于μ附近的概率较大,即测定的精密度高。与此相反,具有较大标准偏差较大的曲线平坦,表明测定值位于μ附近的概率较小,即测定的精密度低。综上所述,一旦μ和σ确定后,正态分布曲线的位置和形状也就确定,因此μ和σ是正态分布的两个基本参数,这种正态分布用N(μ,σ)表示。正态分布曲线31正态分布曲线特征:(1)单峰性:曲线的最高点位于x=直线上,测量值有向总体均值集中的趋势。总体均值决定了曲线的位置。(2)对称性:曲线以x=为对称轴,说明正负误差出现几率相等。(3)拐点位置为x=,决定了曲线的形状。值大,曲线矮胖,值小,曲线瘦高。32二、标准正态分布由于μ和σ不同时就有不同的正态分布,曲线的形状也随之而变化。为了使用方便,将正态分布曲线的横坐标改用u来表示(以σ为单位表示随机误差),并定义xu这时函数表示式为:2221)(uexfy33由于dudxduuduedxxfu)(21)(22故u称为标准正态变量。此时正态分布的概率密度函数式就转化成只有变量u的函数表达式:2221)(ueuy经过上述变换,总体平均值为μ的任一正态分布均可化为最高点u=0,拐点为1的标准正态分布,以N(0,1)表示。标准正态分布曲线的形状与μ和σ的大小无关。34标准正态分布曲线35三、随机误差的区间概率欲求测定值或随机误差在某区间出现的概率P,可取不同的u值对式积分求面积而得到。例如随机误差在±σ区间(u=±1),即测定值在μ±σ区间出现的概率是:121)(22dueduuu正态分布曲线与横坐标之间所夹的总面积,就等于概率密度函数从-∞至+∞的积分值。它表示来自同一总体的全部测定值或随机误差在上述区间出现概率的总和为100%,即为1。36683.021)11(1122dueuPu按此法求出不同u值时的积分面积,制成相应的概率积分表可供直接查用。概率=面积=dueuu02221xu37表3-1正态分布概率积分表|u|面积|u|面积|u|面积0.00.00001.10.36432.20.48210.10.03981.20.38492.20.48610.20.07931.30.40322.30.48930.30.11791.40.41922.40.49180.40.15541.50.43322.50.49380.50.19151.60.44522.5
本文标题:第二章 误差与分析数据处理
链接地址:https://www.777doc.com/doc-3207837 .html