您好,欢迎访问三七文档
7.1分析化学中的误差概念绝对偏差—Absolutedeviation相对偏差—Relativedeviation和只能衡量每个测量值与平均值的偏离程度iidxx100%iixxRdxidiRd平均偏差—averagedeviation12....indddddnn相对平均偏差()%100%dRdx%Rd例:测w(Fe)/%,50.0450.1050.07(=50.07)xdi-0.030.030.00Rdi-0.060.060.00平均偏差d0.02相对平均偏差Rd0.04%7.1分析化学中的误差概念使用平均偏差表示精密度比较简单,但这个表示方法有不足之处,因为在一系列的测定中,小偏差的测定总是占多数,而大偏差的测定总是占少数,按总的测定次数去求平均偏差所得的结果偏小,大偏差得不到充分的反映。所以,用平均偏差表示精密度方法在数理统计上一般是不采用的。用样本的标准偏差S来衡量该组数据的分散程度。也使用相对标准偏差(亦称变异系数)来说明数据的精密度,7.1分析化学中的误差概念7.1分析化学中的误差概念100%sx相对标准偏差(RSD)2()1xxsn标准偏差(-1)nf为自由度,用表示(变异系数)标准偏差和相对标准偏差(standarddeviationandcofficientofvariation)质量控制图警戒线警告线7.1分析化学中的误差概念7.1分析化学中的误差概念→偏差和标准偏差关系例如:求下列三组数据的和S第一组10.02,10.02,9.98,9.98平均值=10.00,=0.02,S=0.02第二组10.01,10.01,10.02,9.96平均值=10.00,=0.02S=0.027第三组10.02,10.02,9.98,9.98,10.02,10.02,9.98,9.98平均值=10.00,=0.02,S=0.021例1dddd腐蚀是金属和周围环境发生化学或电化学反应而导致的一种破坏性侵蚀。腐蚀是一种化学过程,而且大多都是电化学过程,伴随着氧化-还原反应的发生。金属的化学腐蚀:金属跟接触到的物质直接发生化学反应而引起的腐蚀。金属的电化学腐蚀:不纯的金属或合金与电解质溶液接触,会发生原电池反应,比较活泼的金属失电子被氧化的腐蚀。腐蚀的本质:金属发生氧化-还原反应。金属从矿石(金属氧化物)中提炼出来需要很大的能量,使其处于一个高能级状态。热力学的一个规律是:材料总是趋向于以最低能量状态存在。因此,多数的金属处于热力学不稳定状态,具有寻求低能量状态的倾向,如形成氧化物或其他化合物。金属转化成低能量氧化物的过程就是腐蚀。7.2随机误差的正态分布1频数分布(frequencydistribution)2正态分布(normaldistribution)3随机误差的区间概率在相同条件下对某样品中镍的质量分数(%)进行重复测定,得到90个测定值如下:1.601.671.671.641.581.641.671.621.571.601.591.641.741.651.641.611.651.691.641.631.651.701.631.621.701.651.681.661.691.701.701.631.671.701.701.631.571.591.621.601.531.561.581.601.581.591.611.621.551.521.491.561.571.611.611.611.501.531.531.591.661.631.541.661.641.641.641.621.621.651.601.631.621.611.651.611.641.631.541.611.601.641.651.591.581.591.601.671.681.697.2随机误差的正态分布1频数分布视样本容量的大小将所有数据分成若干组:容量大时分为10-20组,容量小时(n50)分为5-7组,本例分为9组。再将全部数据由小至大排列成序,找出其中最大值和最小值,算出极差R。由极差除以组数算出组距。本例中的R=1.74%-1.49%=0.25%,组距=R/9=0.25%/9=0.03%。每组内两个数据相差0.03%即:1.48-1.51,1.51-1.54等等。为了使每一个数据只能进入某一组内,将组界值较测定值多取一位。即:1.485-1.515,1.515-1.545,1.545-1.575等等。统计测定值落在每组内的个数(称为频数),再计算出数据出现在各组内的频率(即相对频数)。7.2随机误差的正态分布分组(%)频数频率1.485-1.51520.0221.515-1.54560.0671.545-1.57560.0671.575-1.605170.1891.605-1.635220.2441.635-1.665200.2221.665-1.695100.1111.695-1.72560.0671.725-1.75510.011∑901.00频数分布表7.2随机误差的正态分布7.2随机误差的正态分布相对频数分布直方图由表中的数据和图可以看出,测定数据的分布并非杂乱无章,而是呈现出某些规律性。在全部数据中,平均值1.62%所在的组(第五组)具有最大的频率值,处于它两侧的数据组,其频率值仅次之。统计结果表明:测定值出现在平均值附近的频率相当高,具有明显的集中趋势;而与平均值相差越大的数据出现的频率越小。7.2随机误差的正态分布7.2随机误差的正态分布2正态分布:测量数据一般符合正态分布规律,即高斯分布,正态分布曲线数学表达式为:式中,y表明测定次数趋于无限时,测定值xi出现的概率密度。若以x值表示横坐标,y值表示纵坐标,就得到测定值的正态分布曲线。曲线的最高点,它对应的横坐标值μ即为总体平均值,这就说明了在等精密度的许多测定值中,平均值是出现概率最大的值。222)(21)(xexfy式中的σ为总体标准偏差,是曲线两侧的拐点之一到直线x=μ的距离,它表征了测定值的分散程度。标准偏差较小的曲线陡峭,表明测定值位于μ附近的概率大,即测定的精密度高。与此相反,具有较大标准偏差较大的曲线平坦,表明测定值位于μ附近的概率较小,即测定的精密度低。综上所述,一旦μ和σ确定后,正态分布曲线的位置和形状也就确定,因此μ和σ是正态分布的两个基本参数,这种正态分布用N(μ,σ2)表示nxi2)(7.2随机误差的正态分布7.2随机误差的正态分布正态分布曲线规律:*x=μ时,y值最大,体现了测量值的集中趋势。大多数测量值集中在算术平均值的附近,算术平均值是最可信赖值,能很好反映测量值的集中趋势。μ反映测量值分布集中趋势。*曲线以x=μ这一直线为其对称轴,说明正误差和负误差出现的概率相等。*当x趋于-∞或+∞时,曲线以x轴为渐近线。即小误差出现概率大,大误差出现概率小,出现很大误差概率极小,趋于零。*σ越大,测量值落在μ附近的概率越小。即精密度越差时,测量值的分布就越分散,正态分布曲线也就越平坦。反之,σ越小,测量值的分散程度就越小,正态分布曲线也就越尖锐。σ反映测量值分布分散程度。正态分布曲线关于直线x=μ呈钟形对称,且具有以下特点:1.对称性绝对值大小相等的正负误差出现的概率相等,因此它们常可能部分或完全相互低消。2.单峰性峰形曲线最高点对应的横坐标x-μ值等于0,表明随机误差为0的测定值出现的概率密度最大。3.有界性一般认为,误差大于的测定值并非是由随机误差所引起的。也就是说,随机误差的分布具有有限的范围,其值大小是有界的。37.2随机误差的正态分布7.2随机误差的正态分布标准正态分布曲线由于μ和σ不同时就有不同的正态分布,曲线的形状也随之而变化。为了使用方便,将正态分布曲线的横坐标改用u来表示(以σ为单位表示随机误差),并定义此时曲线的形状与σ大小无关,不同σ的曲线合为一条。xu7.2随机误差的正态分布3随机误差的区间概率正态分布曲线与横坐标-∞到+∞之间所夹的面积,代表所有数据出现概率的总和,其值应为1,即概率P为:dueduupu2/221)(7.2随机误差的正态分布图7-5正态分布概率积分图|μ|面积|μ|面积|μ|面积0.00.10.20.30.40.50.60.70.80.90.00000.03980.07930.11790.15540.19150.22580.25800.28810.35191.01.11.21.31.41.51.61.71.81.90.34130.36430.38490.40320.41920.43320.44520.45540.46410.47132.02.12.22.32.42.52.62.72.82.90.47730.48210.48610.48930.49180.49380.49530.49650.49740.49877.2随机误差的正态分布随机误差出现的区间测量值出现的区间概率(以σ为单位)u=±1x=μ±1σ68.3%u=±1.96x=μ±1.96σ95.0%u=±2x=μ±2σ95.5%u=±2.58x=μ±2.58σ99.0%u=±3x=μ±3σ99.7%7.2随机误差的正态分布3随机误差的区间概率例1已知某试样中待测组分质量分数的标准值为1.75%,σ=0.10%,又已知测量时没有系统误差,求分析结果落在(1.75±0.15)%范围内的概率。解:例2同上例,求分析结果大于2.00%的概率。解:属于单边检验问题。阴影部分的概率为0.4938。整个正态分布曲线右侧的概率为1/2,即为0.5000,故阴影部分以外的概率为0.5000-0.4938=0.62%,即分析结果大于2.00%的概率为0.62%。5.1%10.0%15.0%10.0%75.1xxu5.2%10.0%75.1%00.2xu7.3少量数据的统计处理1t分布曲线2平均值的置信区间3显著性检验4异常值的取舍7.3少量数据的统计处理1t分布曲线正态分布是无限次测量数据的分布规律,而对有限次测量数据则用t分布曲线处理。用s代替σ,纵坐标仍为概率密度,但横坐标则为统计量t(与置信度、自由度相关的数值)。由统计学可以推导出,有限次测定的平均值与总体平均值(真值)的关系如下:xtsxn由此式可以估算出,在指定的置信度下,总体平均值在以测定平均值为中心的多大范围内出现,即平均值的置信区间。在同一置信度下,置信区间愈小,表示平均值的可靠性愈高,或者说平均值愈准确。x7.3少量数据的统计处理7.3少量数据的统计处理→自由度f—degreeoffreedom(f=n-1)t分布曲线与正态分布曲线相似,只是t分布曲线随自由度f而改变。当f趋近∞时,t分布就趋近正态分布。→置信度(P)—confidencedegree在某一t值时,测定值落在(μ+ts)范围内的概率。→置信水平(α)—confidencelevel在某一t值时,测定值落在(μ+ts)范围以外的概率(l-P)→ta,f:t值与置信度P及自由度f关系。例:t0·05,10表示置信度为95%,自由度为10时的t值。t0·01,5表示置信度为99%,自由度为5时的t值。7.3少量数据的统计处理表7-3tα,f值表(双边)置信度,显著性水准fP=0.90α=0.10P=0.95α=0.05P=0.99α=0.011234567891020∞6.312.922.352.132.021.941.901.861.8312.811.721.6412.714.303.182.782.572.452.362.312.262.232.091.9663.669·925·844·604·033·713·503.363.253.172.842.587.3少量数据的统计处理2平均值的置信区间(confidenceinterval)→对于少量测量数据,即当n有限时,必须根据t分布进行统计处理:它表示在一定置信度下,以平均值为中心,包括总体平均值的
本文标题:分析偏差
链接地址:https://www.777doc.com/doc-6766725 .html