您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 分析化学中的误差与数据处理
分析化学中的误差与数据处理分析误差、结果表达、分析结果的检验示例1:称硬币13.126263.073513.101763.08623.14273.084523.049773.12333.092283.148533.082783.11543.095293.047543.142793.05553.08303.121553.082803.05763.065313.116563.066813.09773.117323.005573.128823.06683.034333.115583.112833.11393.126343.103593.085843.102103.057353.086603.086853.033113.053363.103613.084863.112123.099373.049623.104873.103133.065382.998633.107883.198143.059393.063643.093893.103153.068403.055653.126903.126163.06413.181663.138913.111173.078423.108673.131923.126183.125433.114683.12933.052193.09443.121693.1943.113203.1453.105703.099953.085213.055463.078713.097963.117223.105473.147723.091973.142233.063483.104733.077983.031243.083493.146743.178993.083253.065503.095753.0541003.1043.094小于3.094:46个大于3.094:54个204060801002.82.93.03.13.2BA示例2、投镖1、可以从两个方面描述一组重复测定的数据集中:离散:33.094×××××××24离散集中3.0940.018平均值:3.094平均值与标准偏差3.0940.038标准偏差集中:平均值离散:偏差数学描述相对于平均值平均偏差相对平均偏差偏差2、分析结果的好坏可以从两个方面来评价绝对误差相对误差平均值的绝对误差平均值的相对误差准确度:误差是对测量值和真值接近的程度评价。精密度:偏差精密度反映数据的分散程度练习例题1:例题2:问题:1、误差和偏差公式能否反映测量结果的准确度和精密度?2、两组测量的偏差第二组:0.0,+0.1,-0.7,+0.2,-0.1,-0.2,+0.5,-0.2,+0.3,+0.1第一组:+0.3,-0.2,-0.4,+0.2,+0.1,+0.4,0.0,-0.3,+0.2,-0.3计算平均偏差和标准偏差差,结果说明什么问题?取样误差方法误差仪器误差试剂误差个人误差3、误差及其分类随机误差:偶然因素引起,不可避免-不可测误差。服从统计规律,多次测定可以减小,无法完全消除系统误差:使测定结果系统性的偏高或偏低,在相同条件下会重复出现--是可测的,可以减小和消除的4、准确度与系统误差存在系统误差消除系统误差后消除系统误差的前提下,一组平行测定的平均值是最可信赖的,它反映结果的集中趋势。常以平均值来表示测定结果。消除系统误差的情况下,以平均值来估计真值5、精密度与随机误差表明分析结果的重复性重复性不好6、消除系统误差之后(随机误差的正态分布)频数分布无限多次测定总体标准偏差正态分布曲线x(测量值)正态分布概率密度函数概率正态分布曲线/高斯曲线两个重要参数:1、:集中。曲线最高点,决定曲线的位置2::离散。决定曲线的形状。x51020越小,越尖锐,数据越集中132x1、小误差出现的概率大,大误差出现的概率小;x=时概率最大,特别大的误差出现的概率极小。(绝大多数测量值集中于此)2、正误差出现的概率与负误差出现的概率相等。(无限多次测定)消除系统误差之后,测量受随机误差制约。随机误差受统计学控制。1、一组重复测定的数据可以从和两方面来,评价数学上用什么和表示。2、测量结果的好坏可以从和两方面来评价,数学上用什么和表示。3、消除系统误差之后测量数据服从分布,存在系统误差呢?4、消除系统误差之后,无限次测量的平均值(μ)等于。5、正态分布的中心位于,曲线的形状由决定?曲线在x轴上的位置由决定。6、正态分布的其它特点:7、概率积分正态分布曲线下的面积代表了区间包含测量值的概率。其中:1、曲线下的总面积为1。2、无限次测量中,0误差出现的概率最大,大误差出现的概率小。xx1x2y8、标准正态分布(u分布,正态分布的标准化)u是以σ为单位的偏差0.399数学表达式N(0,1)或者直接令μ=0,σ=1也可得到特点:1、与μ,σ无关.曲线都相同,应用更为方便2、以为0中心3、曲线下面积199.7%68.3%95.5%)(u实际测量中,偏差超过3σ的数值则可舍去dueuxuuuu2122/2121)P(x=μ±σx=μ±2σx=μ±3σxu0.15%0.15%示例已知某试样铜含量为1.48%,σ=0.10%,测量时候没有系统误差,求分析结果落在1.48±0.10%范围内的概率。%)10.0%48.1%,10.0%48.1(xux1x21%10.0%48.1%10.0%48.11u1%10.0%48.1%10.0%48.12u查表p57页已知某试样铜含量为1.48%,σ=0.10%,测量时候没有系统误差,求分析结果大于1.70%的概率。2.20.10%1.48%701%-.xuP(0~2.2)=0.4861P(2.2~∞)=0.5-0.4861=0.0139双边问题查(算)双边概率,单边问题查算单边概率1.39%9、t分布(少量数据的统计处理)无限多次测量:,有限次测量:xxSS或者xSm个样本,每个样本做n次测定,m个平均值的标准偏差nsSxS:单次平行测定的标准偏差只能用有限的数据估计,f=1f=4f=8f=12N(0,1)xsxttF大于20和N(0,1)很接近-4t-3-2-101234t1、以0为中心2、对称3、面积=14、形状与f有关,f越大,越接近N(0,1)5、t的取值与P有关.置信度越大,t值越大f越大,t越小t分布的特点f=1f=4f=8f=12N(0,1)P61:t值表对于少量数据,必须按t分布进行处理nstxStxfPx,xfpsxt,nsSx表示在一定置信水平下,以样本测量的平均值为中心,包括总体平均值的范围平均值的置信区间(测量结果的表达)练习例题10某铜矿中铜含量的测定结果为:40.53%,40.48%,40.57%,40.42%,计算置信度为90%,95%,99%时的总体平均值的置信区间。nstxStxfPx,%06.01)(%50.404)%42.4057.4048.4053.40(nxxsxi84.518.335.23,993,953,90ttt0.18%40.50%40.06%5.8440.50%0.10%40.50%40.06%3.1840.50%0.07%40.50%40.06%2.3540.50%1、一组重复测定的数据服从分布。2、正态分布的中心位于,曲线的形状由决定?曲线在x轴上的位置与有关。3、对正态分布概率密度函数进行积分运算时,有两个参数:,使得对不同的测量对象或采用不同的测量方法时需要重新进行积分。4、为此,可以将正态分布转换为分布,也称为分布,记作。该分布以为中心,横坐标为。5、无限次测量可以得到和两个参数,因此可以得到正态分布或标准正态分布,但有限的测量只能得到和(或),相应的分布规律为分布。该分布以为中心,横坐标为。6、t值与和有关。7、平均值的置信区间nstxStxfPx,表示的意思是:。分析结果应该以平均值置信区间的形式报出。1、分析误差有和两种,前者影响数据的,后者影响数据的。2、误差必须消除,误差无法消除,多次测量可以减小。3、一组无限次重复测定的数据的随机误差(偏差)服从分布。少量数据时,可以用分布来估计正态分布。)(30,nxnniixnx11t10、显著性检验(数据间的比较)分析测试目标是准确测量被测量量值。为此,在进行分析测试程序的同时,经常会将分析结果和标准物质(样品)的分析结果进行比较,或者是在不同操作人员之间、不同的实验室之间、不同方法之间进行比较。但由于随机误差不可避免,不同的分析测试之间必然会有差异。通过统计检验,如果这种差别是由随机误差引起的,则认为二者没有区别,否则,则认为有显著差异,某一测试系统中可能存在系统误差。第一种如图a所示,两组分析结果的分布曲线完全分离。很明显,这两组测量之间有明显的差别,或者谓之显著性差异。第二种如图b所示,二者之间重合程度很高,表明二者之间的差别是由随机误差引起的,没有显著性差别。对于c则没有前两种那么明显,到底有没有显著性差异,需要经过显著性检验。0Tx021xx显著性检验显著性差异非显著性差异系统误差校正等随机误差正常acbxμ1μ2μ1μ2μ1μ210.1t检验平均值与标准值比较nsxsxtxf,根据置信度水平和自由度,由t值表查出相应的ta,f值。如果计算出的tta,,f,则有显著性差异,分析过程中存在系统误差;否则应视为二者的差异由随机误差引起,即P63页:例题11,xx10.2F检验通过比较两组数据的方差,可以考察二者精密度有无显著性差异。2221SSF根据置信度水平和自由度,查F值表查得Fa,f,如果计算出的FFa,f,则认为在该显著性水平下,二者有显著性差别,否则没有。P65页:例题1310.3t检验和F检验同一试样两组平均值的比较先比较精密度,再比较两平均值2221SSFsxt)1()1()1()1()1()1()()(2122221121222211nnsnsnsnnxxxxsii21212112212211)(nnnnsxxtnstnstxxnstxntsx则如果没有显著性差异,P65页:例题1211、可疑值的取舍204060801002.82.93.03.13.2BA11.1法d4当测量次数超过20次,δ=0.8σ32.341nxxni总体平均偏差超过3σ的概率小于0.3%,因此可以舍去,即舍去偏差大于4δ的数据。少量数据,可用代替4δd4nddddn...2111.2格鲁布斯法sxxsxxnTT1n个按递增顺序排列的数据,x1…xn,可疑值只可能是x1和xn,计算统计量如果在P置信度下,,舍去,否则保留TT,nP11.3Q检验法11211xxxxQxxxxQnnnn和n个按递增顺序排列的数据,x1…xn,可疑值只可能是x1和xn,计算统计量舍去,否则保留如果,,nPQQ练习例题15例题16例题1712、标准曲线与回归分析01020304050ConcentrationofSpikeAdded10001100120013001400150016001700ThousandsResponse浓度,μmol/L信号CxA标准曲线不能随意外推iixbayˆˆˆ用EXCEL求回归方程和相关性系数含量x,μg:0.02.04.06.08.010.012.0荧光强度y:2.15.09.012.617.321.024.7••••实测点模拟曲线iixbayˆˆˆ最小二乘法的基本原则是:最优拟合直线应该使各点到直线的距离的和最小,也可表述为距离的平方和最小。2121)ˆˆ()ˆ(iiiiiixbayyyQ••••实测点模拟直线2211xxyxxybxbynxbyanniinyxyxyyxxnxxxxiiiiiiiii
本文标题:分析化学中的误差与数据处理
链接地址:https://www.777doc.com/doc-3550406 .html