您好,欢迎访问三七文档
§7-3少量数据的统计处理正态分布是无限次测量数据的分布规律,而在实际工作中,只能对随机抽得的样本进行有限次的测量。对于有限测定次数,总体标准偏差σ是不知道,只好用样本标准偏差s来代替,这样必然引起正态分布曲线的偏差.y-3-2-10123-0.4-0.3-0.2-0.1xu测定值的随机误差的分布不符合正态分布,而是符合t分布,应用t分布来处理有限测量数据。y-3-2-10123-0.4-0.3-0.2-0.1xuy-3-2-10123-0.4-0.3-0.2-0.1xuS代替σ引起偏离一、t分布曲线:用t代替正态分布u,样本标准偏差s代替总体标准偏差σ有sxtxuy-3-2-10123-0.4-0.3-0.2-0.1sxty-3-2-10123-0.4-0.3-0.2-0.1xut分布曲线(见图2-2)与正态分布曲线相似,以t=0为对称轴,t分布曲线的形状与自由度f=n-1有关,f愈大,曲线愈接近正态分布。与正态分布曲线相似,t分布曲线下面一定范围内的面积,就是该范围内测定值出现的概率。用置信度P表示。y0uy0tf=∞f=5置信度P:测定值x出现在μ±ts范围内的概率。显著性水准α:测定值x在μ±ts范围之外的概率,α=1-Pt值与f有关,也与不同范围内概率值(置信度P)有关,不同的置信度和自由度所对应的t值,可用ta,f表示。例如,t0.05,4表示置信度为95%,自由度f=4时的t值,从表7-3中可查得t0.05,4=2.78。sxtt分布曲线xsxt与正态分布曲线形状相似,但t分布随自由度f而改变,f趋于时,t分布趋于正态分布;不同f值及概率所对应的t值已计算出,可查ta,f表获得;置信度P:落在(ts)范围内的概率显著性水平a:落在范围外的概率,a=1-P如:t0.05,10=2.23,表示P=95%,f=10时t=2.23当f20时,t值与u值已非常接近了单次测量结果(X)来估计总体平均值的范围,则:=xuntsxtsxx以样本平均值估计:少量测量数据,t分布处理:nuxuxx平均值的置信区间例5测定结果47.64%、47.69%、47.52%、47.55%,计算置信度为90%、95%、99%时总体平均值的置信区间?解:)%23.060.47(84.5t)%13.060.47(18.3t)%09.060.47(nstx35.2t31nf%08.0s%60.47x3,01.03,05.0f,a3,10.0,,,,,从本例可看出,置信度越高,置信区间就越大,即所估计的区间包括真值的可能性就越大,在分析化学中,一般置信度在95%或90%。显著性检验-t检验法在实际工作中,往往会遇到对标准或纯物质进行测定时,所得到的平均值与标准值不完全一致;或者采用两种不同的方法或不同分析人员对同一试样进行分析时,两组分析结果的平均值有一定差异;这种差异是由偶然误差引起的,还是系统误差引起的?这类问题在统计学中属于“假设检验”。如果分析结果之间存在“显著性差异”,就认为它们之间有明显的系统误差;否则就认为没有系统误差,纯属偶然误差引起的,认为是正常的。存在“显著性差异”指有明显的系统误差检验方法有t检验法和F检验法t检验法(1)平均值与标准值的比较为了检查分析数据是否存在较大的系统误差,可对试样进行若干次分析,再利用t检验法比较分析结果的平均值与标准试样的标准值之间是否存在显著性差异。进行t值检验时,首先按下列计算出t值:nsxtntsx计如果t计t表,则存在显著性差异,否则不存在显著性差异(P=95%)例6用新方法分析结果:10.74%、10.77%、10.77%、10.77%、10.81%、10.82%、10.73%、10.86%、10.81%,已知=10.77%,试问采用新方法,是否引起系统误差?解:起系统误差无显著性差异,即没引,,,,,表计计表tt43.19%042.0%77.10%79.10nsxt%042.0s%79.10x31.2t05.0a8f9n(2)两组平均值的比较n1s1n2s21x2x21ss212121212221212122i221i1nnnnsxxt)1n()1n()1n(s)1n(ss)1n()1n()xx()xxss计或,(总自由度偏差平方和:合并标准偏差P一定时,查t值表(f=n1+n2-2)若t计t表,则两组平均值存在显著性差异,否则不存在t检验法比较两组数据的方差s222小大计ssF显著性检验-F检验法计算F值与表中F值(单边值)比较,F计F表,则它们精密度存在显著性差异。F值大,存在显著性差异,F值趋近于1,则两组数据精密度相差不大。表中F值用于单侧检验,即检验某组数据的精密度是否大于或等于另一组数据的精密度时,置信度为95%(a=0.05)。而用于判断两组数据的精密度是否有显著性差异,即一组数据的精密度可能、=、另一组数据的精密度时,a=2×0.05=0.10,即P=90%例7两种方法测定某样品结果如下,问两方法之间是否存在显著性差异(P=90%)?n1=3(1.26%1.25%1.22%)n2=4(1.35%1.31%1.33%1.34%)%33.1x%24.1x21异两标准偏差无显著性差解:表计55.9F53.1017.0021.0F%017.0s%021.0s2221异两方法间存在显著性差5,1.02121212122221121.6019.02)()(tnnnnsxxtnnxxxxsii例8旧仪器测定6次,s1=0.055;新仪器测定4次,s2=0.022。问新仪器的精密度是否显著优于旧仪器的精密度?解:)边检验,不存在显著性差异(单可见,),(表计小大计小大表%95FF25.6022.0055.0ssF314f516f01.9F2222例9两种分析方法的精密度之间是否有显著性差异?n1=11,s1=0.21%n2=9,s2=0.60%解:著性差异,故两方法之间存在显,,表计表小大小大计FF07.3F10111f819f2.821.060.0ssF2222双边检验,P=90%四、异常值(可疑值)的取舍在一组测定值中,常出现个别与其它数据相差很大的异常值(可疑值)。如果确定知道此数据由实验差错引起,可以舍去,否则,应根据一定的统计学方法决定其取舍。统计学处理取舍的方法有多种,下面仅介绍三种常用的方法。异常值的取舍-4d法偏差超过3的测量值概率小于0.3%,舍去该值。的各测定值可舍去。大于故可粗略地认为,偏差,代替,用代替对于少量数据,只能用,的个别测定值可以舍去这样偏差超过dds44,43,8.0该法简单,但存在较大的误差,与其他检验法矛盾时以其他方法为准判断时,先求出除异常值外的其余数据的平均值和平均偏差,然后将异常值与平均值进行比较,如绝对差值大于,舍去可疑值,否则保留xdd4测定步骤:1、将异常值除外,求其余测定值平均值和平均偏差。2、如果,异常值就应弃去,否则应予以保留。1nx1nd114nndx异常值-例10测量得结果:1.25、1.27、1.31、1.40,试问1.40这个数据是否应保留?这个数据应舍去40.1412.028.140.1d023.028.1dx092.04d异常值与平均值的绝对值差:解:不计异常值1.40,得:格鲁布斯(Grubbs)法1、数据从小到大排列:x1,x2,…,xn-1,xn其中x1或xn可能是异常值2、据该组数据的平均值及标准偏差,计算统计量T,sxxTsxxTn1或该法准确度较好,但要计算及s,手续较烦x异常值的取舍-Grubbs法3、与Ta,n值表中相应数值比较,若TTa,n,则异常值舍去,否则保留例11例10中的数据用Grubbs法判断,1.40这个数据是否保留(P=95%)解:这个数据应保留查表得:,40.1TT46.1TT36.1066.031.140.1sxxT066.0s31.1xn,a4,05.0n,an与例10结论不同,该法可靠性较高异常值的取舍-Q检验法Q检验法1、数据从小到大排列:x1,x2,…,xn-1,xn2、求出最大值与最小值之差(极差)xn-x13、算出异常值数据与邻近数据之差(邻差):xn-xn-1或x2-x14、计算统计量Q计:(邻差除以极差)11211xxxxQxxxxQnnnn计计或5、从Q计值表中查得Q表,比较Q计与Q表,若Q计Q表,则舍去异常值,否则保留例12:测量得结果:1.25、1.27、1.31、1.40,试问用Q检验法判断,1.40这个数据是否保留(P=90%)这个数据应保留,查表得:表表40.176.0460.025.140.131.140.1QQQnQ
本文标题:分析化学数据的处理
链接地址:https://www.777doc.com/doc-2650104 .html