您好,欢迎访问三七文档
当前位置:首页 > 金融/证券 > 投融资/租赁 > 第四讲_3_WZY_03New
第四讲第三章误差和分析数据处理4-1§4-3有限测定数据的统计处理一、置信度(levelofconfidence)与μ的置信区间的计算(一)已知总体标准偏差σ时:对经常测定的某种试样,由于积累了大量的测定数据(n∞),σ是已知的。根据u定义式,并考虑u的符号可得:x=±uσ………………….(4-18)由偶然误差的区间概率可知,测定值出现的概率由u决定。如当u=±1.96时,x在(μ-1.96σ)~(μ+1.96σ)区间出现的概率为0.95。如果希望用单次测定值x来估计μ可能存在的范围,则可认为区间(x±1.96σ)能以0.95的概率将真值μ包含在内,即:=x±uσ=x±1.96σ………..(4-18)由于平均值的精密度较单次测定值的精密度高,因此常用样本平均值来估计真值所在的范围。此时有:………..(4-19)nuxuxx(4-18)和(4-19)分别表示在一定置信度P时,以单次测定值x或以样本平均值为中心包含总体平均值μ的取值范围,即置信区间!在置信区间内包含μ的概率称为置信度,它表明人们对所作出的判断的把握程度高低(用P表示)。u值可由表4-2中查到,它总与一定的置信度相对应!第四讲第三章误差和分析数据处理4-2在对进行区间估计时,置信度P的高低确定要恰当(一般以95%或90%即可)!从(4-18)和(4-19)还可以看出,置信区间大小取决于测定的精密度σ和置信度P的选择,对于平均值来说还与测定的次数n有关。当σ一定时,P定得愈高则∣u∣值愈大,过大的置信区间将使其失去实用意义!若固定P,当测定精密度越高和测定次数越多时,置信区间越小,表明测定值x或平均值越接近总体平均值,若无系统误差则测定的准确度越高!!第四讲第三章误差和分析数据处理4-3注意:μ是客观存在的,而区间(x±uσ)或具有随机性,均与一定置信度P相联系。因此,只能说置信区间包含真值的概率是P,而不能认为真值落在上述区间的概率是P!!!xux(二)已知样本标准偏差S时:因为在有限次测定中无法获得μ和σ,只能求出和S。且当n较少时,测定值或偶然误差并不呈正态分布!这就给少量测定数据的统计处理带来困难。x此时,用S代替σ对μ的置信区间作出估计将会引起偏离,且n越少其偏离越大。然而,如采用新统计量tP,f取代u(仅与P有关),则上述偏离将可得到修正!第四讲第三章误差和分析数据处理4-4t-分布曲线特点(1)单峰性:曲线在t=0处最高,并以t=0为中心左右对称;(2)随f改变:f→∞时t曲线就与N(0,1)合为一体,N(0,1)是t分布的极限!(3)类似N(0,1):曲线下区间面积也表示随机误差在此区间的P!统计量t值与N(0,1)中的u值不同,它不仅与概率P还与测定次数n有关。不同P和f对应的tp,f值见表4-3中。第四讲第三章误差和分析数据处理4-6图4-7t分布曲线t分布:t统计量定义…..(4-17)Sxtt分布曲线下面积(表4-3)单侧:t0.05,9=1.833双侧:t0.05/2,9=2.262=单侧t0.025,9单侧:t0.01,9=2.821双侧:t0.01/2,9=3.250=单侧t0.005,9单侧:t0.05,∞=1.64双侧:t0.05/2,∞=1.96=单侧t0.025,∞第四讲第三章误差和分析数据处理4-7表4-3tP,f值表(双边)t值P90%95%99%99.5%f(n-1)16.3112.7163.66127.3222.924.309.9214.9832.353.185.847.4542.132.784.605.6052.022.574.034.7761.942.453.714.3271.902.363.504.0381.862.313.353.8391.832.263.253.69101.812.233.173.58201.722.092.843.15301.702.042.75(3.01)601.672.002.66(2.87)1201.661.982.622.81∞1.641.962.582.81第四讲第三章误差和分析数据处理4-8由表4-3中的数据可知,随f的增加,t值逐渐减小并与u值接近。当f=20时,t与u已经比较接近。当f→∞时,t→u,S→σ。在引用t值时,一般取P=0.95置信度!根据样本的单次测定值x或平均值分别表示μ的置信区间时,根据t分布可以得出以下的关系:=x±tS…..…………………..(4-20)或:..…….(4-21)nstxstxfPxfP,,第四讲第三章误差和分析数据处理4-9从N(0,1)中置信区间计算知道:虽不为所知(σ亦未知),但可期望由有限次测定值计算出一个范围,它将以一定的置信度将包含在内!该范围越小,测定的准确度越高!式(4-21)是计算置信区间常用公式。由该式知,P一定,置信区间大小与tP,f、S、n有关,且tP,f与S实际也都受n的影响,即n值越大,置信区间越窄(小)!第四讲第三章误差和分析数据处理4-10例4-5(p91):用标准方法测定试样中乙醇含量,9次测定的平均值=50.48%。设系统误差已经消除,且σ=0.02%。求置信度为P=95%时该乙醇试样中乙醇含量的置信区间。【解】(1)因结果服从正态分布,故P=0.95对应的u=±1.96,根据公式有:)%01.0%48.50(%)9/0.021.9650.48(xux第四讲第三章误差和分析数据处理4-11例4-6对SiO2的4次测定结果为(%):47.64,47.69,47.52,47.55.求P=90%和95%时平均值的置信区间。【解】计算求得:%04.04/%08.0/%60.47nSSxx;查表得:t0.90,3=2.35,和t0.95,3=3.18,因此,根据公式有:)%09.060.47()04.035.260.47,(xfpStx)%13.060.47()04.018.360.47,(xfpStx例:测定某试样中SiO2质量分数得S=0.05%,若测定精密度不变,当P=0.95时欲使置信区间的置信限为,问至少应平行测定几次?%05.0,PxfStx解:根据式(4-21)和题设得:%05.0,nStxfP105.005.0,ntfp查表4-3得知:当f=n-1=5时,t0.95,5=2.57,此时:16/57.2已知S=0.05%,则:即至少应平行测定6次,才能满足题中的要求!第四讲第三章误差和分析数据处理4-12二、定量分析数据的评价(解决两类问题)(1)可疑数据的取舍—过失误差的判断以确定某个数据是否可用!方法:Q检验法;格鲁布斯(Grubbs)检验法;(2)分析方法的准确性—系统误差的判断确定方法是否可用,判断实验测定结果准确性!显著性检验:利用统计学方法,检验被处理的问题是否存在统计学上的显著性差异。方法:t检验法和F检验法;第四讲第三章误差和分析数据处理4-13(一)可疑测定值的取舍:可疑值的取舍常对平均值和精密度造成显著影响。其实质是:区分可疑值与其它测定值之间的差异到底是由过失、还是偶然误差引起的!根据n和所要求的置信度P查QP,n值(表4-5)。若:QQP,n,则以一定置信度弃去可疑值,反之则保留,通常取P=0.90置信度。1、Q检验法:(i)测定值由小至大(x1,x2,…xn-1,xn)排序(可疑值为x1或xn)。(ii)求出可疑值与其最邻近值之差xn-xn-1或x2-x1,然后用它除以极差(xn-x1),计算出统计量Q:或……………..(4-27/8)11xxxxQnnnn1121xxxxQn第四讲第三章误差和分析数据处理4-14当测定数据较少,精密度也不高,因Q与QP,n值接近而对可疑值的取舍难以判断时,最好补作1~2次测定后再进行检验!如果没有条件再做测定,则宜用中位值(数)代替平均值报告结果;因为,是否取舍可疑值对平均值的影响较大,对中位值的影响较小。表4-5QP,n值表n345678910Q0.90.940.760.640.560.510.470.440.41Q0.950.970.840.730.640.590.540.510.49第四讲第三章误差和分析数据处理4-152、格鲁布斯法(Grubbs):(i)测定值由小至大(x1,x2,…xn-1,xn)排序(可疑值为x1或xn);(ii)计算出该组数据的平均值和标准偏差;(iii)再计算统计量G:若x1或xn可疑,则计算出统计量G:)294..(..........SxxG疑根据P和n查表4-6。若GGP,n,则可疑值与平均值的偏离较大,在给定P下可疑值应弃去。第四讲第三章误差和分析数据处理4-16由于引入了t分布中最基本的两个参数和S,故该方法准确度较Q法高而普遍被采用!x第四讲第三章误差和分析数据处理4-17表4-6GP,n值表测定次数置信度(P)测定次数置信度(P)n95%99%n95%99%31.151.15122.292.5541.461.49132.332.6151.671.75142.372.6661.821.94152.412.7171.942.10162.442.7582.032.22172.472.7992.112.32182.502.82102.182.41192.532.85112.232.48202.562.88二、显著性检验:用统计方法检验由不同方法、或不同操作者之间获得的测定值之间是否存在显著性差异,以推断它们是否存在系统误差。常见的三种假设检验(对原假设H0和备择假设H1)(1)把形如H0:=0,H1:≠0的假设称为双边检验!因备择假设H1表示可能大于0,也可能小于0,所以称为双边备择假设检验。(2)把形如H0:≤0,H1:0的假设称右侧检验;(3)把形如H0:≥0,H1:0的假设称左侧检验;右侧检验和左侧检验统称为单边检验!。第四讲第三章误差和分析数据处理4-18定量分析中常用t检验法和F检验法。1、t检验法:样本平均值与真值的比较“t检验法”—检验样本平均值与真值T之间是否存在显著性差异,从而对分析方法的准确度作出评价!x第四讲第三章误差和分析数据处理4-19用选择的方法对标准试样进行n次测定(获得n、平均值、S),然后将样本平均值与标准值T进行比较。如果以平均值为中心的某区间已按指定置信度P将真值T包含在内,那么它们之间就不存在显著性差异。根据t分布,这种差异仅是由偶然误差引起的。统计量t可由下式计算:若ttP,f,表明测定平均值与T之差异超出偶然误差的界限,按相应P判断它们之间存在显著性差异!第四讲第三章误差和分析数据处理4-20………….……(4-22)SnTxSTxtx%,04.0%,79.10,9Sxn例4-7:新方法测定葡萄糖,已知%,77.10T试以95%判断该新方法是否存在系统误差。【解】:H0:=0,H1:(10.79)≠0(10.77);依据公式有:5.104.0977.1079.10SnTxt31.25.131.28,95.0,8,95.0,tttttfpfp;因此,拒绝H1(≠0),接受H0(=0)即该新方法不存在系统误差。测定平均值与真值的差异由偶然误差引起!进行显著性检验时,若P设定过低,则易将偶然误差引起的差异判断为显著性差异!若P设定过高,又可能将系统误差引起的差异认同为正常差异,从而得出不合理的结论!因此,在定量分析中常采用P=90%或95%。显著性检验中,将具有显著性差异的测定值在随机误差分布中出现的概率称为显著性水平(α表示)。α—表示测定值位于一定P所对应的随机误差界限之外!因此,α=(1-P);第四讲第三章误差和分析数据处理4-21(1)首先对两组数据的精密度进行检验:对x1,x2,…...xn和SI;x'1,x'2,…x'n和SII;IxIIx若统计量:F=(S大)2/(S小)2表,
本文标题:第四讲_3_WZY_03New
链接地址:https://www.777doc.com/doc-4148345 .html