您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 《试验设计与数据处理》讲稿_第1章(研究生)
1《科学研究的结果和数据处理》主讲:林建联系电话:15105178268Email:linjian@njau.edu.cn2第1节试验数据的误差分析※试验的目的是获得规律,规律的表现形式在于数据※误差存在的客观性※误差范围的可控性和数据的可靠性※本章的主要内容:1.误差来源2.误差表示3.误差估计4.误差传递31.1真值与平均值※真值─客观值或实际值。真值一般是未知的;但从相对的意义上来说,真值又是已知的:理论真值约定真值相对真值※平均值─真值的近似值或估计值。4(1)算术平均值•适用场合:等精度的试验、试验值服从正态分布。–等精度的试验指试验人员、试验方法、试验场合、试验条件相同的试验。nxnxxxxniin121设有n个试验值:x1,x2,…,xn,则它们的算术平均值为:5(2)加权平均值•设有n个试验值:x1,x2,…,xn,w1,w2,…,wn代表单个试验值对应的权,则它们的加权平均值为:niiniinnnwxwnxwxwxwx112211•适用场合:非等精度的试验、试验值服从正态分布。6权数或权值的确定:•①当试验次数很多时,以试验值xi在测量中出现的频率ni/n作为权数。•②如果试验值是在同样的试验条件下但来源于不同的组,则以各组试验值的出现的次数作为权数。–加权平均值即为总算术平均值。(见例1-1)•③根据权与绝对误差的平方成反比来确定权数。•例1-2权数的计算:•x1的绝对误差为0.1;x2的绝对误差为0.02,则:•x1的权数为w1=1/0.12=100•x2的权数为w2=1/0.022=2500一般有三种方法7(3)对数平均值•设有两个数值x1、x2,都为正数,则它们的对数平均值为:xxL•注意:•如果0.5≤x1/x2≤2时,可用代替,误差≤4.4%•适用场合:试验数据的分布曲线具有对数特性。121221212121lnlnlnlnxxxxxxxxxxxxxLxLx8(4)几何平均值(5)调和平均值•设有n个正试验值:x1,x2,…,xn,它们的调和平均值为:nxnxxxHniin12111111•适用场合:试验值的倒数服从正态分布。•适用场合:试验数据取对数后分布曲线更加对称时。nnnnGxxxxxxx12121)(•设有n个正试验值:x1,x2,…,xn,则它们的几何平均值为:91.2误差的基本概念•1.绝对误差绝对误差=试验值-真值△x=x–xt•最大绝对误差的估算:–用仪器的精度等级估算;–用仪器最小刻度估算maxxxxt•真值一般是未知的,通常用最大的绝对误差来估计其大小范围:102.相对误差•由于真值一般为未知,所以相对误差也不能准确求出,通常也用最大相对误差来估计相对误差的大小范围:真值绝对误差相对误差%100tRxxEmaxtttRxxxxE•在实际计算中,常常将绝对误差与试验值或平均值之比作为相对误差,即:或xxERxxER113.算术平均误差•设试验值xi与算术平均值之间的偏差为di,则算术平均误差定义式为:(1-23)•求算术平均误差时,偏差di可能为正也可能为负,所以一定要取绝对值。显然,算术平均误差可以反映一组试验数据的误差大小,但是无法表达出各试验值间的彼此符合程度。xndnxxniinii11124.标准误差•标准误差:均方差、标准偏差,简称为标准差。•标准差与每一个数据有关,而且对其中较大或较小的误差敏感性很强,能明显地反映出较大的个别误差。•它常用来表示试验值的精密度:–标准差越小,试验数据精密度越好。•当试验次数为有限时,称为样本标准差,其定义为:1/)(1)(111221212nnxxnxxndsniniiiniiniinnxxnxxndniniiiniinii11221212/)()(•当试验次数n无穷大时,称为总体标准差σ,其定义为:131.3试验数据误差的来源及分类※1.随机误差指在一定试验条件下,以不可预知的规律变化着的误差。※特点:•在相同条件下,多次测量同一量时,误差的绝对值和符号的变化时大时小,时正时负,没有确定的规律;•在一次测定中,是不可预知的,但在多次测定中,其误差的算术平均值趋于零。※随机误差的来源:偶然因素※随机误差具有一定的统计规律:(1)有界性;(2)正误差和负误差出现的频数大致相等;(3)绝对值小的误差比大的误差出现的次数多(收敛性)。(4)当测量次数n→∞,误差的算术平均值趋于零(抵偿性)。14※2.系统误差•系统误差是指在一定试验条件下,由某个或某些因素按照某一确定的规律起作用而形成的误差。※特点:•系统误差的大小及其符号在同一试验中是恒定的,或在试验条件改变时按照某一确定的规律变化。•当试验条件一旦确定,系统误差就是一个客观上的恒定值,它不能通过多次试验被发现,也不能通过取多次试验值的平均值而减小。※系统误差的来源:•仪器(如砝码不准或刻度不均匀等);•操作不当;•个人的主观因素(如观察滴定终点或读取刻度的习惯);•试验方法本身的不完善。15※3.过失误差•粗差、人为误差:是一种显然与事实不符的误差。※特点:没有一定的规律。※过失误差的来源:–由于实验人员粗心大意造成的,如读数错误、记录错误或操作失误等。–在测量进行中受到突然的冲击、震动、干扰的影响等。※含有过失误差的实验数据是不能采用的,必须设法从测得的数据中剔除。161.4试验数据的精准度•精准度包含三个概念:精密度、正确度、准确度。1.精密度:反映随机误差的大小程度(集中程度)。2.正确度:反映系统误差的大小程度(正确程度)。3.准确度:又称精确度,简称精度,含有精密、正确两重含义,用来描述试验结果与真值的接近程度,即反映系统误差和随机误差合成的大小程度。171.5试验数据误差的估计与检验※1随机误差的估计对试验值精密度高低的判断:(1)极差:指一组试验值中最大值与最小值的差值。R=xmax-xmin(2)标准差:总体标准差σ、样本或子样标准差s反映试验数据的分散程度:–σ或s越小,则数据的分散性越低,精密度越高,随机误差越小,试验数据的正态分布曲线也越尖。(3)方差:方差即为标准差的平方–方差也反映了数据的分散性,即随机误差的大小。18※2系统误差的检验秩和检验法:检验两组数据之间是否存在显著性差异;证明新试验方法的可靠性。[例1-5]设甲、乙两组测定值为:1.数据按从小到大排序,确定个数据的秩;2.将其中一组的秩相加,称为秩和。记为R1或R2;甲组数据的个数n1=6乙组数据的个数n2=9甲组数据的秩和R1=7+9+11.5+11.5+14+15=683.由秩和临界值表(见附录1)可查得R1的上下限T2和T1,如果R1T2或R1Tl,则认为两组数据有显著差异:(本例中:取α=0.05,查得T1=33,T2=63,即R1T2,所以两组数据有显著差异)19※3过失误差的检验※试验数据中:–随机误应要进行估计–系统误差要设法消除–不能含有过失误差※如何判断数据中有“坏值”—判别过失误差的界限–涂改数据是假数据;–不科学地剔除数据也是假数据。※可疑数据取舍的一般原则:(1)试验中发现异常数据,应停止试验,分析原因并纠正。(2)试验后发现异常数据,应先找原因,再进行取舍。(3)在分析数据时,如原因不确切,应对数据进行统计处理;(4)对舍去的数据,在报告中应注明原因或所选用的方法。20(1)拉依达(Pauta)准则—三倍标准差准则※方法:1)计算包括可疑值在内的平均值及标准偏差;2)计算偏差值、偏差值绝对值、3s值或2s值;3)比较偏差绝对值与3s值的大小,如果:则应将xp从该组试验值中剔除。sxxdpp3x序号测定值偏差值及其检验xi10.128-0.012-0.02220.129-0.011-0.02330.131-0.009-0.02540.133-0.007-0.02750.135-0.005-0.02960.138-0.002-0.03270.1410.001-0.03280.1420.002-0.03190.1450.005-0.028100.1480.008-0.025110.1670.027-0.0060.140s0.01123s0.0335xsdi3iidxx21(1)拉依达(Pauta)准则——三倍标准差准则(续)※α——显著性水平,表示检验出错的几率。※3s或2s的选择与显著性水平α有关:3s相当于显著水平α=0.012s相当于显著水平α=0.05※适用场合:测定次数n20※测定次数n10时,应采用其它准则。如:格拉布斯准则、狄克逊准则、t检验法等x22(2)格拉布斯(Grubbs)准则※方法:1)计算包括可疑值在内的平均值及标准偏差;2)计算偏差绝对值;3)选取偏差绝对值最大的数据来检验,如果:则应将xp从该组试验值中剔除。从附录2查取。x(,)ppdxxns(,)n序号第一次检验第二次检验xixi110.290.16410.290.111210.330.12410.330.071310.380.07410.380.021410.400.05410.400.001510.430.02410.430.029610.460.00610.460.059710.520.06610.520.119810.820.36610.4510.40s=0.165s=0.078ixxixxxx(0.05,8)2.030.160.320.366s(0.05,7)1.940.0780.150.119s(1)(2)23(3)狄克逊(Dixon)准则※方法:1)将n个试验数据按从小到大的顺序排列;2)检验x1或xn:用附录3所列的公式,计算出f0,如果:若f0f(α,n),则应该剔除x1或xn。※注意事项:1)可疑数据应逐一检验,不能同时检验多个数据。2)剔除一个数后,如果还要检验下一个数,则应注意试验数据的总数发生了变化。3)根据测定次数n,确定判别过失误差的准则:n20时,用格拉布斯准则。n20时,用3s准则241.6有效数字和试验结果的表示※1有效数字--能够代表一定物理量的数字(1)有效数字的位数可反映试验的精度或表示所用试验仪表的精度,所以不能随便多写或少写。1.5687g,精度为0.0001g,相对误差为1/156871.5g,精度为0.1g,相对误差为1/15(2)小数点不影响有效数字的位数。第一个非0数前的数字不是有效数字,而第一个非0数后的数字是有效数字。50,0.050,5.0,292位有效数字29.00,5.000,12.474位有效数字(3)在计算有效数字位数时,如果第一位数字等于或大于8,则可以多计一位。9.994位有效数字8.2105位有效数字25※2有效数字的运算规则(1)加、减结果的位数应与其中小数点后位数最少的相同。x先计算,后对齐11.9610.2+0.00322.163先对齐,后计算12.010.2+0.022.2(2)乘积、商的有效数位数,应以各乘、除数中有效数字位数最少的为准。例如:12.6×9.81×0.050中0.050的有效数字位数最少,只有两位,所以有12.6×9.81×0.050=6.2。(3)乘方、开方后的有效数字位数应与其底数的相同。例如:2.42=5.86.28.626(4)对数的有效数字位数与其真数的相同。例如ln6.84=1.92;lg0.00004=-4。(5)在4个以上数的平均值计算中,平均值的有效数字可增加一位。例如(22.6+22.8+22.5+22.3+22.5)/5=22.54原来只有3位有效数字,而计算结果增加了一位。x(6)取自手册上的数据,其有效数字位数按实际需要取,但原始数据的位数如有限制,则应服从原始数据。(7)常数的有效数字位数,根据需要取。(8)一般的工程计算中,取2~3位有效数字。27※3有效数字的修约规则四舍六入尾留双x例如,将下
本文标题:《试验设计与数据处理》讲稿_第1章(研究生)
链接地址:https://www.777doc.com/doc-610965 .html