您好,欢迎访问三七文档
当前位置:首页 > 资格认证/考试 > 计算机等级考试 > 可疑数据的取舍方法区别
可疑数据的取舍方法在一组条件完全相同的重复试验中,个别的测量值可能会出现异常。如测量值过大或过小,这些过大或过小的测量数据是不正常的,或称为可疑的。对于这些可疑数据应该用数理统计的方法判别其真伪,并决定取舍。常用的方法有拉依达法、肖维纳特(Chavenet)法。格拉布斯(Grubbs)法等。拉依达法肖维纳特法格拉布斯法一、拉依达法当试验次数较多时,可简单地用3倍标准偏差(3S)作为确定可疑数据取舍的标准。当某一测量数据(xi)与其测量结果的算术平均值(x-‘)之差大于3倍标准偏差时,用公式表示为:︳xi-x-‘︳>3S则该测量数据应舍弃。这是美国混凝土标准中所采用的方法,由于该方法是以3倍标准偏差作为判别标准,所以亦称3倍标准偏差法,简称3S法。取3S的理由是:根据随机变量的正态分布规律,在多次试验中,测量值落在x-‘一3S与x-‘十3S之间的概率为99.73%,出现在此范围之外的概率仅为0.27%,也就是在近400次试验中才能遇到一次,这种事件为小概率事件,出现的可能性很小,几乎是不可能。因而在实际试验中,一旦出现,就认为该测量数据是不可靠的,应将其舍弃。另外,当测量值与平均值之差大于2倍标准偏差(即︳xi-x-‘︳>2S)时,则该测量值应保留,但需存疑。如发现生产(施工)、试验过程屯有可疑的变异时,该测量值则应予舍弃。拉依达法简单方便,不需查表,但要求较宽,当试验检测次数较多或要求不高时可以应用,当试验检测次数较少时(如n10)在一组测量值中即使混有异常值,也无法舍弃。二、肖维纳特法进行n次试验,其测量值服从正态分布,以概率1/(2n)设定一判别范围(一knS,knS),当偏差(测量值xi与其算术平均值x-‘之差)超出该范围时,就意味着该测量值xi是可疑的,应予舍弃。判别范围由下式确定:肖维纳特法可疑数据舍弃的标准为:︳xi一x-‘︳/S≥kn三、格拉布斯法格拉布斯法假定测量结果服从正态分布,根据顺序统计量来确定可疑数据的取舍。进行n次重复试验,试验结果为x1、x2、…、xi、…、xn,而且xi服从正态分布。为了检验(i=1,2,…,n)中是否有可疑值,可将按其值由小到大顺序重新排列,根据顺序统计原则,给出标准化顺序统计量g:当最小值x(1)可疑时,则:g=(x-‘一x(1))/S当最大值x(n)可疑时,则:g=(x(n)一x-‘)/S根据格拉布斯统计量的分布,在指定的显著性水平β(一般β=0.05)下,求得判别可疑值的临界值g0(β,n),格拉布斯法的判别标准为:g≥g0(β,n)利用格拉布斯法每次只能舍弃一个可疑值,若有两个以上的可疑数据,应该一个一个数据的舍弃,舍弃第一个数据后,试验次数由n变为n一1,以此为基础再判别第二个可疑数据。例题;实验室进行通配比的混凝土抗压强度试验,其实验结果为:23.6,24.0,26.5,24.6,25.2,26.7,26.1,30.5,26.0,25.6(MPa),使用拉依达法判别其取舍。解;分析得Xmin=23.6MPa和Xmax=30.5MPa最可疑,首先判别Xmin和Xmax。根据式(2-1)(2-4)得;X=25.9MPaS=1.9MPa׀Xmax-X׀=4.6MPaXmin-X׀=2.3MPa
本文标题:可疑数据的取舍方法区别
链接地址:https://www.777doc.com/doc-7583181 .html