您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 高速公路路面质量的评价问题 国防科技大学 饶彬 孙蕾 唐荣富
全全国国第第四四届届研研究究生生数数学学建建模模竞竞赛赛题目高速公路路面质量的评价问题摘要高速公路路面质量的评价问题本质上属于多元统计分析的内容,需要理清指标间、因素间以及指标与因素间的各项关系。本文首先对数据进行了预处理,包括异常值和缺失数据的修正以及数据的标准化处理。然后采用相关分析法、方差分析法、总体最小二乘技术、晶体分布法和主成分分析法对问题(1~5)进行了回答。对于问题1,采用相关分析法分析了四个质量指标间的线性关系和非线性关系,得出了部分指标间具有弱线性相关性的结论。分析指出了指标间虽然有弱相关性但并不能给出一个确定的函数关系式,而且还带有一定的随机性。对于问题2,首先分析了10个因素指标的信息存在较大的冗余性,采用相关分析,并结合总体最小二乘法拟合出了部分因素指标间的数学表达式。进一步分析得出只需测量其中的5个关键指标即可(参看P8页图6)。其次,按照一定的规则对这几个关键因素指标的试验水平划分等级。最后,采用多因子方差分析法检验各因素指标对质量指标的影响能力。结论见P13页图13。对于问题3,首先阐明了压实度理论上界的物理背景与数学含义。其次结合数据和工程背景,将集料看成是由粗料和细料两个总体构成。进一步将粗细集料实体简化为标准球体,则压实度理论上界问题就可以归结为球体的装箱问题。文章给出了一种晶体分布法解决装箱问题,然后从理论上推导得出了压实度理论上界与集料级配比(即筛孔通过率)的关系,并结合数据给出了定量分析。对于问题4,和问题二的处理方法类似,将沥青类型、碎石质量、生产厂家等因素分成简单的几个等级,前一个问采用单因子方差分析法进行处理,后一问涉及到两种影响因子,采用双因子方差分析法进行检验。结论参见P24~P27。对于问题5,根据试验结果对建设部门提出了一些有用的建议。(1)因素指标的测量可以简化,只需要测试6个指标即可,分析了其理论依据;(2)提出了采用主成分分析法对高速公路的综合质量进行评估的方法。(3)分析了贝叶斯网络在处理高速公路路面质量评价问题的优缺点。参赛队号9000218参赛学校国防科技大学参赛队员姓名饶彬孙蕾唐荣富参赛密码(由组委会填写)题号C第1页1问题重述(略,参看原题)2问题分析高速公路路面质量的设计问题具有非常重要的现实意义,一方面可以降低高速公路的运行成本,另外一方面可以保障运输任务的安全。设计任务的一个非常重要的问题是找出对高速公路路面质量有较大影响的因素以及评价高速公路路面质量的指标体系,另外还要分析因素与因素间、因素与指标间、以及指标与指标间的关系,才能根据分析结果找出较优的方案,改良设计任务,提高路面质量。但是由于我国建设高速公路的历史不长,对高速公路路面各因素的影响还不太了解,无法给出其解析的表达式,只能从试验数据或计算数据出发,从中挖掘规律,建立各种指标和影响因素的经验模型。从本质上讲,高速公路路面质量的评价问题属于多元统计分析的内容。本题中涉及10个因素指标,4个质量评价指标和290组实验样本数据。由于数据来源于真实的测试数据,将不可避免的引入粗大误差(异常值)和随机误差,另外数据的量纲也不一致,因此首先应对数据进行预处理。又因为缺乏指标间和各种因素间的先验计算公式,在分析它们之间的关系时首先应该进行相关性检验,如果相关性显著,再采用总体最小二乘方法拟合参数。采用总体最小二乘算法的根据是设计矩阵和观测矩阵都带有随机误差,常规最小二乘算法估计精度不够。最后,题目中五个问题各有特点,决定了解决的方法也不同。对于问题一,将4个评价指标当成是4个随机变量,采用相关分析法分析它们之间的线性相关关系,得出了部分指标间具有弱线性相关性的结论。并分析了描述指标与指标关系的困难性,也是说四个指标间并没有明确的函数关系,而是还带有一定的随机性。对于问题二,本质上属于方差分析的内容。首先,因为10个因素指标之间具有较强的相关特性,信息的冗余性很大,本文采用相关分析,并结合总体最小二乘法拟合出了部分因素指标间的数学表达式。因此从理论上可以不需要测试10个因素指标,只需测量其中的5个关键指标即可。其次,按照一定的规则对这几个关键因素指标的试验水平划分等级。最后,考虑到质量指标同时受到多个因素指标的影响,因此不宜采用单因子方差分析法进行分析,而采用多因子方差分析法检验各因素指标对质量指标的影响能力。对于问题三,首先阐明了压实度理论上界的物理过程与数学含义。其次结合实测数据和工程背景,将集料看成是由粗料和细料两个总体构成。如果将粗细集料实体简化为标准球体,则压实度理论上界问题就可以归结为球体的装箱问题。文章给出了一种晶体分步法解决装箱问题,然后从理论上推导得出了压实度理论上界与集料级配比(即筛孔通过率)的关系,并结合数据给出了定量分析。对于问题四,和问题二的处理方法类似,需要将沥青类型、碎石质量、生产第2页厂家等因素分成简单的几个等级,前面一个问可以采用单因子方差分析法,后一问涉及到两种影响因子,可以采用双因子方差分析法对影响的显著性进行检验。对于问题五,根据试验结果对建设部门提出了一些有用的建议。(1)因素指标的测量可以简化,只需要测试6个指标即可,分析了其理论依据;(2)提出了采用主成分分析法对高速公路的综合质量进行评估的方法。2.1指标分析首先我们来分析一下10个因素指标的具体涵义。(1)油石比1x:定义为混合料中沥青与集料(即矿粉、碎石)的质量比,即:1/abxmm,其中am为混合物中沥青的质量,12bccdmmmm为混合物中集料(矿粉和碎石)的质量,1cm表示粗碎石质量,2cm表示细碎石质量,dm表示矿粉质量。(2)筛孔通过率2x:显然筛孔通过率2x应为筛孔直径l的函数,即22()xxl,0l。且20lim()0lxl,2lim()1lxl。2x反映了集料粗细程度的分布,设()pl为集料质量的分布函数,则应有20()()lpdxl,()pl的计算可以采用差分的方法获得。(3)空隙率(VV)3x:定义为混合料经碾压后达到设计压实状态时,其中空隙体积占总体积的百分比。即:3/()abxVVVV,其中V表示空隙所占体积,aV表示沥青所占体积,bV表示集料所占体积,上标“撇”在这里无特殊说明均表示压实后的状态。(4)矿料间隙率(VMA)4x:定义为压实状态时,混合料中“有效沥青体积+空隙体积”占总体积的百分比,即:4()/()aabxVVVVV。(5)饱和度(VFA)5x:等于(VMA-VV)/VMA,单位是%,反映有效沥青体积占VMA体积的百分率。即5434100()/100/()aaxxxxVVV。(6)粉胶比(DP)6x:定义为混合料中矿粉质量与沥青质量的比。即6/daxmm。(7)毛体积密度7x:定义为达到设计压实状态的试件的密度。即7()/()ababxmmVVV。(8)最大理论密度8x:定义为混合料理论上的最大密度,即如果不含任何空隙时混合料的密度。VV第3页=100-毛体积密度/最大理论密度×100。因此有738100100xxx。(9)%Gmm(最初)9x:即混合料在最初压实状态的压实度。最初压实状态的压实度为经过少数几次碾压后的压实度。压实度=试件密度/最大理论密度×100。(10)%Gmm(最大)10x:混合料试件成型时达最大压实状态时的压实度。一般应达到或略超过设计压实度。显然上述指标之间在理论上具有较强的关系,例如5434100()/xxxx,378100(/)100xxx,即是说各个指标间是有一定的相关关系的(不一定是线性相关性)。对于实测数据而言,因为测量误差的影响以及一些其他因素,往往导致这些理论等式并不一定严格成立。2.2数据分析由于数据来源于真实的测试数据,将不可避免的引入粗大误差(异常值)和随机误差,因此首先应对数据进行预处理。(1)异常数据的处理由于本文采取的方法是多元统计处理的方法,近代稳健统计学的研究表明[4],在应用各种回归模型时,观测数据中不能有一个粗大误差,否则结果是不可靠的。本题中的数据明显含有过失误差,例如192次试验测得的VMA值为“15..33”,明显是人为疏忽造成的,又例如序号为226的弯拉应变系数,给出的结果为31450,明显高于其他测试数据(其他数据变化范围都在[2247.0,2917.1]之间),因此可以预先剔除掉。但是剔除的方法不能太过主观,应该遵循一定的规则。对于静态的过失误差数据,国家标准里面有一些剔除的算法,如罗曼诺夫斯基准则和格拉布斯准则等。但这些方法的前提是数据本身必须符合正态分布。本题涉及290组测试结果、10个影响因素、4个评价指标。从数据上看,变化范围都不太大,可以近似看成是290次独立等精度的测量,但从分布上看和正态分布相接近,为了充分提高数据的利用率,本文提出了一种异常值剔除的迭代法,对少量的异常值进行剔除。算法步骤如下:异常值迭代剔除法1.给定初值0,计算均值00ii1i1nxxn,,方差0202ii1i1()1nsxxn,。2.第k次迭代,计算k,具体做法是对1,...,in,如果k-1k1sixxm,则ki;第4页3.如果kk-1,则迭代结束,k即为所求的野值点集合;如果kk-1,计算均值kkii1i1nxxn,,方差02k2ii1i1()1nsxxn,,令kk1,返回第2步。其中m为预先设定的阈值参数,一般取2~4,本文取4,以便提高阀值,充分利用数据利用率。通过解算,本文共剔除了4个异常值数据,虽然和真实数据相比变化不大,但提高了数据的可信度。(2)缺失数据的处理测试结果中含有许多空格和斜杠线,表示测试结果未知或未做。如果简单地将这些含有缺失数据的纪录剔除掉,将会减少样本含量,且其它未缺失的信息利用不上。如果简单地采用均值填充的方法又显得精度不够。本文采取的办法是区别对待,例如对于岩石和沥青类型中的缺失数据,统一划为其他类型;对于筛孔百分率的缺失数据,因为通过率具有严格的数学和物理基础,即筛孔越大,通过率越高,可以采用已知数据进行多项式拟合的方法预测缺失数据的值,另外很多数据的缺失值是因为前面的试验已经达到100%了,对于更大的筛孔,通过率肯定也为100%,只需将其补成100%就行了;对于10个影响因素的缺失值,由于部分因素之间满足严格的数学关系式(例如345,,xxx),可以利用它们之间的关系式进行反推;对于4个评价指标之间的缺失值,由于目前为止并不知道它们之间的影响因素,可以利用已有数据分析它们之间的相关关系,相关性如果显著则建立回归模型来补齐。051015202530350102030405060708090100筛孔直径(mm)筛孔通过率0510152025300102030405060708090100筛孔直径(mm)筛孔通过率图1筛孔通过率原始数据图2修正后的筛孔通过率如图1是筛孔通过率的原始测试数据,中间有许多断点。考虑到筛孔通过率的物理规则是筛孔越大,通过率越高,这是一个物理连续过程,因此可以用平滑的连续曲线来拟合(也可以用插值进行处理),进而填补缺失数据。本文采用三次多项式函数来进行拟合,修正后的筛孔通过率数据见图2。可见,修正结果良好。这样混合物的筛孔通过率就可以反映在拟合的多项式系数上了,如果只是粗略的第5页分析,用一个线性函数的斜率k就可以近似反映出混合物粗细的分布情况。另外对于没有进行筛孔通过率测试的试验,由于差别都不大,可以采用平均值进行补齐。(3)量纲的处理考虑到本文的指标数据变化范围非常大,直接处理计算量大,且不好分析指标和因素间的相关关系。为了方便起见,本文将所有数据进行标准化处理,即*ijjijjxxx其中i表示试验样本号,j表示指标编号,jx表示指标均值,j表示指标标准差。为了方便起见,以后无特殊说明均省略“*”符号,用ijx表示标准化后的数
本文标题:高速公路路面质量的评价问题 国防科技大学 饶彬 孙蕾 唐荣富
链接地址:https://www.777doc.com/doc-447823 .html