您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 数学建模竞赛论文格式模板
承诺书我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B中选择一项填写):B我们的参赛报名号为(报名网站提供的报名号):23006025所属学校(请填写完整的全名):四川师范大学参赛队员及联系方式:1.姓名:饶泉联系方式:183820697592.姓名:淳黎联系方式:156080129953.姓名:陈红燕联系方式:18215613429(以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。)日期:2短期交通流量预测摘要随着交通基础设置建设和智能运输系统的发展,交通规划和交通诱导已成为交通领域研究的热点。对于交通规划和交通诱导来说,准确的交通流量预测是其实现的前提和关键。本题要求我们对城市交通路网中交通路段上的交通流量进行短期预测。本文根据实际情况和问题提出了不同的模型和算法,再通过对各模型间的比较得出最优预测方案。过程如下:首先,我们先进行对数据的处理。由题可知以每15分钟来测量交通流量,一共有3天的数据。理应有288个数据,却只有276个,其中有两个负值数据为异常数据。为了保留数据的完整性,对于缺失数据和异常数据,我们分别使用插补法和平均值填补法来做。方案一:我们使用eview软件来进行时间序列的预测,时间序列预测要求数据必须是平稳的,所以在此之前,先对数据进行ADF检验。通过后才能进行预测,得到预测后的表达式和残差,并对残差进行分析估计,最后对模型进行评价。方案二:我们使用metlab软件来实现BP神经网络模型的预测。BP神经网络的实质是用已给出的数据来推出需要的数据,并将新预测出的数据重新返回输入中,得到误差,一直重复,直到误差到达合理的范围内。在预测之前,我们先得出了误差在合理范围,并且看到已给出数据的真实值与预测值得对比。在确保模型是可用的之后,在进行预测与预测结果的评价。方案三:我们使用spss软件来进行回归分析模型的预测。首先,我们需要先对数据进行相关性检验,如果数据没有相关性,则回归方程就会没有意义。接下来,通过对回归方法的决定性系数检验和方差分析检验,得到最合适方法。之后再进行第四天的预测及预测结果的评价。最后,我们将对每一个模型进行优缺点评价,进而对三种预测方法进行了一个比较,判断出那个模型是最适合这个题目的。并且对文章中所涉及的模型进行推广,使其更便于运用于生活实际中。关键词:平均值填补时间序列ADF检测BP神经网络多元线性回归31.问题的重述随着交通基础设置建设和智能运输系统的发展,交通规划和交通诱导已成为交通领域研究的热点。对于交通规划和交通诱导来说,准确的交通流量预测是其实现的前提和关键。交通流量预测根据时间跨度可分为长期交通流量预测和短期交通流量预测,长期交通流量预测以小时、天、月甚至年为时间单位,是宏观意义上的预测;短期交通流量预测一般的时间跨度不超过15分钟,是微观意义上的预测。短期交通流量预测是智能运输系统的核心内容和实现其智能化功能的基础平台。短期交通流量预测具有高度非线性和不确定性等特点,并且同时间相关性较强,研究表明,城市交通路网中交通路段上某时刻的交通流量与本路段前几个时段的交通流量有关,并且交通流量具有24小时内准周期的特征。现有3天的交通流量数据(见附件二),假设从第1天0时15分开始,每隔15分钟记录一次该段时间内的交通流量,请预测第4天的交通流量。2.问题分析对于问题要求的根据已给的3天数据来预测第四天的交通流量,并预测评价出模型的优缺点。首先,题目给出的是三天的数据,以15分钟为一个截点,应该有3x4x24个数据,但实际只有276个数据。另外,数据中还出现了负数的情况,而这显然是不符合实际情况的。所以,我们要对异常数据和残缺数据进行处理。我们运用插补法和平均值填补法来处理数据。对数据进行处理后,我们就需要对第四天的交通流量进行预测。这里我们需要对短期的交通流量进行预测。在短期预测中,我们需要以15分钟为一个时间段,预测未来的的交通流量。在这里,我们运用时间序列预测方法和最后,我们通过对每种预测方法结果的分析,来评价各种方法的优缺点。3.模型假设基本假设:(1)在观察测量的四天里交通没有突发状况,路况正常。(2)假设灰色预测模型,神经网络预测模型,时间序列预测模型都是最好的。(3)假设测量数据误差小对结论影响小,甚至没影响。44.符号说明i一天中,以15分钟为时间段的时间序列编号5.模型的建立与求解5.1对数据进行处理由题可知以每15分钟来测量交通流量,一共有3天的数据。理应有288个数据,却只有276个,其中的两个负值数据为异常数据。为了保留数据的完整性,对于缺失数据和异常数据,我们分别使用插补法和平均值填补法来做。Step1缺失数据的处理首先对于缺失数据来说,我们并不知道缺失的数据是随机缺失数据还是非随机缺失数据,所以我们先将数据点作图,观察曲线的趋势,折线图一如下:有图可知,该数据具有明显的周期性。对此,我们选择了插补法进行缺失值的填补,所谓热卡插补法(Hotdeckimputation),即对于一个包含缺失值的对象,在完整数据中找到一个与它最相似的对象,然后用这个相似对象的值来进行填补。在这里,我们用与缺失值最相似的前两天同一时段的数据的平均值来代替缺失值。用替换掉缺失值的数据画折线图得到图二:5-4004080120160200240280320255075100125150175200225250275CHE对于异常数据的处理我们直接用平均值填充法,用异常数据的前后两个数据的平均值来代替异常数据,得到完整数据。5.2方案一的模型建立于求解为了保证预测结果的准确性,在进行时间序列预测之前,我们还需要对数据进行平稳性检验(ADF检验)。所谓平稳性检验,是指为了防止有时数据的高度相关仅仅是因为二者同时随时间有向上或向下的变动趋势,并没有真正联系。如果这样,数据中的趋势项,周期项等无法消除,从而在残差分析中无法准确进行分析.。在这道题中,我们对随着时间变化的交通流量进行了平稳性检验,首先我们使用的是平均差分法,检验结果如下表:6ADF检验的Mackinnon临界值分别为-3.464643,-2.876515,-2.574831,t检验统计量值-5.613230,prob值小于0.05,从而能拒绝,表明短期交通流量的差分序列存在单位根,是平稳序列。所以ADF检验,平稳,自相关拖尾,偏自相关截尾,选择AR模型7时间序列预测模型的分析与求解参数检验,去掉常数C我们在进行时间序列预测时,是直接使用的eviews软件,软件输出结果如下面模型检验:残差均在虚线内,即模型可行做预测:静态图,基本拟合8-200-1000100200300100125150175200225250275CHE1FF?2S.E.Forecast:CHE1FFActual:CHE1Forecastsample:1288Adjustedsample:98288Includedobservations:191RootMeanSquaredError35.45872MeanAbsoluteError28.00692MeanAbs.PercentError205.9829TheilInequalityCoefficient0.405720BiasProportion0.001334VarianceProportion0.163293CovarianceProportion0.835372-120-80-4004080120100125150175200225250275CHE1F?2S.E.Forecast:CHE1FActual:CHE1Forecastsample:1288Adjustedsample:98288Includedobservations:191RootMeanSquaredError50.79285MeanAbsoluteError37.56480MeanAbs.PercentError102.4475TheilInequalityCoefficient0.964219BiasProportion0.007655VarianceProportion0.929385CovarianceProportion0.062960时间扩展后的曲线图(expand1384),得到第四天中每个时间段的交通流量的预测值,依旧将它与其它第三天的数据一起,画出它的折线图,如下:90408012016020024028032050100150200250300350CHE25.3方案二的模型建立与求解BP网络是一种具有3层或3层以上的阶层型神经网络。它的特点是各层神经元之间无反馈连接,各层内神经元之间无任何连接,仅相邻层神经元之间有连接。典型BP网络是3层前馈网络,即输入层、隐层和输出层,各层之间实行全连接,见图1。BP网络的主要思想可概括为训练样本集和已知的输出样12(,,,)kPPPPk=…,为样本数本集。训练的目的是求网络的模拟输出,通过12kT(T,T,T)=…,12kAAAA=(,,…,)减少A与T之间的误差来修改模拟过程的权值,使网络模拟输出值与实际样本值之间的误差达到最小值。每一次的权值变化和偏差都与网络误差的变化成正比,并以反相传播的方式传递到每一层。BP网络法由信息的前向传递和误差的正相传播两部分组成[2]。由于BP网络神经的定义,在对未来时间进行预测前,系统将会先对已知数据进行预测,然后将真实数据与预测数据进行一个对比,并且给出在预测过程中的误差分布,观察这两个图,可以看到误差水平差不多都在0.1左右,较小在合理范围内。而真实值与预测值得差距也较小,所以认为模型的检验是通过了的,是可以继续进行预测的。10在BP算法中,我们采用了最速下降梯度法来修改权值,计算公式如下:△Wij(n+1)=h×Фi×Oj+a×△Wij(n)(n为样本数)其中为期望输出,为实际输出,为输出节点数,w(ij)为第ij次网络权值,a为学习率。在实际计算时,我们运用matlab编了一段程序,详见附件一。为了保证预测结果的准确性,我们并没有一次性的预测出所有的数据,而是采用滚动预测的方式,将先预测出来的结果带入到原始数据中,以此来预测接下来的数据,由于数据太多,这一次依旧用与前三天的交通流量的汇总数据来画折线图,用折线图来表示预测的结果,图如下:5.4方案三的模型建立与求解一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。首先建立的回归方程,我们必须要先判断作为自变量的因素与作为因变量的预测对象是否有关,检验相关程度如何,以及这种相关程度的把握性多大,在这里,我们用相关关系的大小来判断自变量和因变量的相关的程度。将自变量时间设为,因变量交通流量设为,在这里我们运用R系数来计算两者之间的相关性系数:表示时间与交通流量的平均数在SPASS软件中我们通过计算得到以下结果:11相关性时间交通流量时间Pearson相关性1.606**显著性(双侧).000N9696交通流量Pearson相关性.606**1显著性(双侧).000N9696**.在.01水平(双侧)上显著相关。由结果可以看出,交通流量和时间之间的相关性系数为0.606,在(0.5,0.8)的范围内,属于中度相关,可以进行回归分析。回归分析预测的检验回归预测模型是否可用于实际预测,取决于对回归预测模型的检验和对预测误差的计算。回归方程只有通过各种检验,且预测误
本文标题:数学建模竞赛论文格式模板
链接地址:https://www.777doc.com/doc-2331487 .html