您好,欢迎访问三七文档
2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):所属学校(请填写完整的全名):参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):日期:2012年9月10日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):A题葡萄酒的评价摘要针对葡萄酒的评价问题,本文利用统计学的众多分析方法,建立模型。在第一个问题中,通过正态检验,得出数据基本符合正态分布,采用T检验分析,得出两组评酒员的评价结果存在显著差异。而后,本文利用归一化算法及误差分析,得到第二组评酒员的业务水平较高,所得评价结果较可信。在第二个问题中,首先,通过将第一组评酒员与第二组评酒员对酒样品的评价结果进行整合,再利用归一化计算的方法,得出葡萄酒质量分数,同样,利用问题一中T检验去除部分不规范数据后,得出的葡萄酒的质量分数,再对这两种方法得出质量分数依据稳定性原理进行加权评分,最后依据星级量化评价表,对其进行星级评价。然后,对附件一中的数据,利用spss软件进行相关性分析及主成分分析,得出酿酒葡萄的理化指标间的关系,再利用比较加权的方法计算出酿酒葡萄理化指标的分数,对其进行星级分级。最后,将酿酒葡萄和葡萄酒质量得出的星级相加,得出各葡萄样品的星级指标。在第三个问题中,从各个理化指标入手,考虑到酿酒过程中会发生物理化学反应,使用“Pearson线性相关分析”和应用SPSS统计学软件中的双变量相关分析酿酒葡萄和葡萄酒的理化指标之间的相关性,得出了不同物质有不同的的相关性。在第四问中,本文使用多元函数矩阵求解法求解了多达27个变量的函数系数,最终得到了酿酒葡萄和葡萄酒的理化指标对葡萄酒的质量有影响,并且论证了葡萄和葡萄酒的理化指标在一定程度上可以用来评价葡萄酒的质量,本文又发现,如果加入附件三中的芳香物质指标,则可以更准确地反映葡萄酒的质量。关键词:归一化算法因子分析法pearson相关系数单变量T检验多元函数回归1一、问题重述1.1.背景资料与条件确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。1.2.需要解决的问题1.2.1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?1.2.2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。1.2.3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。1.2.4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析2.1.问题的重要性分析食品行业惯用的感官品评方法,受人员的嗜好、习惯、情绪、年龄、经验等因素的影响较大,评定常有一定程度的主观性和不确定性,容易引起打分不一致和数据分析产生偏差,使品评结果不够准确,缺乏客观的评价,误差较大。因此,品评人员是决定最终品评结果的关键因素。PdrezElortondoFJ针对品评人员研制了一套行之有效的感官品评方法;国内外研究者还不断尝试将先进的数据处理方法与感官品评相结合,感官品评的客观l生得到很大改善。2.2.问题的思路分析你对问题的理解。包括实际问题的数学化、问题的归类、建立模型的原因、模型求解的可行性预测,求解结果的实用性预测等。三、基本假设1)假设葡萄在加工过程中的工艺相同,不存在多种加工工艺;2)假设所有品酒员都有足够的职业水平,不存在业余品酒员;3)假设假设题目所给的数据真实可靠;4)假设每组品酒员品的酒样是同一种葡萄酒;5)假设一位评酒员给出一个样品的总分为他对该样品所有方面评分的总和,该样品的最终得分为10位评酒员打分的均值。6)假设本文引用数据、资料均真实可靠。四、符号说明符号说明t样本平均数与总体平均数的离差统计量X样本平均数总体平均数x样本标准差n样本容量2A颜色AB颜色BH颜色HC颜色CL颜色Ln酒样品件数m评酒员人数i第i号评酒员j第j号作品ijp第i号评酒员对j号酒样品打分jp第j号作品平均分iq第i号评酒员对这批酒的平均打分k标准打分区间'jip归一化后第i号评酒员对j号酒样品打分w归一化系数jC认同度S认同度标准差S红a第a组红葡萄酒认同度标准差aS白第a组白葡萄酒认同度标准差五、数据的预处理5.1.附件一的数据处理5.1.1.附件一数据的常规化处理5.1.1.1.附件一中错误数据的处理经过数据的预处理和挖掘后,本文发现,在附加一中发现两处错误,分别为:1)附件一“第一组红葡萄酒品尝评分”工作簿“酒样品20”品酒员4号的外观分析中色调一栏数据缺失(见附录12.1.1),因为品酒员在品评葡萄酒打分的过程属于完全随机缺失(MCAR),所以可以使用均值填充法处理缺失数据,此处填充数据为6.2分。2)附件一“第一组白葡萄酒品尝评分”工作簿“酒样品3”品酒员7号的口感分析中持久性一栏数据错误(见附录12.1.2),在此处,同样使用均值修正法处理错误数据,在此处填充数据为6.1分。5.1.1.2.本文对附件一中的数据进行了求和、均值、方差、标准差的常规化处理。5.1.2.附件一数据的正态性检验5.1.2.1.数据正态性检验的理论依据根据变量的累计概率对应于所指定的理论分布累积概率绘制的散点图,可以直观的检测样本数据是否与正态分布的统计图形一致,数据若呈正态分布,则P-P图中数据点应和理论直线(呈45°的对角线)基本重合。5.1.2.2.数据的正态性检验针对附件一中的数据,本文使用通过SPSS统计学软件对附件一中第一组红葡萄酒品尝评分、第一组白葡萄酒品尝评分、第二组红葡萄酒品尝评分和第二组白葡萄酒品尝评分四个工作簿中共计1100组数据进行了数据的正态性检验(参见附录12.1.3)。5.1.3.附件一数据的单样本T检验5.1.3.1.数据单样本T检验的理论依据3单样本t检验时检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布,单样本t检验统计量为:1xXtn5.1.3.2.数据的单样本T检验本文通过SPSS统计学软件对红葡萄酒的两组一起检验,得到了每组品酒员对每一种样品酒总评分的95%的置信区间的上限和下限(见附录12.1.4)5.1.4.附件一数据的归一化处理5.1.4.1.数据归一化处理的理论依据因为品酒员在品酒的过程中,可能因为身体健康状况和精神状态、心理因素、品酒能力及经验因素、品酒环境因素等的影响,会或多或少的加入主观因素,而归一化的过程可以去除主观因素,使得酒样品的最终得分更客观,更真实的反映葡萄酒的质量。5.1.4.2.数据归一化处理的两种方案1)数据的归一化处理采用归一化算法计算。2)数据的归一化处理采用上文提到的单样本T检验得到的95%的置信区间计算,即去除不在置信区间内的品酒员分数,剩余分数求其方差,取方差小的一组为标准分数。5.1.4.3.数据的归一化处理因为上述两种归一化处理方法各有利弊,因此根据两种方法不同的标准差,计算各自的权重,将两种方法加权处理,得到更为真实准确的得分。(最终得分结果见附录12.1.5)5.2.附件二的数据处理5.2.1附件二数据的常规化处理5.2.1.1.附件二中错误数据的处理经过求和发现,在附件二酿酒葡萄工作簿中氨基酸总量(一级指标)并不等于17种二级氨基酸指标之和,分析后默认为二级指标并非列出了所有的氨基酸种类。5.2.1.2.本文对附件二中的数据进行了常规的错误数据方差检测和均值的计算。六、模型的建立与求解6.1.模型一的建立6.1.1.模型一概述对附件一中的数据进行正态性检验后,得出附件一中的数据符合正态分布,从而采用单样本T检验来分析两组评酒员的评价结果有无显著性差异。若T检验结果中,样品酒的95%的置信区间中不包含原点,则表明其具有显著性差异。由于评酒员在评酒水平,参照体系等方面有一定的差异性,决定了他们对评分标准的认识和尺度掌握存在差异,对同一批酒样品,评分宽松的评委所打的分数相对较高,而较为苛刻的评委的评委打分较低,即把同样的分数映射到不同评委的价值坐标系中所反映的水平并不相同,甚至相差很远。因此,直接对评委的主观评分进行平均,会引起一定的误差。为了提高评分的准确性,采用优化理论,利用归一化算法消除因价值坐标系不一致对评分的影响,最终得到一个建立在归一化体系下的,消除了部分主观误差的评分排名。利用欧式距离,可以得到各评酒员对各个酒样品的认同度,通过对认同度标准差检验,即可得出在两组评酒员中,可信的一组。46.1.2.模型一的运用与求解6.1.2.1运用根据5.1.2.2中的正态检验结果,以及5.1.3.2中T检验结果可知,两组评酒员的评价结果有显著性差异。于是,利用归一化处理数据,得出可信的评酒员租。首先,假设共有酒样品n件,评酒员m人,作品满分为s分,i号评酒员为j号酒样品的打分为ijp。直接求平均法,求j号作品的得分jp:=1=mijijppmi号评委对这批酒样品的的平均打分iq:=1=mjijipqn取标准打分区间k,12n12n=1=1min,,...,+max,,...,2mmiiiiiiiippppppm 将i号评委对j号作品的评分jip变换'jip,'=jijikppqi归一化系数w,=ikwq归一化后平均法,求j号作品的得分''=1=mjiijppm对'1p,'2p,„„'np进行排序,即可初步确定酒样品排名。认同度jC,2''=1=-mjjijiCpp认同度标准差j=1S=njC6.1.2.1求解利用excel软件对数据进行处理后得第一组红酒样品号归一化后平均得分认同度第二组红酒样品号归一化后平均得分认同度2380.378135.3861975.684323.021915976.586356.2347932374.718684.962242375.491136.2147652073.301683.508501275.310824.6307651772.256524.26607551774.295626.996175372.204334.0170321973.698215.10989271.677863.2032182073.668912.1576151470.250722.5596692473.113226.6257331970.140444.3035632272.364734.982836569.985365.4793462172.297868.900362169.910174.8785161670.319253.966832669.697515.0539891369.889424.3480852469
本文标题:2012年高教社杯全国大学生数学建模竞赛A题葡萄酒的评价(省级二等奖获奖论文-含源程序)
链接地址:https://www.777doc.com/doc-5646025 .html