您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 宣传企划 > 2012年全国大学生数学建模优秀论文A题
2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):S55001所属学校(请填写完整的全名):郑州科技学院参赛队员(打印并签名):1.刘超2.赵芬芳3.尹峰指导教师或指导教师组负责人(打印并签名):闫天增日期:2012年9月10日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1葡萄酒的评价摘要确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。本文通过对27种红葡萄酒和28种白葡萄的理化指标数据进行分析,采用显著性差异分析法、可靠度分析、因子分析法、相关系数分析、主成分分析法以及聚类分析法,借助统计软件SPSS和数学软件MATLAB,分析了两组评酒员的评价结果有无显著性差异和可信度,给出了酿酒葡萄与葡萄酒的理化指标之间的联系,建立了基于酿酒葡萄理化指标和葡萄酒质量的聚类分析模型确定了葡萄酒质量的影响因素,最后通过补充相关信息,建立基于分析模型确定了葡萄酒质量的影响因素。针对问题一,首先对所有样品的10位评酒员打分的加权平均值进行显著性差异检验,显著性水平取为0.05,通过两组评酒员分别对红葡萄酒和白葡萄酒的显著性检验得出两组评酒员的评价结果有明显差异,最后运用可靠性分析,得到两组评酒员的评价结果的可靠度,结果表明第二组评酒员的评价结果更加可信。针对问题二,以第二组评酒员的评价结果作为相应葡萄酒样品的质量指标,根据酿酒葡萄理化指标对比葡萄酒的质量利用SPSS软件进行聚类分析,得到酿酒葡萄的聚类树状图,从而将酿酒葡萄分成5个等级。针对问题三,对葡萄酒的理化指标进行主成分分析,得到葡萄酒的主要成分,然后将每一个主成分与酿酒葡萄的理化指标进行多元回归分析,根据SPSS软件运行结果得出主成分与酿酒葡萄的理化指标的相关性。针对问题四,利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素,将附件3中4个表格里的每张样品中所含各种芳香物质求和作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析,比较前后两者结果中由样品中的芳香指标导致的影响差异来确定不能只用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,还需要结合感官指标,感官指标是评价葡萄酒质量的最终及最有效的指标。关键词:理化指标主成分分析法可信度分析显著差异聚类分析芳香物质2一、问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并且能否葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析(1)因为两组评酒师对同一样品评价的两个数据之间的差异可看成仅仅是由人的因素引起的,这样各组中两个数据来比较就能排除种种其他因素,而4组数据的分布都近似为正态分布,从而够利用SPSS软件来测出这两组评酒师的评价结果是否有显著性差异。运用先求加权平均值再求平均值的方法得到最终结果,再利用SPSS软件求得适用于态度、评价的信度分析的Cronbach’sα系数,来判断哪组可靠性更好(2)本问题先应用主成分分析法,建立主成分分析的数学模型,利用MATLAB处理数据最终得到相关系数矩阵的特征值、贡献率以及累计贡献率(至少包含原来指标85%以上的综合指标),判断两种葡萄酒的各自的几种主要成分,再利用主成分与变量的相关性强度分析出主成分的次序,然后应用聚类分析法,利用MATLAB创建出系统类聚树,这样就可以从图中看出样品酿酒葡萄的等级(3)问题三,首先通过附表二中的葡萄酒的主成分y与酿酒葡萄中的成分进行线性回归分析,得到系数矩阵R,接着运用综合分析得到它们的潜在关系,由红葡萄样品的各项主成分对红葡萄酒样品成分的线性关系,可得到成分x12,x23,即是总酚和干物质的量对葡萄酒有较大的影响,而对于白葡萄酒,也可进行上述的分析流程,首先得到4组相关矩阵y1,y2,y3,y4(见附表),故葡萄酒的酿酒葡萄与葡萄酒的理化指标之间的量化关系可通过上述表示.然后,进行对样本典型变量的上述分析,得到白葡萄各理化指标对白葡萄酒各理化指标间的影响程度.(4)利用因子分析分别给出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响因素,将附件3中4个表格里的每张样品中所含各种芳香物质求和作为样品中的芳香指标与葡萄酒的理化指标一并进行因子分析,比较前后两者结果中由样品中的芳香指标导致的影响差异来确定不能只用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量还需要结合感官指标,感官指标是评价葡萄酒质量的最终及最有效的指标。三、模型假设1.假设若评酒员对各个指标的评价数据中有可能出现错误的数据,将此数据换成0.32.因为对这四种样品评价数据中,大部分的数据都接近各自的平均数,不会太高也不会是太低,所以四种样品的各自数据都可以看作是来自正态或近似正态总体3.假设问题一中评酒师的评价结果的误差仅与人的因素有关4假设酿酒葡萄以及葡萄酒中的理化指标中的蓝色二级指标对酿酒葡萄的分级和葡萄酒质量影响不大5酿酒方式和酿酒过程对葡萄酒的质量无影响四、符号说明1.0H∶t检验的原假设2.1H∶t检验的择备假设3.1X,2X:分别为两样本平均数;4.12X,22X:分别为两样本方差;5.为相关样本的相关系数。6.n:t检验中的自由度7.F:酿酒葡萄的理化指标的主成分8.:检验水平,值为0.059.K:为酒样的总数10.2i:为第i种酒样品得分的方差11.2T:为全酒样总得分的方差。12::为随机误差项。13.Xki:葡萄的理化指标变量14.Βk:未知参数15.:解释变量估计值16.:实际观测值17.:变量18.:残差五、模型的建立与求解5.1问题一模型的建立和求解5.1.1.评价结果的显著性差异分析(1)应用原理:配对t检验,它适用于配对设计的计量资料,在相同的条件下作对比试验,得到一批成对观察值,然后分析观察数据作出推断,或者是检验两个样本平均数与其各自所代表的总体的差异是否显著。配对t检验又分为两种情况,一是相关样本平均数差异的显著性检验,用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性,这两种情况组成的样本即为相关样本。二是独立样本平均数的显著性检验。各实验处理组之间毫无相关存在,即为独立样本。该检验用于检验两组非相关样本被试所获得的数据的差异性]1[。配对设计资料具有一一对应的特点,研究者关心的变量是对子的效应差值,而不是各自的效应值。如果两处理因素的效应无差别,理论上差值d的均数应为0,因此,可将该检验理解为样本均数所对应的总体μd与总体均数0的比较。其应用条件是差值d变量服从正态分布。t检验步骤如下:建立原假设0H∶1=2择备假设1H∶1≠2相关样本的t检验公式为:41212122221XXXXXXtn。在这里,1X,2X分别为两样本平均数;12X,22X分别为两样本方差;为相关样本的相关系数。根据自由度n,查t值表求t的拒绝域。若实际计算出来的结果不在拒绝域内,则接受,测量结果无显著性差异,反之,则有显著性差异。(2)从应用原理看本题中比较符合第一种情况,又因为本问题的数据是成对的,是两组分别对相同的样品测出的数据,我们看到同一对两个数据之间的差异可看成仅仅是由人的因素引起的,这样局限于各对中两个数据来比较就能排除种种其他因素,从而能比较这两组数据中的各自的测量结果是否有显著性差异。(3)应用先求和后平均的算法作出对各个样品的总的指标,如图表1,按照表1中的数据应用SPSS软件进行t检验(检验水平=0.05)。表1:样品平均值一红二红一白二白样品162.768.18277.9样品280.37474.275.8样品380.474.685.375.6样品468.671.279.476.9样品573.372.17181.5样品672.266.368.475.5样品771.565.377.574.2样品872.36671.472.3样品981.578.272.980.4样品1074.268.874.379.8样品1170.161.672.371.4样品1253.968.363.372.4样品1374.668.865.973.9样品147372.67277.1样品1558.765.772.478.4样品1674.969.97467.3样品1779.374.578.880.3样品1859.965.473.176.7样品1978.672.672.276.4样品2078.675.877.876.6样品2177.172.276.479.2样品2277.271.67179.4样品2385.677.175.977.4样品247871.573.376.1样品2569.268.277.179.5样品2673.87281.374.3样品277371.564.877软件应用的过程为:打开SPSS软件,选择“分析栏”下的“比较均值”一栏得出运5行结果:tnSig.(双侧)对1一红-二红2.39026.024对2一白-二白-2.12726.043结论分析:本题中的自由度n=27-1=26,0555.2)26(2t,即知拒绝域为0555.2t,由上表可知两组评酒师对红、白葡萄酒的评价结果的检验值0555.2390.21t,0555.2127.22t,因为两个检验值均在拒绝域,所以两组评酒师的评价结果有显著性差异5.1.2.评价结果的可信度分析模型准备;信度主要分为四大类:重测信度(Test-retestReliability)、复本信度(Alternate-formReliability)、内部一致性信度(InternalConsistencyReliability)、评分者信度(ScorerReliability)。本文采用Cronbach’s信度系数内部一致性信度检验,Cronbach’s系数是Cronbach于1951年创立的,用于评价问卷的内部一致性。系数取值在0到1之间,系数越高,信度越高,评价的内部一致性越好。Cronbach’s系数不仅适用于两级记分的问卷,还适用于多级计分的问卷。Cronbach信度系数是目前最常用的信度系数]2[,其计算公式为:21211TkiiKK其中,K为酒样的总数,2i为第i种酒样品得分的方差,2T为全酒样总得分的方差。从公式中可以看出,系数评价的是评酒师各酒样得分间的一致性,属于内在一致性x信度系数。这种方法适用于态度、评价的
本文标题:2012年全国大学生数学建模优秀论文A题
链接地址:https://www.777doc.com/doc-6434723 .html