您好,欢迎访问三七文档
2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1基于理化指标的葡萄酒评价分析模型摘要本文在利用主成分分析法提取出主成分理化指标后,结合偏最小二乘回归分析法建立了对葡萄和葡萄酒及其理化指标的相关分析和评价模型。对问题1,在对附件1表格中的酒样品序号按由小到大排序后,直接利用Excel中的函数命令,按每个评酒员对各项的打分进行求和,得到了每种酒样品的总评分。最后又对10名评酒员的各自总评分进行均值处理,得到了每种酒样品的平均得分和平均得分方差。从平均得分和平均得分方差的比较,不同葡萄酒平均得分的排序和图表三方面得出了两组结果均存在明显差异。后又通过方差和总体分布检验,结合图表得出的第二组结果更可信,并给出了红白葡萄酒的质量排序。在问题2中,首先将芳香物质视为葡萄的理化指标。再通过网上查询对一些重要的理化指标进行了预先排序,后对所有理化指标实施了主成分分析法,分别提取出了9种和10种主成分红白葡萄理化指标,累积贡献率均达到了85%,并给出了对红白葡萄的综合评价值及其排序,详见表7和表10。在问题3中,首先通过主成分分析法提取出了红白葡萄酒中的3种和4种主成分理化指标,与问题2中的红白葡萄主成分理化指标相互讨论,利用偏最小二乘回归分析法建立了两者之间联系关系式,并通过回归系数直方图和预测图进一步说明了建立的联系。下面是红葡萄与红葡萄酒理化指标的回归方程11238959033.790.0008850.6841622.73223270.0329324.9037yxxxxx212389119.8157.20.50.00868.1413218.0031335.71682yExxxxx3123898171.180.002580.559689156.1669104.1228437.9684yxxxxx在问题4中,还是利用主成分分析法把得出的红白葡萄和葡萄酒的主成分理化指标,与可信度强的第二组红白葡萄酒的质量平均得分,视为自变量和因变量,通过偏最小二乘回归分析法,建立了两者之间的影响关系式,并结合回归系数直方图和预测图得出能够用葡萄和葡萄酒的理化指标来评价葡萄酒质量的结论。关键词:方差总体分布检验主成分分析法偏最小二乘回归分析法21问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?2问题的分析2.1问题1对于第一问:要讨论两组评酒员评价结果的差异性,先对附件1中4个表格里的样酒按序号进行了由小到大的重新排序,因为它们排序都是打乱的,不方便实现差异性分析。其次,根据每个评酒员在打分后,求和得其总分来确定葡萄酒的质量得分。而葡萄酒在澄清度、色调等10个指标方面的总分又是一致的,在此直接利用Excel中函数命令按每个评酒员对各项的打分进行求和,得到了每种样酒的总评分。最后又对10名评酒员的各自总评分进行均值处理,得到了每种样酒的平均得分。由此还可求出10名评酒员各自总评分的方差,通过对平均得分和平均分方差的比较、排序,结合图表可对差异性实现分析。对于第二问:两组评酒员评价结果的可信度分析。利用第一问得出的平均得分和平均得分方差,通过数据比较之后,会有一组平均得分的方差要大,说明它的偏离程度就大,可信度就降低。为进一步对偏离程度进行分析,可对27种红葡萄酒和28种白葡萄酒的每名评酒员得分进行总体分布检验。因为它们的酒质量是未知的,方差也是未知的,属于非参数检验。故可直接利用Matlab工具箱中的normfit命令进行非参数检验的总体分布检验,来确定哪一组评价结果偏离程度大,实现可信度分析。2.2问题2首先我们也将芳香物质视为葡萄的理化理化指标。因为它是构成葡萄与葡萄酒质量的主要因素,决定着葡萄酒的风味和典型性。题目要求根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。可考虑先从网上查询酿酒葡萄中的理化指标对葡萄酒的作用及影响,粗略了解一下各项指标在葡萄酒中的所占的比重,把比重明显靠前的放到前面,不重要靠后,主观的对所有理化指标进行排序。然后,根据所有理化指标的排序,通过编程,利用主成分分析法提取出贡献率大的n个理化指标,使其累积贡献率达到85%以上,之后就用这n个作为主成分进行分析。最终能得出红白葡萄综合评价值及其排序结果,来实现分级(在讨论白葡萄时,去掉花色苷理化指标,因白葡萄酒中不含有花色苷)。在运用主成分分析法前,得先对附件3中的葡萄酒样品进行重新排序,还可能得对一些理化指标的单位进行统一换算处理。2.3问题3由题意知,可用偏最小二乘回归分析法分析酿酒葡萄与葡萄酒的理化指标之间的联3系。但由附件2知道,酿酒葡萄的理化指标含有28种,红白葡萄的理化指标各为7种和6种。可见要全部讨论两者理化指标之间的联系,数据处理较大,过程可能也会较复杂。又由问题2知,能通过主成分分析法提取出红白葡萄理化指标中的几个主成分,且其累积贡献率在85%以上,若用这几个主成分理化指标来代替红白葡萄的全部理化指标进行分析,在指标的个数上大大减少,并且主要信息却基本没丢,故方法是可行的。所以我们首先也要通过主成分分析法对红白葡萄酒的理化指标进行分析,提取出累积贡献率达到85%以上的几个理化指标,用来代替全部指标。然后用这两部分主成分理化指标,利用偏最小二乘回归分析法可实现对酿酒葡萄与葡萄酒的理化指标之间的联系分析。2.4问题4第一问:从2.3可知,完全可用由主成分分析法提取出来的主成分理化指标来代替全部理化指标进行分析,故本问还用那些主成分理化指标来分析对葡萄酒质量的产生的影响。对红白葡萄酒质量的衡量,在此我们选取第一问中可信度较强的那一组结果。这样因变量确定了,自变量为葡萄和葡萄酒的主成分理化指标,故还可用偏最小二乘回归分析法实现对葡萄酒质量的影响分析,同时还给出了两都之间的一个关系式。第二问:利用第一问中给出的葡萄和葡萄酒的主成分理化指标对葡萄酒质量的影响关系式,结合回归系数直方图和预测图,完全可判断出能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。3模型假设1.每个评酒员在对葡萄酒进行品尝后的分类打分都是客观的;2.在第一组白葡萄酒的品尝评分中,评酒员7和9分别对酒样3和8中口感分析的持久性(总分8)给出了77和16的错误打分,我们视为打印错误,根据均值改为7和6;3.在评酒员评分过程中,设葡萄酒在外观、香气、口感和平衡/整体评价四方面共10个指标的总分是一致的;4.芳香物质是构成葡萄与葡萄酒质量的主要因素,决定着葡萄酒的风味和典型性,故将葡萄和葡萄酒的芳香物质视为酿酒葡萄和葡萄酒的理化指标。5.设附件3葡萄和葡萄酒芳香物质的各项成分所给数据的单位均为mmol/L;6.设附件2中理化指标的顺序是随机排列的,可以对其打乱重排;7.设附件2中的理化指标之间不存在可完全替代的两种理化指标,基本彼此线性无关。4模型的建立与求解4.1两组评酒员评价结果的有无显著性差异分析和可信度分析首先,在附件1(葡萄酒品尝评分表)中,我们发现4个表格里的酒样排序都是打乱的,没有固定的次序,无法很好的实现差异性分析,故对酒样进行了序号由小到大的重新排序。其次,考虑到是根据每个评酒员在打分后,求和得其总分来确定葡萄酒的质量得分的。又葡萄酒在澄清度、色调等10个指标方面的总分是一致的,故没有必要再用各项的打分与总分的比值来进行计算。在此,我们直接利用Excel中函数命令按每个评酒员对各项的打分进行求和,得到了每种样酒的总评分。后又对10名评酒员的各自总评分进行均值处理,得到了每种样酒的平均得分。最后,为了差异性的讨论又对10名评酒员的各自总评分求出了方差,同时对各项指标也进行了均值和方差处理,详见附件1(葡萄酒品尝评分表)中的4个表。4.1.1两组评酒员对红葡萄酒评价结果的有无显著性差异分析4下面是两组评酒员对27种红葡萄酒样品的平均得分和平均分方差及它们的差(第一组减第二组)情况:红葡萄酒样品第一组第二组两组平均分之差两组平均分的方差之差平均得分平均分方差平均得分平均分方差162.792.9068.181.88-5.411.02280.339.797416.226.323.57380.445.8274.630.715.815.11468.6108.0471.241.29-2.666.76573.362.0172.113.661.248.36672.259.7366.321.125.938.61771.5103.6165.362.686.240.93872.344.016665.116.3-21.10981.532.9478.225.733.37.211074.230.4068.836.185.4-5.781170.170.7761.638.048.532.721253.979.6668.325.12-14.454.531374.644.9368.815.295.829.64147336.0072.623.160.412.841558.785.5765.741.34-744.221674.918.1069.920.105-2.001779.388.0174.59.174.878.841859.947.2165.450.27-5.5-3.061978.647.3872.655.166-7.782078.626.0475.839.072.8-13.022177.1116.1072.235.514.980.592277.250.6271.624.275.626.362385.632.4977.124.778.57.72247874.8971.510.726.564.172569.264.6268.243.73120.892673.831.297241.561.8-10.27277349.7871.520.501.529.28表1两组评酒员对红葡萄酒样品的平均得分和平均分方差及平均分之差和平均分方差之差表从表1的两组平均分之差列可以看出,只有5个是负值,并且还有13个数值都大于5,说明第一组评酒员的平均得分基本都要比第二组的平均得分要高,最多高出8.5分。第一组平均得分列的平均分73.06,比第二组的70.51也高出2.55分。最后的一列两组平均分方差之差中,也只有7个是负值,大部分方差之差都要高出20,显然第一组的平均得分偏离均值的程度要大。它们的平均分方差的平均分差为58.62-33.79=24.83。为了更好说明两组评酒员在红葡萄酒样品中的差异,通过程序(附录1:ti1tu1.m),作出了两组评酒员的平均得分图,红圆代表第一组得分,蓝星代表第二组得分,见图1。5051015202530505560657075808590红葡萄酒样品每种样品的平均得分图1两组评酒员对红葡萄酒的平均得分图4.1.2两组评酒员对白葡萄酒评价结果的有无显著性差异分析下面是两组评酒员对28种白葡萄酒样品的平均得分和平均分方差及它们的差(第一组减第二组)情况:白葡萄酒样品第一组第二组两组的平均分之差两组平均分的方差之差平均得分平均分方差平均得分平均分方差18292.2277.925.884.166.34274.2201.
本文标题:葡萄酒研究
链接地址:https://www.777doc.com/doc-373238 .html