您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 葡萄酒质量评价的多元统计分析模型
2012高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):A我们的参赛报名号为(如果赛区设置报名号的话):13224010所属学校(请填写完整的全名):湖北科技学院参赛队员(打印并签名):1.黄磊2.李晓香3.刘勇为指导教师或指导教师组负责人(打印并签名):钟绍军周志明日期:2012年9月10日赛区评阅编号(由赛区组委会评阅前进行编号):2012高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):1葡萄酒质量评价的多元统计分析模型摘要葡萄酒质量评价通常是根据评酒师的感官指标得分进行评价的,这种方法有很强的主观性,很难得到一个较为可信的结论。通过对酿酒葡萄和葡萄酒的理化指标进行检测并据此进行葡萄酒质量的评价,已经逐步被社会所采纳。本文针对给定的酿酒葡萄和葡萄酒的理化指标,综合应用统计分析的基本方法研究了理化指标之间的因果关系,得出了通过理化指标进行葡萄酒质量鉴定的一般方法。问题一,评酒员给出的分数主要受到葡萄的品种、样本个体差异、不同组别、不同评酒员等因素的影响。我们分别用每个评酒员对外观、香气、口感、整体评价和总分五个指标对上面四个主要因素进行方差分析,找出评酒分数差异的主要来源,从而可以判断两组评酒员之间是否有显著性差异。结果显示两组评酒员在总分上没有显著性差异,但四个分指标均有显著性差异。通过对数据稳定性和灵敏性两个方面对两组评酒员的评分进行分析可知:两组间不存在系统偏差,但第二组的方差波动较小,因此更加可信。问题二,酿酒葡萄质量的优劣可以从葡萄酒的品质中得到体现。由于所涉及变量较多,本文分别对酿酒葡萄的理化指标和芳香物质采用因子分析法,选取主要因子,结合评酒员的质量得分,应用聚类分析法对葡萄样品进行聚类。我们将红葡萄分成了四级、白葡萄分成了三级,同时给出了根据葡萄酒的得分进行分级的标准,具有很强的可操作性。问题三,酿酒葡萄与葡萄酒的理化指标之间的联系属于多个变量与多个变量之间的关系问题。由于它们之间存在明显的因果关系,因此首先应用多元线性回归模型研究了葡萄酒的每一个理化指标对葡萄的理化指标的依赖关系,找到了显著影响的因素。针对变量间存在的复杂的相关关系和因果关系的问题,本文重点采用典型相关分析模型,找出了两组理化指标之间的典型相关变量。本文先将红、白葡萄样品分开,分别进行典型相关分析,然后又将它们综合为一个大样本进行分析。结果显示,两组理化指标相关程度很高,并且找到了最相关的理化指标组合。问题四,酿酒葡萄和葡萄酒的理化指标都对葡萄酒的质量有直接的影响,而且酿酒葡萄和葡萄酒的理化指标之间还存在因果关系。本文分别对红葡萄、白葡萄和总葡萄样本数据建立了通径分析模型,找到了对葡萄酒质量有重要影响的各级理化指标,并计算了它们对葡萄酒质量的直接影响、间接影响和总影响程度。同时,本文结合主成分回归法还得到了葡萄酒的质量关于这些重要影响理化指标的回归方程,并对葡萄酒样品的质量进行了预测。通过误差分析显示,我们的预测标准误差平均不超过3分,平均相对误差控制在0.27%以内,拟合效果较好。说明本文的方法可以根据葡萄和葡萄酒的理化指标来评价葡萄酒的质量,且效果良好。本文综合应用了因子分析、主成分回归和典型相关分析研究了多组变量之间的各组关系,对揭示数据背后的本质因果关系规律有较强的实用性。通过建立通径分析模型,很好的解决了多个变量间存在的相互影响和制约的依赖关系,通过较少的几个主要理化指标变量可以很好的预测酒的质量,具有一定的创新性和实践指导意义。关键词:葡萄酒质量评价;典型相关;通径分析;因子分析.21前言葡萄酒作为一款由新鲜葡萄或葡萄汁经发酵酿成的酒精饮料已走入越来越多的家庭中,同时人们对于葡萄酒的质量、鉴赏、评价也提出越来越严格的标准。现今在确定葡萄酒质量时,通常是通过聘请一批有资质的评酒员对葡萄酒进行品尝后,对其各分类指标打分,所得总分的高低直接决定该葡萄酒的质量。已知酿酒葡萄的好坏与所酿葡萄酒的质量有直接关系,葡萄酒和酿酒葡萄检测的理化指标也会在一定程度上反映葡萄酒和葡萄的质量。2问题重述已知某年份两组评酒员对同一批红葡萄酒和白葡萄酒的感官评价结果,测定了这批葡萄酒和酿酒葡萄的各自成分数据,现尝试建立数学模型拟解决以下问题:1、两组评酒员的评价结果有无显著性差异,分析哪一组更加可信;2、根据酿酒葡萄的理化指标和葡萄酒的质量,对样本葡萄进行分级;3、分析酿酒葡萄与葡萄酒的理化指标之间的联系;4、分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并讨论能否用葡萄和葡萄酒的理化指标来评价葡萄酒质量。3模型假设1、每一位评酒员都根据自己的经验和标准进行独立的判断,即每一位评酒员对于葡萄酒的评判不受其他评酒员的影响;2、所给样本的酿酒工艺是一样的,即葡萄酒的每个样本的品质不受酿酒工艺的影响;3、给出的样本数据具有同一性,即第i个葡萄酒样品是由第i个酿酒葡萄样本酿制而成,并且理化指标和芳香物质的测定也是针对同一样本来源,两组评酒师都是对相同的样本进行评价;4、忽略所在检测地点地理环境、自然环境等对于所检测数据的影响。4符号说明:对葡萄酒评判时基础得分;ia:为不同的评酒师团队的效应,第一组记为1,第二组记为2,1,2i;jb:表示第j个酒的样本,红酒分别为1-27,白酒为28-55,1,2,,55j;kc:表示第k个评酒师,第一组为1-10,第二组为11-20,1,2,,20k;ijklX:表示第i组的第k个评酒师对第j个葡萄酒的样本的评分;3is:表示葡萄酒的理化指标旋转后的主因子;if:表示酿酒葡萄的理化指标旋转后的主因子;q:表示通径系数。5问题分析葡萄酒通常分为红葡萄酒和白葡萄酒两个品种,评酒员一般根据外观分析、香气分析、口感分析、整体评价四个感官指标来评价葡萄酒的质量。一般来说,葡萄酒含有花色苷、单宁、总酚等理化指标,酿酒葡萄中含有氨基酸、蛋白质、VC含量等理化指标,各葡萄及葡萄酒的芳香物质也均对葡萄酒的评价有影响。因此,对葡萄酒评价方案的的研究对推进葡萄酒的鉴赏、收藏,提高人们生活质量有深远的影响。在酿酒的过程中,酿酒葡萄的化学芳香物质、理化指标等决定或影响着葡萄酒的各项理化指标和芳香物质,从而决定着葡萄酒的品质。题目要求我们根据给定的27个红葡萄样品和28个白葡萄样品及其酿酒的理化指标、芳香物质等数据资料,分析这些变量之间的关系,找出决定葡萄酒品质的主要因素。下面我们首先对题目给出的四个问题及其求解思路进行简要的分析:1、问题一要求判断两组评酒员的评价结果是否有显著性差异,显然是一个假设检验的问题。由于评酒员给出的分数主要受到葡萄的品种、样本个体差异、不同组别、不同评酒员等因素的影响,我们可以用每个评酒员的总分对这四个主要因素进行方差分析,就可以找出评酒分数差异的来源,从而可以判断两组间是否有显著性差异。当然,我们还可以从外观、香气、口感和整体评价这四个感官指标的角度考虑,看各分指标在两组间是否有差异。对于可信性的分析,一般来说要从数据的稳定性和灵敏性两个方面进行求解。没有系统偏差的肯定比有系统偏差的更可信,同等条件下随机误差小的更加可信。本文将从这两个方面进行综合分析。2、问题二要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级。由于葡萄酒的种类和品质很多,不同国家和地区对它们的分级和分类的方法也有很大差异,很难找到一个统一的标准进行分类[1]。针对题目给出的数据,我们认为,在相同的生产条件下,葡萄酒的质量应该主要由酿酒葡萄的品质决定。糖、酸、单宁、色素和芳香物质是构成酿葡萄品质优劣的要素[5]。水和糖是葡萄的最主要成分,这是葡萄能在酵母作用下发酵成葡萄酒的物质基础。葡萄中酸的含量对葡萄酒的影响也很大。单宁和色素对红葡萄酒的特色和风味作用也是显著的。尽管单宁、色素和芳香物质在整个葡萄的物质构成中所占比例非常的小,但它们对葡萄酒的特色和风味有着非常显著的贡献。因此,对葡萄的分级就需要从葡萄的理化指标、葡萄的芳香物质入手,结合它们酿成的酒的质量(可以用评酒员的评分来表示),应用因子分析的方法来进行综合评价。由于红葡萄和白葡萄的成分和评价标准的差异,我们需要对它们分别进行计算和处理。本文分别对葡萄的理化指标、葡萄的芳香物质做因子分析,找到显著的主要因子,并根据方差贡献率得出各自的综合因子,结合葡萄酒质量的四个分指标进行聚类分析,从而完成分级。从后面的模型求解过程可以看出,得出的分级结果与评酒员给出的平均分的高低是一致的,说明这一方法是可行的。3.问题三要求分析酿酒葡萄与葡萄酒的理化指标之间的联系。从理论上来说,葡萄酒的理化指标是有酿酒葡萄来决定的,现在的任务就是从给出的数据中来找出这种决定4关系,分析它们之间联系的具体形式。通过观察我们发现,葡萄酒的理化指标都可以在酿酒葡萄中找到相同或相似的变量。由于这两组变量之间存在一定的因果关系,一个最简单的办法就是建立多元线性回归模型,其中自变量和因变量都是多元的。但是这个模型的计算规模是庞大的,并且变量过多,无法求解出未知参数的估计。本文采用典型相关分析来解决这个问题,找出这两组变量的典型相关变量,从而说明它们之间的内部联系。本文先将红、白葡萄分开来进行典型相关分析,然后又将它们综合起来进行分析。结果显示,两组变量的相关程度很高。4.问题四要求分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用理化指标来评价葡萄酒的质量。应该来说,酿酒葡萄和葡萄酒的理化指标都对葡萄酒的质量有直接的影响。但是,酿酒葡萄和葡萄酒的理化指标之间存在因果关系,酿酒葡萄的理化指标通过葡萄酒的理化指标还存在间接的影响。因此一般的线性回归模型就无法解决他们之间的相互依赖关系,我们考虑用通径分析模型来解决这个问题。本文后面的模型建立和求解过程给出了详细的模型建立和求解过程。6异常数据的处理与说明通过观测,我们发现了题目给出的数据有两个地方存在异常:1.附件1中,“第一组红葡萄酒品尝评分”表中第20号酒样品的第4个评酒员对“外观-色调”的评分是缺失的;2.附件1中,“第一组白葡萄酒品尝评分”表中第3号酒样品的第7个评酒员对“口感-持久度”的评分是77分,而该项的满分只有8分。我们认为这是数据录入时的错误,怀疑是7分的可能性较大。本文后面的计算过程中,我们将此处数据视为7来进行计算。下面我们需要对缺失的数据进行补充。本文应用插值拟合预测的方法,得到分数的预测值为6。7模型的建立与求解7.1问题一:两组评酒员的评分显著性差异分析影响感官评价得分的因素有很多:酒的颜色(种类)、不同的评酒师、不同的样本、不同组、随机因素等。为了分析不同组的评酒员的是否有显著性差异,我们可以建立多因素方差分析模型:2(0,)ijklijkijklijklXabcN(1)其中:为一般平均,可以理解为基础得分;ia为不同的评酒师团队的效应,第一组记为1,第二组记为2,1,2i;jb表示第j个酒的样本,红酒分别为1-27,白酒为28-55,1,2,,55j;kc表示第k个评酒师,第一组为1-10,第二组为11-20,1,2,,20k;式(1)中的ijklX表示第i组的第k个评酒师对第j
本文标题:葡萄酒质量评价的多元统计分析模型
链接地址:https://www.777doc.com/doc-373282 .html