您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 葡萄酒评分数模国赛赛题
1葡萄酒的评价摘要本文主要研究评酒员对葡萄酒质量的评价与酿酒葡萄、葡萄酒和酿酒葡萄的理化指标之间的联系。在求解过程中,我们使用了变异系数评价法、配对t检验法、快速均值聚类法建立数学模型,再利用SPSS软件和Matlab对数据进行处理分析。具体结果如下:针对问题一:首先对数据进行处理:求出每一位品酒师对每一种葡萄酒的总评分,分别计算出两组品酒师对每一个样品的平均打分。利用SPSS软件对打分进行配对t检验,得出两组评酒员的评价结果有显著差异。再运用比较变异系数的方法分析数据:通过组间评分和组内评分数据的差异化系数求解并比较,得出第二组结果更可信的结论。针对问题二:题目要求利用葡萄酒的质量和酿酒葡萄的理化指标同时对酿酒葡萄进行分级,因此我们将第二组品酒师对葡萄酒的打分作为衡量葡萄酒质量的重要参数。再对酿酒葡萄的理化指标进行无量纲化处理,利用主成分分析法从酿酒葡萄的理化指标中提取主成分。最后将提取出的主成分和葡萄酒质量结合,用SPSS对葡萄样品进行系统聚类分析确定最终的分级。针对问题三:题中要求酿酒葡萄与葡萄酒的理化指标之间的关系,我们将其转化为求解对于同一样品的这两组理化指标之间的关系矩阵。先用MATLAB求出每一组变量的相关系数,再用PCA算法求得酿酒葡萄与葡萄酒的理化指标之间的定量关系。针对问题四:依然把第二组品酒师的评分作为衡量葡萄酒质量的标准。以酿酒葡萄、葡萄酒为样本,通过多元线性回归法构建反映酿酒葡萄和葡萄酒的理化指标以及芳香物质与葡萄酒质量之间关系的方程,得出可以用葡萄酒和酿酒葡萄的理化指标来评价葡萄酒的质量。最后通过回归方程的检验和预测,确定葡萄酒质量与各影响因素之间的数量关系。关键词:非参数假设检验;方差分析;聚类分析;PCA分析法;多项式回归;2一、问题重述1.1问题的背景葡萄酒的质量是葡萄酒的一种特性,它表示着葡萄酒的优秀程度。确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评,评酒员品评葡萄酒时,主要通过感官评价来评分。感官指标主要指色泽、香气、滋味和典型性方面的要求,每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。题中提供的附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。1.2问题的提出请尝试建立数学模型讨论下列问题:1.根据题中提供的附件1,分析两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、模型假设及说明1.假设样本之间相互独立。2.假设理化指标是真实可信的。3.假设评酒员对葡萄酒的个人喜好差异可以忽略不计。4.假设芳香物质中仪器没有测出的物质含量为0。5.假设葡萄酒的质量没有受其他的理化指标的影响。6.假设酿酒葡萄没有其他的影响指标,如光照、地域等。7.假设品酒师品酒的环境相同。三、问题分析问题一中,要求分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信。因为红葡萄酒和白葡萄酒的制作工艺不同,所含的成分不同,有可能会导致两组评论员对两种颜色的葡萄酒样品的评分标准产生差异,所以在处理数据时,应将其分颜色进行讨论。运用配对t检验法,对第一组红葡萄酒各种酒样品的平均得分和第二组红葡萄酒各种酒样品的平均得分进行显著性检验。然后运用方差分析法和比较变异系数,来判断出哪一组结果更可信。问题二中,要解决的问题是根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行评级。由于酿酒葡萄的理化指标太多,数据复杂,得先对数据进行处理,采用主成分分析法,得到主成分的表达式,然后根据表达式得到主成分的具体数据,实现降维。要实现对葡萄进行评级,需把性质相近的葡萄分在同一类,所以3要进行聚类分析。考虑到即使是同一类葡萄,样本不同所酿的酒的质量也会有差异,于是根据同一类别中所有葡萄所酿造的葡萄酒样本质量水平对酿酒葡萄进行评级。问题三中,需要研究葡萄酒与酿酒葡萄的理化指标之间的联系。因为题中提供的数据极为复杂,需先对数据进行因子分析,得到共性因子,将得到的因子作为新变量,进行典型相关分析,从而判断出两者的联系。问题四中,可以将问题分为两部分,一是考虑酿酒葡萄和葡萄酒的理化指标与葡萄酒的质量的关系,二是判断这两种物质的理化指标能否评价葡萄酒的质量。针对第一部分,首先我们把两类指标放在一起,作出散点图,判断其是线性还是非线性关系。判断之后进行相关性分析,选出相关性强的指标,建立多项式回归模型。得出结果后,对模型进行检验。第二部分的解决需要考虑附表3中的芳香物质对葡萄酒的质量是否有影响,把芳香物质、葡萄和葡萄酒的理化指标当作影响因素,其处理方法与第一部分一样,如果加入芳香物质后的模型能够较好的和数据拟合,那么就说明仅使用葡萄和葡萄酒的理化指标评价葡萄酒的质量是不全面的,反之则说明能够全面的评价葡萄酒的质量。四、符号说明iy:葡萄酒的理化指标;jx:葡萄的理化指标;iX:631,,xx与iy线性相关性高的jx组成的向量;iA:由回归系数组成的向量;*iu:与红葡萄酒质量相关较大的理化指标和芳香物质;**iu:与白葡萄酒质量相关较大的理化指标和芳香物质;T:对酿酒葡萄样品的理化指标进行主成分分析后得到的主成分五、模型建立及求解5.1问题一5.1.1非参数假设检验1.数据的处理从附件1中可知,评酒员品评葡萄酒时,主要是看外观、闻香气、尝味道三种方式,即为感官评价。在评酒员对葡萄酒的感官评价中,除了葡萄酒本身的成分在一定程度上决定了评酒员的评分有一定的差异外,评酒员间也存在着评价尺度、评价位置和评价方向等方面的差异,这些都会导致不同评酒员对同一酒样的评价有很大的差异,但是这些并不能直接说明两组评酒员的评价结果是否有显著性差异。因此,在对感官评价结果进行统计分析时,必须先对两组评酒员对葡萄酒的评分进行相应的处理。4首先,将两组评酒员对不同品种葡萄酒的分类指标的打分进行求和,得到总分,确定葡萄酒的质量(表格见附录1)。其次,将两组评酒员对同一种酒样品的评分求和,再求其均值,可得到四组数据,即第一组评酒员对每种红葡萄酒样品评分的平均值,第二组评酒员对每种红葡萄酒样品评分的平均值,第一组评酒员对每种白葡萄酒样品评分的平均值,第二组评酒员对每种白葡萄酒样品评分的平均值(表格见附录2)。最后,从以上数据的处理结果中可以看出两组葡萄酒样本是独立的样本,设第一组评酒员对每种红葡萄酒样品评分的平均值为样本一,第二组评酒员对每种红葡萄酒样品评分的平均值为样本二,用非参数假设检验中的MannWhitneyU检验法对两组样本进行显著性检验。表1第一组评酒员对每种红葡萄酒样品评分的平均值酒样品123456789平均得分62.780.380.468.673.372.271.572.381.5酒样品101112131415161718平均得分74.270.153.974.67358.774.979.359.9酒样品192021222324252627平均得分78.678.677.177.285.67869.273.873表2第二组评酒员对每种红葡萄酒样品评分的平均值酒样品123456789平均得分68.17474.671.272.166.365.36678.2酒样品101112131415161718平均得分68.861.668.368.872.665.769.974.565.4酒样品192021222324252627平均得分72.675.872.271.677.171.568.27271.5注:在处理附件1的数据时,发现附件1葡萄酒品尝评分表中的第一组评酒员对白葡萄酒的品尝评分的第233行J列的数据为77,根据口感分析中的持久性最高得分只能为8分,因此认为此处数据应为7,于是将数据77改为7进行处理分析。2.MannWhitneyU检验的基本原理一般做显著性检验时,往往事先假定总体服从某种特定的分布,如正态分布,然后对其均值、方差等参数做差异的显著性检验。但某个随机变量是否服从某种特定的分布是需要进行检验的。在总体分布情况不明时,用来检验总体是否来自同一个总体的假设的一类统计方法统称为非参数检验。MannWhitneyU检验主要用于判别两个独立样本所属的总体是否有相同的分布,它是最强的非参数检验之一。该假设的原假设为:两组独立样本来自的两总体分布无显著性差异。MannWhitneyU检验通过对两组样本平均秩的研究来实现推断。其中秩的计算如下:5设样本12,,,mxxx和样本12,,nyyy分别抽自相互独立的连续型随机变量总体Fx和Gx,并设这两个样本的合并样本1212,,,,,,,mnxxxyyy的各个单元之间互不相等,则合并的样本容量Nmn。对合并后的样本,按从小到大的顺序排列,并以iR为iy在混合样本的秩。则Y样本12,,nyyy的秩和1nyiiWR,同样地,以iQ记ix在混合样本的顺序统计量中的位置,则X样本12,,,mxxx的秩和1mxiiWQ。由此可知,121/2xyWWNNN。因此,用xW作为统计量和用yW作为统计量是相互等价的。3.模型的建立设样本)27,,2,1(,,,21mxxxm和样本)28,,2,1(,,,21nyyyn分别抽自相互独立的连续型随机变量总体Fx和Gx,则原假设为0:HFxGx,备择假设为1:HFxGx。在原假设为真时,若min,mn,且/0,1mN,是一个常数,则Wilcoxon秩和统计量yW的概率分布和累积概率分布分别为:,mnytdPWdNn(1),,1/2,,1/2mmidytiPWddnnnnmnNn(2)其中,,mntd表示从1,2,,Nmn这N个数中任取n个数,其和恰为d的取法种数。xyW的渐近正态性简记为:31~/2,1/12()/(12(1))gxyiiiWNmnmnNnmttNN(3)当0PH时,拒绝原假设。64.模型的求解运用SPSS软件对以上问题进行求解,可得到以下计算结果,见表3。表3两组评论员对红葡萄酒样品评分均值的秩检验表品酒分数MannWhitneyU统计量224.500WilcoxonW602.500Z-2.423渐近分布双侧检验0.015双侧精确检验0.015单侧精确检验0.007intPoProbability0.000表3给出在两组样本抽自的总体相同的原假设下,出现目前统计量的值或者更极端值的双侧检验概率为0.015,小于0.05,故拒绝原假设,认为两组评酒员对27种红葡萄酒样品的评分均值独立样本来自的两总体分布有显著性差异。同理可得,在两组评酒员对28种白葡萄酒样品的评分均值抽自的总体相同的原假设下,出现目前统计量的值或者更极端值的双侧检验概率为0.029,小于0.05,拒绝原假设,认为两组评酒员对白葡萄酒样品的评分均值独立样本来自的两总体分布也有显著性差异(表格见附录3)。综上所述,可得附件1中两组评酒员对葡萄酒样品的评价结果,无论是对红葡萄酒样品还是对白葡萄酒样品都有显著性差异,即两组评酒员的评价结果有显著性差异。5.1.2单因素方差分析1.单因素方差分析的基本原理单因素方差分析即一维方差分析,是检验由单一因素影响的多组样本因某因变量的均值是否有显著差异的问题。如果各组之间有显著差异,则说明该因素对因变量有显著影响,因素的不同水平会影响因变量的取值。方差分析把因变量的方差分解为由因素的不同取值能够解释的部分,和剩余的不能解释的部分,然后比较两部分,当能用因素解释的部分明显大于剩余的部分时,则认为因素差异是显著的
本文标题:葡萄酒评分数模国赛赛题
链接地址:https://www.777doc.com/doc-373276 .html