您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > (完结版)葡萄酒的评价
葡萄酒的评价摘要本文通过对品酒员的葡萄酒评价结果、葡萄酒和酿酒葡萄的理化指标、芳香物质的数据统计分析,利用SPSS软件、EVIEWS软件、MATLAB软件,对葡萄酒作出评价。问题一:首先对缺失的数据采用热卡插值法填补,缺失值为2;其次我们对每一酒样品总分求均值,利用SPSS软件进行配对t检验,进行显著性差异分析,可知两组品酒员的评价结果之间存在显著性差异;然后我们采用方差分析法,对每组品酒员内部打分结果进行方差比较,利用MATLAB求解得出:对于红白葡萄酒,第二组的方差普遍都比第一组小,第二组的打分结果比较可信。问题二:通过SPSS软件的因子分析,分别对酿酒葡萄的一级理化指标和二级理化指标进行主成分分析,得出可以囊括酿酒葡萄重要特征的重要主成分,其中红葡萄得到9种主成分,白葡萄得到10种主成分。再以主成分为自变量进行聚类,将具有共同特征的酿酒葡萄归为一类,再对葡萄样品进行聚类,对酿酒葡萄进行等级划分,红白葡萄均归为5类。最后结合在第一问中求得的可信组品酒师的葡萄酒的总评分,确定每一类酿酒葡萄的等级。分类红葡萄样品编号白葡萄样品编号12,3,9,232,3,5,9,10,12,22,24,25,26,28210,13,19,20,25,26,272734,5,6,7,12,15,16,17,18,21,22,241,2,1541,8,144,6,7,11,14,17,18,20,21,235118,16,19通过SPSS软件对葡萄酒质量进行聚类,将聚类结果与对应的一级理化指标聚类结果比较,得到的红、白葡萄酒的吻合率分别为0.25926、0.37037,可见仅用酿酒葡萄的理化指标来评价葡萄酒质量不是很合理。问题三:首先通过pearson相关性分析,对酿酒葡萄和葡萄酒的理化指标进行初步的相关性判定,得出两者的理化指标大多数指标呈正相关,然后对葡萄酒的理化指标进行标准化,将酿酒葡萄的理化指标作为自变量,将葡萄酒的理化指标作为应变量,采用EVIEWS软件将标准化后的葡萄酒的理化指标和酿酒葡萄的主成份进行逐步回归,建立回归模型,分析得到白藜芦醇等白葡萄相关关系式的R方值较小,可见虽然存在着一定的线性关系,但是关系较弱。问题四:结合酿酒葡萄和葡萄酒的理化指标、芳香物质与葡萄酒质量,利用支持向量回归机分别对其进行回归分析和相关性分析,并对葡萄酒质量进行预测,将预测值与实际值比较发现拟合度较好,得出酿酒葡萄和葡萄酒的理化指标与葡萄酒质量呈正相关,并从回归模型中可知,芳香物质与葡萄酒的质量有一定的关系,不能仅仅用酿酒葡萄和葡萄酒的理化指标来评价葡萄酒的质量。关键词:葡萄酒;回归分析;配对t检验;聚类;支持向量回归机一.问题重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二.问题假设1.假设每位品酒员之间是相互独立的,且评分是绝对公正的。2.假设每个样品酒都是随机取得的。3.假设允许存在计算误差。4.假设两组评酒员在进行评分时是只与自身专业评价标准有关。三.符号表示a表示第一组品酒员b表示第二组品酒员1f表示红葡萄酒的质量2f表示白葡萄酒的质量1,1,2...11iwi表示红葡萄酒中的芳香物质2,1,210iwi表示白葡萄酒中的芳香物质1,1,25ii表示酿酒红葡萄中的芳香物质2,1,27ii表示酿酒白葡萄中的芳香物质表示红葡萄酒的九个理化指标表示酿酒红葡萄的八个主成分表示红葡萄酒的残差表示白葡萄酒的八个理化指标表示酿酒白葡萄的九个主成分表示白葡萄酒的残差表示回归方程的系数2R表示方程的拟合度四.问题分析问题一:由于题目给出的数据中缺失评酒员4对酒样品20的色调评分,因此我们先用热卡插补法进行数据填补。再用统计的方法,计算出每组对每一个样品酒分类打分指标的平均值,利用SPSS软件对两组品酒员与对应酒样品评价之间进行配对t检验,对求得的P值进行显著性差异分析,判断两组品酒员的评价结果是否存在差异;然后计算出两组品酒员对每一酒样品的评价总分,分别计算两组品酒员对每一酒样品的方差,利用方差来表示组内评分结果的稳定性,比较分析两组品酒员的可信度。问题二:该问题要求根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行等级划分,结合问题一得到的更可信的葡萄酒质量评分,综合考虑各类因素的情况进行综合评价。由于酿酒葡萄的理化指标较多,我们利用SPSS软件分别对一级理化指标和二级理化指标进行主成分分析,再利用K-聚类的方法分别对酿酒葡萄的理化指标进行聚类并结合葡萄酒的质量,对酿酒葡萄的质量进行分级。问题三:为分析酿酒葡萄与葡萄酒的理化指标之间的联系,首先定性的分析葡萄酒中比较重要的理化指标和酿酒葡萄中的理化指标,再利用SPSS软件对葡萄酒的理化指标进行标准化,采用EVIEWS软件将标准化后的葡萄酒的理化指标和酿酒葡萄的主成份进行逐步回归,得到酿酒葡萄和葡萄酒的理化指标之间的联系。问题四:为分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量,分别随机选取20个标准化后的红、白葡萄和葡萄酒的理化指标和芳香物质与葡萄酒的质量之间回归分析,建立逐步回归模型,并将剩余的数据代入回归模型,预测葡萄酒的质量,将预测值与实际值比较;采用SVR对随机选取20个标准化后的红、白葡萄和葡萄酒的理化指标和芳香物质与葡萄酒的质量进行相关性分析,并对剩余的数据进行葡萄酒质量的预测,将预测值与实际值比较,绘制折线图,比较逐步回归模型和SVR预测的准确性。五.模型建立与求解问题一:分析两组品酒员的评价结果有无显著性差异,并判断哪一组更可信。1.缺失数据的补充经过对数据缺失的分析,我们认为该资料的缺失属于完全随机缺失。因此,我们选择热卡插补法,尽可能寻找和遗漏值相似的数值来替代之,算出4号评酒员所评价的其他样品酒与样品酒20的相关系数,,从而确定整体数据与样品酒20相近的样品酒。对于X与Y两个变量,两者间的相关系数xy为22()()()()iiXYiiXXYYXXYY其中[1,1]XY.如果0XY,则X与Y成正相关关系;如果0XY,则X与Y成负相关关系;如果0XY,则X与Y不想关。||1XY,则X与Y相关性越密切。运用matlab软件计算出其余样品酒与样品酒20的相关性,得到相关系数最高的是酒样品11,0.9340XY,因此,用酒样品的色调分数代替缺失数据,则4号评酒员对样品酒20的色调评分为2分。2.两个样本的显著性差异检验正态分布检验数据服从正态分布的检验在对两样本显著性检验时,要确定样本的总体是服从正态分布,采用JB统计量对红(白)葡萄酒样品的评分均值服从正态分布。221(3)64TkJBSK其中,S、K分别表示偏度和峰度。在正态分布的假设下,JB统计量服从自由度为2的2分布。如果这个概率值越大,认为样本的确来自正态分布的总体。采用EVIEWS软件,对红(白)葡萄酒样品的评分均值进行正态分布检验,得两组评酒员对红(白)葡萄酒的某个酒样品质量评分数据服从正态分布。表1.1JB正态分布检验结果第一组白葡萄酒第二组白葡萄酒第一组红葡萄酒第二组红葡萄酒JB值0.06375.5244.14580.3068概率P0.96860.06320.12580.8578配对样本t检验建立假设0H:0Y,1H:0Y,并构造t统计量)1(~1/ntnsyty在显著水平0.05的情况下,对白葡萄酒进行t检验得到的P=0.0190.05,对红葡萄酒进行t检验得到的P=0.0190.05,因此,在对白葡萄酒和红葡萄酒的评价中,两组评价结果存在显著性差异。分别根据品酒员对红(白)葡萄酒样品的分类打分指标,求出分类打分指标均值(详见附录),利用SPSS软件对红(白)葡萄酒的分类打分指标均值进行配对样本t检验。计算得出,在显著水平0.05的情况下,两组评酒员对红(白)葡萄酒某个样品酒的评价结果有无显著差异见下表:表1.2两组红葡萄酒间显著性差异分析结果酒样品1234567891011121314差异否是是否否是是否是是是是否否酒样品15161718192021222324252627差异是是是否是否是是是是否否否表1.2两组白葡萄酒间显著性差异分析结果酒样品1234567891011121314差异是否否否是是是否是是否是是是酒样品1516171819202122232425262728差异是是否否是否否否否否否否是否3.利用方差对两组品酒员的评价结果进行可信度分析方差表示一组数据的稳定性,我们采用方差来比较两组内部十个品酒员之间评分的稳定行来判断该组的打分结果是否可信。对两组品酒员对红(白)葡萄酒的评分结果进行数据统计分析,计算方差(见附录),利用MATLAB软件对两组的方差进行比较(程序见附录),绘制散点图(图1.1)图1.1两组品酒员的评分方差散点图根据散点图可知:第二组对白葡萄酒和红葡萄酒的评分结果方差普遍比第一组小,方差越小表明组内品酒员评分结果越稳定,从而说明第二组品酒员的评价结果更可信。问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。1.由于附件中酿酒葡萄一共有30个一级指标,27个二级指标,为了简化酿酒葡萄的理化指标,我们采用主成分分析法。第一步,对原始数据进行标准化处理。第二步,计算各个理化指标之间的相关系数矩阵:pppppprrrrrrrrrR212222111211),,2,1,(,pjirjiijr的计算公式为:nknkjkjikijkjnkikiijxxxxxxxxr11221)()())((第三步,计算特征值与特征向量,由特征向量组成m个新的指标变量。第四步,计算主成分贡献率:贡献率:),,2,1(1pLipkki利用MATLAB对30个一级指标和27个二级指标进行主成分分析后,得到八个红葡萄的理化指标主成分,九个白葡萄的理化指标主成分。表2.1红葡萄的一级理化指标主成分主成份主要理化指标贡献率(单位:%)第一主成份蛋白质、花色苷、DPPH自由基、总酚、单宁、葡萄总黄酮、百粒质量、果梗比、出汁率、果皮颜色L23.228第二主成份氨基酸总量、总糖、还原糖、可溶性固形、干物质含量39.698第三主成份柠檬酸、白藜芦醇、可滴定酸、果皮颜色a、果皮颜色b52.145第四主成分苹果酸、多酚氧化酶活力、褐变度、PH值61.613第五主成分VC含量、固酸比、果穗质量68.279第六主成分黄酮醇74.084第七主成分果皮质量78.813第八主成分酒石酸83.044酿酒红葡萄中第一主成分代表了红葡萄的结构与颜色,第二主成分体现了红葡萄的味感,第三主成分主要是红葡萄的风味与色泽,第四主成分代表了红葡萄的氧化程度等。表2.2红葡萄的二级理化指标主成分主成份主要理化指标贡献率(单位:%)第一主成分天门冬氨酸、丝氨酸、谷氨酸、丙氨酸、缬氨酸、蛋氨酸、异亮氨酸、亮氨酸、赖氨酸、组氨酸、精氨酸、H321.051第二主成分顺式白藜芦醇苷、C1、C2、C3、杨梅黄酮33.990第三主成分反式白藜芦醇苷、反式白藜芦醇、槲皮素、山萘酚、异鼠李素45.995第四主成份脯氨酸、果糖、葡萄糖54.863第五主成分甘氨酸62.565第六主成分酪氨酸
本文标题:(完结版)葡萄酒的评价
链接地址:https://www.777doc.com/doc-5171965 .html