您好,欢迎访问三七文档
腿题目:葡萄酒的评价蒈【摘要】肄葡萄酒是世界上三大酒种之一,葡萄酒的准确评价和理化指标的评测对我国葡萄酒产业崛起有着重要意义,本文针对葡萄酒的评价问题进行了建模、求解和相关分析。莁对于问题一,首先将原始评分数据提取整合为两个组分别对27种红葡萄酒样品和28种白葡萄酒样品的综合平均评分,然后利用皮尔逊检验判断出评分结果无法用正态分布进行拟合,因而采取非参数假设检验中的Wilcoxon符号秩检验方法分别对红葡萄酒样品两组评分结果、白葡萄酒样品两组评分结果进行显著性分析,最终得出当α≥0.0118时,红葡萄酒样品的两组评分结果具有显著性差异;当α≥0.0376时,白葡萄酒样品的两组评分结果具有显著性差异。通常情况下选取显著性水平α=0.05,即两组评酒员对葡萄酒样品的评价结果具有显著性差异。将两组评酒员对27种红葡萄酒、28种白葡萄酒的评分从高到低排序,运用欧式距离判别法求出评分排序与平均分排序的距离,距离越小说明评分越接近平均值,一致性越好,最终通过两组距离比较确定第一组评分结果更可信。芀对于问题二,需要根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级,首先利用Excel软件的统计工具箱将酿酒葡萄的各项理化指标分别与对应葡萄酒的质量评分作相关性分析,得到酿酒葡萄的蛋白质含量、DPPH自由基含量、总酚含量、葡萄总黄酮含量和PH值等5个相关性显著的指标,然后利用加权Topsis法对这5个指标值进行分析,求出各种酿酒葡萄与最优方案的接近程度Ci,将Ci划分为5段,从而可将对应的酿酒葡萄分为5级。薆对于问题三,需要分析酿酒葡萄与葡萄酒的理化指标之间的联系,即是要分析两组随机变量之间的相关性关系,可以考虑运用多元统计分析中Hotelling典型相关分析法进行求解。首先在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。然后选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此继续下去,直到两组变量之间的相关性被提取完毕为止,从而最终求得酿酒葡萄与葡萄酒的理化指标之间的相关关系。蒄对于问题四,需要分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,因此可利用灰色关联度分析的方法进行求解,分别求出酿酒葡萄的理化指标与葡萄酒质量的关联度、葡萄酒理化指标与其质量的关联度,通过关联度值的大小,即可看出酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响大小。但影响葡萄酒质量的因素还有酿造工艺、设备等外部条件,且所得关联度最大只有0.7左右,故不能完全用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。膂关键词:Wilcoxon符号秩检验Topsis法典型相关分析灰色关联度节葡萄酒质量评价羈1.问题重述莅1.1问题背景肀葡萄酒的生产有着非常久远的历史,可上溯至几千年前,它是一种世界通畅芇性酒种,有着广泛交流的基础,现已发展成最主要的酒种之一。葡萄酒的感官分析又叫品酒、评酒,是指评酒员通过眼、鼻、口等感觉器官对葡萄酒的外观、香气、滋味及典型性等感官特性进行分析评定的一种分析方法。一方面,评酒员必须要抛开个人的喜好,排除时间、地点、环境和情绪等的影响,像一台精密的仪器一样进行感官分析;另一方面,因为葡萄酒的复杂多样及变化性,评酒员又必须充分发挥主观能动性,将获得的感觉与大脑中贮存的感官质量标准进行比较分析。只有兼顾以上两个方面,才能保证结果的精确性。同时各个评酒员之间还必须保证分析结果的一致性。一致性和精确性是正确性的保证[1]。芄确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。螄1.2待解决的问题袀根据题目所提供的某一年份一些葡萄酒的评价结果和该年份这些葡萄酒的和酿酒葡萄的成分数据,需建立数学模型完成下列问题:莈(1)分析两组评酒员对葡萄酒样品的评价结果有无显著性差异,并判断哪一组结果更为可信;蚇(2)根据酿酒葡萄的理化指标和葡萄酒的质量将葡萄酒样品对应的酿酒葡萄进行合理分级;膄(3)建立数学模型,分析酿酒葡萄与葡萄酒的理化指标之间有何联系;薀(4)分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。莀2模型假设与符号系统螅2.1模型假设蚃针对本问题,作出以下合理假设:芁(1)题目提供的数据准确可靠;膇(2)每位评酒员的评分在其组内同等重要;膈(3)葡萄酒和酿酒葡萄的理化指标的好坏根据中国标准网上查阅到的国标或地方标准来判断;肂2.2符号系统肁符号含义芈H0Wilcoxon符号秩检验中的原假设芆H1Wilcoxon符号秩检验中的备择假设蒂n样本数目螂M1第一组对葡萄酒的综合平均评分结果芀M2第二组对葡萄酒的综合平均评分结果莄D同种酒样品两组评分结果的差值膅R绝对差值|D|的秩值薂R+,R-正、负差值的两个部分的秩值肇T+,T-符号秩和螇SWilcoxon符号秩统计量薄T符号秩和统计量节σT2统计量T的方差腿z检验统计量袅p临界显著性水平肄a显著性水平蝿d总和欧式距离芀r相关系数芇ZTopsis法中转换指标归一化矩阵蒃Z+归一化矩阵Z中最优方案葿Z-归一化矩阵Z中最劣方案肇D+,D-评价对象与Z+和Z-的距离莆W理化指标的权重袂Ci评价对象与最优方案的接近程度艿3问题一的建模与求解聿3.1问题一的分析蒄问题一需要分析两组评酒员的评价结果有无显著性差异,可将原始数据提炼为四组数据,分别为第一、二组对27种红葡萄酒样品的总体评价结果,对28种白葡萄酒样品的总体评价结果。然后分别针对红葡萄酒样品的两组评价和白葡萄酒样品的两组评价作皮尔逊x2检验,验证其是否能较好地服从正态总体,若能,则可通过方差分析判断两组评酒员的评价结果有无显著性差异;若不能,则可通过非参数假设检验中的Wilcoxon符号秩检验进行分析。对哪一组结果更为可信的判断,则可分析每组的10位评酒员对同一样品酒的评价结果趋于一致性和稳定性的程度,从而进行判定。莂3.2数据预处理羀原始数据中,第一组、第二组各有10名评酒员对27种红葡萄酒样品和28中白葡萄酒样品分别作了评价,故将每位评酒员对每种酒样品的各项评分求和得到总分,然后将同组中每种酒样品的10个总分取平均值,从而得到第一组对27种红葡萄酒样品、28种白葡萄酒样品的综合平均评分,和第二组对27种红葡萄酒样品、28种白葡萄酒样品的综合平均评分,如下表所示:膀表3.2-1两组评酒员对酒样品的综合平均评分袇红葡萄酒白葡萄酒螁酒样品第一组评分第二组评分酒样品第一组评分第二组评分螀162.768.118277.9羇280.374274.275.8羅380.474.6385.375.6蒅468.671.2479.476.9蒁573.372.157181.5罿672.266.3668.475.5莇771.565.3777.574.2袄872.366871.472.3芁981.578.2972.980.4螆1074.269.11074.379.8蒆1170.161.61172.371.4芃1253.968.31263.372.4羁1374.668.81365.973.9袈147372.6147277.1薄1558.765.71572.478.4螃1674.969.9167467.3螂1779.374.51778.880.3衿1859.965.41873.176.7羆1978.672.61972.276.4膂2078.675.82077.876.6蒂2177.172.22176.479.2蚆2277.271.6227179.4肅2385.677.12375.977.4薁247871.52473.376.1膂2569.268.22577.179.5螈2673.8722681.374.3蒇277371.52764.877芅2881.379.6虿3.3模型的建立与求解衿3.3.1显著性分析薆分别针对红葡萄酒的两组评分结果和白葡萄酒的两组评分结果,进行正态分布拟合后,利用皮尔逊检验发现,两个正态分布拟合效果在显著性水平为0.05和0.1时并不佳,因此判断两类葡萄酒的评分结果并不服从正态分布。故需采用非参数假设检验的方法来分析两组评分结果有无显著性差异。蚄下面采用Wilcoxon符号秩检验的方法作显著性分析,以红葡萄酒为例进行说明。为了比较红葡萄酒样品的两组评分结果是否有显著性差异,作出假设检验为:葿H0:两组评分结果没有显著性差异;蚆H1:两组评分结果有显著性差异。蚄使用Wilcoxon符号秩检验方法的主要步骤见表3.3.1—1中每列中的计算方法和过程,先求出每对数据的差值D,按差值绝对值|D|由小到大排列并给秩R,从秩1开始到秩27,样本数目n=27,在给秩时,遇到相等的|D|时,使用平均秩,如表中酒样品3和酒样品13具有相同的绝对差值5.8,因而平分秩16和秩17,各为秩16.5。当绝对差值的秩值R给出后,将R分成正、负差值的两个部分秩值R+和R-,最后求符号秩和膄由于样本数目为27个,和的最小可能值为0,而最大可能值为1+2+…+n=n(n+1)/2。显然,当有那么,符号秩的平均值为n(n+1)/4,构造Wilcoxon符号秩统计量为:膀(1)蚈表3.3.1—1红葡萄酒样品评分结果的Wilcoxon符号秩检验肆酒样品评分结果差值D绝对差值秩次符号秩次R薃n两组M1M2D=M1-M2|D|R-+袀162.768.1-5.45.41313蝿280.3746.36.321.521.5膅380.474.65.85.816.516.5羂468.671.2-2.62.666蚀573.372.11.21.233薇672.266.35.95.91818蒇771.565.36.26.22020莂872.3666.36.321.521.5莁981.578.23.33.388薈1074.269.15.15.11212薅1170.161.68.58.525.525.5肅1253.968.3-14.414.42727膁1374.668.85.85.816.516.5虿147372.60.40.411螄1558.765.7-772424薅1674.969.9551111袁1779.374.54.84.899蒇1859.965.4-5.55.51414肆1978.672.6661919羄2078.675.82.82.877蚂2177.172.24.94.91010蒈2277.271.65.65.61515膅2385.677.18.58.525.525.5莃247871.56.56.52323莂2569.268.21122蕿2673.8721.81.855薇277371.51.51.544螃84294膃显然,如果原假设为真,则应该有相同的值,等于n(n+1)/4,因此太大的S值和太小的S值都是我们拒绝原假设的依据。莇对于n20,当原假设H0为真时,统计量接近于0,统计量T的方差为:蚅(2)节建立检验统计量:蕿(3)蒈z近似于服从标准正态分布。又由可得n(n+1)/2,代入式(3)可得:螄dataexamp4_6;蚁inputM1M2;荿d=M1-M2;蒀cards;膆62.768.1莅80.374肀80.474.6芇68.671.2芄73.372.1螄72.266.3袀71.565.3莈72.366蚇81.578.2膄74.269.1薀70.161.6莀53.968.3螅74.668.8蚃7372.6芁58.765.7膇74.969.9膈79.374.5肂59.965.4肁7372.6芈78.675.8芆77.171.5蒂77.271.6螂85.677.1芀7871.5莄69.268.2膅73.872薂78.672.2肇;螇run;薄procunivariatedata=examp4_6;节vard;腿run;袅由p值检验法可知:选取的显著性水平αM=0.0015,则在显著
本文标题:葡萄酒的评价
链接地址:https://www.777doc.com/doc-5213057 .html