您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 酒店餐饮 > 数学建模-葡萄酒评价优秀论文
葡萄酒的评价模型摘要近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增。特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平。如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。本文通过对感官评价分析,结合葡萄酒和酿酒葡萄的理化指标和芳香物质的大量数据,建立了客观可靠的葡萄酒质量综合评价模型。针对问题一:本题需要检验两组品酒员的评价结果是否存在显著差异,并选出更可靠的一组。我们将各种葡萄酒的10个二级指标得分,相加得到每种酒的总分。在判断知每组品酒员的评价总分均服从正态分布后,用𝑡检验分析两组品酒员对各葡萄酒评价的差异性,由此计算得到两组评价的显著性差异率为13.36%,即总体上两组品酒员的评价不存在显著差异。但由于两组品酒员的评价仍存在部分差异,我们比较两组品酒员对55种葡萄酒评价的方差,发现第二组评分的方差普遍小于第一组,所以第二组的评价结果更可信。针对问题二:为了对酿酒葡萄进行分级,我们将葡萄的理化指标作为媒介。先根据国际指标制定适用于本题评分的分级标准,将葡萄酒进行分级,再根据理化指标经标准化之后的数值,利用欧氏距离对酿酒的55种酿酒葡萄进行𝑄型聚类分析。聚类得到红白葡萄各六个分类后,再把各类酿酒葡萄对应至相应葡萄酒的等级,将酿酒红葡萄和酿酒白葡萄各分为五级。针对问题三:由于各种酿酒葡萄的理化指标种类复杂,我们用主成分分析的方法,从酿酒红葡萄和酿酒白葡萄的27个有效指标中各提取出了8个和9个主要成分。考虑到酿酒葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系,我们建立多元线性回归模型,得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。关键词:显著性检验;聚类分析;主成分分析;多元回归。1一、问题的重述确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。请尝试建立数学模型讨论下列问题:1.分析附件1中两组评酒员的评价结果有无显著性差异,哪一组结果更可信?2.根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。3.分析酿酒葡萄与葡萄酒的理化指标之间的联系。4.分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量?二、问题分析1.问题一的分析:已知两组品酒员分别对27个红葡萄酒样品和28个白葡萄酒样品在10个二级指标的评分,利用二级指标的评分之和得到每个品酒员对每种酒的总分,判断不同品酒员对同一葡萄酒的总分是否符合正态分布,若符合,则用𝑡检验的双侧检验对两组品酒员各葡萄酒的评价是否存在显著性差异。由于两组品酒员对相同葡萄酒的评价可能存在显著差异,我们认为对同种酒的评价总分方差普遍小的一组更可信。2.问题二的分析:酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,而葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。已知55种葡萄酒的质量评分和酿酒葡萄的理化指标,需要对酿酒葡萄进行分级。我们将葡萄的理化指标作为媒介,先根据国际指标将葡萄酒进行分级,再根据理化指标对酿酒的55种葡萄进行聚类,最后将各类酿酒葡萄对应至相应的等级。对酿酒葡萄进行聚类前需要先进性各理化指标数据的标准化处理,再利用欧氏距离定义类与类之间和样品与样品之间的距离,最后逐步聚类。3.问题三的分析:由于各种酿酒葡萄的理化指标种类复杂,我们先用主成分分析的方法提取出能清晰反映所有有效指标的几个新指标。首先对酿酒红葡萄和酿酒白葡萄的27个有效指标中进行标准化处理,将标准化得到的矩阵导入𝑆𝑃𝑆𝑆,分别提取出累计贡献率恰好大于80%的前几个主成分。考虑到酿酒葡萄经化学反应酿造成葡萄酒的过程中各项理化指标一般存在线性关系,随后我们建立葡萄酒新指标关于酿酒葡萄的多元线性回归模型,得出酿酒葡萄和葡萄酒各项有效理化指标的正负相关关系。三、模型的假设1.同种葡萄的各理化指标和质量均相同;2.所有葡萄酒的酿造工艺和酿造环境相同;3.酿造葡萄和葡萄酒中未测到的芳香物质含量为零。2四、符号说明符号意义𝐺(𝑘)𝑖𝑗第𝑗个品酒员对第𝑖种酒的第𝑘个二级指标的评分𝐺𝑖𝑗第𝑗个品酒员对第𝑖种酒的总分𝐺𝑖品酒员对第𝑖种葡萄酒评价总分的均数𝑆2𝑖品酒员对第𝑖种葡萄酒评价总分的方差𝑋𝑖第𝑖个酿酒葡萄𝑑𝑖𝑗第𝑖个酿酒葡萄与第𝑗个酿酒葡萄之间的距离𝑌𝑖𝑗第𝑖种葡萄的第𝑗项指标𝑦𝑖葡萄酒的第𝑖项理化指标五、模型的建立与求解5.1问题一:两组品酒员评价的差异分析模型5.1.1数据的预处理1.数据的观察:在附件一葡萄酒品尝评分表中有两组品酒员分别对每种葡萄酒的评分,每组均有10个品酒员,评分标准分为4个一级指标,一级指标下又分为10个二级指标,每个二级指标的分值如下表,各指标总分为100:图1:葡萄酒指标及分值观察数据发现:①第一组7号品酒员对白葡萄酒样品3的浓度评分77存在记录错误;②第一组4号品酒员对红酒样品20的色调评分缺失。故用对应组其他品酒员的对应指标评分均值代替其评分。2.总分的计算:𝐺(𝑘)𝑖𝑗为第𝑗个品酒员对第𝑖种酒的第𝑘个二级指标的评分,将各个指标的得分相加得到第𝑗个品酒员对第𝑖种酒的总分𝐺𝑖𝑗=𝑠𝑢𝑚10𝑘=1𝐺(𝑘)𝑖𝑗(1)得到红葡萄酒27×10的矩阵,𝐺=⎛⎜⎜⎝𝐺11···𝐺1𝑗.........𝐺𝑖1···𝐺𝑖𝑗⎞⎟⎟⎠𝑖=27,𝑗=105.1.2差异分析模型的建立1.𝑄−𝑄图检验是否符合正态分布3正态分布是利用t检验两个独立样本是否有显著性差异的前提,我们利用𝑄−𝑄图检验总体是否服从正态分布,具体方法如下:①将两组20个品酒员对同一样品的评价总分按开序排列使𝐺1≤𝐺2≤...≤𝐺𝑖≤...≤𝐺20;②再计算样本均数:𝐺=12020∑︁𝑖=1𝐺𝑖(2)标准差:𝜎=√︃∑︀(𝐺𝑖−𝐺)220−1(3)分位数:𝑄𝑖=𝐺𝑖−𝐺𝜎(4)和正态分布表𝑡𝑖对应分位置𝑄′𝑖,其中𝑡𝑖=𝑖−0.520(5)③由𝐺𝑖、𝑄𝑖、𝑄′𝑖画出𝑄−𝑄′图,与𝑦=𝑥比较,若𝑄−𝑄′图与之吻合,则总体服从正态分布,否则不服从。2.两个独立样本的t检验①假设𝐻0:𝑢1=𝑢2;𝐻1:𝑢1̸=𝑢2②选用双侧检验,置信区间为95%;③计算统计量:𝑡=𝑋1−𝑋2√︁(𝑛1−1)𝑆21+(𝑛2−1)𝑆22𝑛1+𝑛2−1(1𝑛1+1𝑛2)(6)④查表得𝑡𝛼2,若𝑡≤𝑡𝛼2,则𝑝≥0.05,接受𝐻0,拒绝𝐻1两个独立样本不具有显著差异;若𝑡𝑡𝛼2,则𝑝0.05,拒绝𝐻0,接受𝐻1两个独立样本具有显著差异。根据𝑡检验结果是否小于0.05来判断两组品酒员对葡萄酒的评价是否存在差异。5.1.2差异分析模型的求解1.𝑄−𝑄图检验是否符合正态分布我们分别画出27种红葡萄酒和28种白葡萄酒的𝑄−𝑄图。以20个品酒员对红葡萄酒样品1的评价总分的𝑄−𝑄图为例:4图2:红葡萄酒样品的正态𝑄−𝑄图其𝑄−𝑄图各点均分布在直线附近,则认为红葡萄酒样品质量评分服从正态分布。同理得到27种红葡萄酒和28种白葡萄酒的评分均服从正态分布。2.两个独立样本的t检验首先以两组品酒员对红葡萄酒样品1的评价为例:其𝐹值检验结果为0.213,小于显著水平0.05,即两组品酒员对红葡萄酒样品1的评价总分方差相等,可知𝑝=0.2130.05,则两组品酒员对红葡萄酒样品1的评价不存在显著性差异。同理对27种红葡萄酒和28种白葡萄酒进行t检验的分析。记两组品酒员对第𝑖种葡萄酒的评价是否存在显著性差异为𝑎𝑖(𝑖=1,2,...,55),其中27种红葡萄酒对应𝑖=1,2,...,27,28种白葡萄酒对应𝑖=28,29,...,55。当𝑎𝑖=1时,存在显著性差异;当𝑎𝑖=0时,不存在显著性差异。则55种葡萄酒𝑡检验的结果如下表:5表1:红、白葡萄酒的显著性分析结果3.两组品酒员的评价结果差异分析计算两组品酒员评价结果的显著性差异率𝑟𝑎:𝑟𝑎=𝑎𝑏,𝑎=55∑︁𝑖=1𝑎𝑖,𝑏=55∑︁𝑖=1𝑖(7)得到𝑟𝑎=13.36%十分小,故两组品酒员的评价结果总体上无显著性差异。5.1.3可信度分析模型的建立由于两组品酒员对部分几种葡萄酒的评价结果存在显著性差异,我们需要建立模型分析哪组的评价更加可信。我们利用方差可以反映同组10个品酒员对同种酒评价的波动程度,建立方差模型分析可信度。𝐺𝑖代表同组品酒员对第𝑖种葡萄酒评价总分的均数,𝑆2𝑖代表同组品酒员对第𝑖种葡萄酒评价总分的方差。𝐺𝑖=1𝑛𝑛∑︁𝑗=1𝐺𝑖𝑗(8)𝑆2𝑖=1𝑛−1𝑛∑︁𝑗=1(𝐺𝑖𝑗−𝐺𝑖)(9)方差越小,即波动程度越小,代表评价更客观。5.1.4可信度分析模型的求解求得两组各10个品酒员对55种葡萄酒评价总分的方差,以葡萄酒的种类为𝑥轴。方差为𝑦轴,画在同一张折线图中:6图3:两组品酒员评价的方差对比图发现第二组10位品酒员对55种不同葡萄酒的评价总分方差折线整体明显低于第一组10位品酒员对55种不同葡萄酒的评价总分方差折线,即第二组评分的波动程度普遍小于第一组,第二组的评价结果更可信。5.2问题二:酿酒葡萄分级模型5.2.1葡萄酒的分级1.分级标准的制定现在国际上对葡萄酒的分类流行用罗伯特·帕克的分类方法,即:表2:罗伯特·帕克分类法评分等级96-100分顶级葡萄酒90-95分具有高级品味特征和口感的葡萄酒80-89分品质优良,口感纯正70-79分一般,略有瑕疵60-69分低于一般50-59分次品可以认为是一款不合格的葡萄酒由于国际分类法是对评分为50-100的葡萄酒的分类,而本题中品酒员对葡萄酒的评分分布在60-85分之间,故我们将葡萄酒的分级作适当调整,得到适用于本题的葡萄酒分级标准:7表3:葡萄酒分级标准评分等级80-85分一级葡萄酒75-80分二级葡萄酒70-75分三级葡萄酒65-70分四级葡萄酒60-65分五级葡萄酒2.葡萄酒的分级结果将55中葡萄酒根据评分对应至五个等级中,得到红葡萄酒的分级如下表:表4:红、白葡萄酒的分级5.2.2基于Q型聚类的酿酒葡萄分类模型的建立1.数据标准化由于不同理化指标的单位不同,我们需要利用标准分数先对各理化指标的数据进行标准化:𝑍=𝐺𝑖𝑗−𝐺𝑖𝑆𝑖(10)得到矩阵𝑍,其中𝑧𝑖𝑗表示第𝑗个品酒员对第𝑖种葡萄酒评价总分经标准化后的数据。𝑧𝑖𝑗=⎛⎜⎜⎝𝑧11···𝑧1𝑗.........𝑧𝑖1···𝑧𝑖𝑗⎞⎟⎟⎠2.类间距离的定义在对有𝑝个理化指标的酿酒葡萄进行聚类分析的过程中,利用欧氏距离定义两类理化指标样本的距离𝑑𝑖𝑗,𝑑𝑖𝑗为第𝑖个酿酒葡萄𝑋𝑖与第𝑗个酿酒葡萄𝑋𝑗之间的距离。𝑑𝑖𝑗=⎯⎸⎸⎷𝑝∑︁𝛼=1|𝑋𝑖𝛼−𝑋𝑗𝛼|2(11)3.Q型聚类的实现8将距离最近的两个类合并为一个类,类的数目减一,直至当前的类数目为一。5.2.2基于Q型聚类的酿酒葡萄分类模型的求解1.酿酒葡萄的聚类图图4:红葡萄聚类图图5:白葡萄聚类图2.酿酒葡萄的聚类分析将红葡萄和白葡萄根据聚类图各分成六类:9表5:酒葡萄的分类5.2.3酿酒葡萄的分级酿酒葡萄的理化指标反映了葡萄的种类,同类葡萄质量相似,酿酒葡萄的质量又与葡萄酒的质量有密切的关系。所以我们将葡萄酒的分级与酿酒葡萄的分类结合,得到酿酒葡萄的分级。结果如下表:表6:红、白葡萄
本文标题:数学建模-葡萄酒评价优秀论文
链接地址:https://www.777doc.com/doc-1366995 .html