您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 理学 > 2012年数学建模a题论文
葡萄酒的评价摘要本文以葡萄酒的评价为研究对象,对葡萄酒的质量进行分析。通过运用配对样本t检验]1[]2[、K-均值聚类]3[和对比分析的方法,解决了与葡萄酒相关的问题。对于问题一:分析两组评酒员的评价结果有无明显差异,且哪组更可信。由于附件一中的数据过于庞杂,所以对数据进行了平均值处理。然后利用配对样本t检验的显著性P值来比较,最终可以得出第二组更为可靠。对于问题二:根据所酿酒葡萄的理化指标和质量对酿酒葡萄进行分级。因为附件二中的理化指种类标过于繁多,所以对理化指标做了随机选取性处理。然后利用K-均值聚类分析的方法,将葡萄进行分类。最后,可以得出酿酒葡萄的等级。对于问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。在众多指标数据中随机选取酿酒的红、白葡萄和红、白葡萄酒的理化指标数据。然后利用SPSS软件对所选数据进行散点图的绘制。最后通过运用MATLAB软件绘制拟合曲线。通过散点图与拟合曲线图的比较可以得到酿酒葡萄与葡萄酒的理化指标之间的联系。对于问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。在繁杂的数据中利用随机选取的方法对数据进行挑选,并与其相对应的质量一起利用MATLAB软件进行拟合曲线的绘制。最后通过对拟合曲线的分析,可以得出理化指标对质量的影响。关键词:葡萄酒平均值聚类分析拟合曲线一、问题重述1.1问题背景确定葡萄酒质量时一般是通过聘请一批有资质的评酒员进行品评。每个评酒员在对葡萄酒进行品尝后对其分类指标打分,然后求和得到其总分,从而确定葡萄酒的质量。酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。1.2问题条件附件1给出了某一年份一些葡萄酒的评价结果,附件2和附件3分别给出了该年份这些葡萄酒的和酿酒葡萄的成分数据。1.3需要解决的问题问题一:两组评酒员的评价结果有无显著性差异,哪组更可信;问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对酿酒葡萄进行分级;问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系;问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量;二、模型假设1.假设每位评酒员都是公平、公正的;2.假设给两组评酒员的各样品都是同样的;3.假设所给的所有数据都真实有效;4.假设酿酒的工艺差别等其他外界条件不影响葡萄酒的质量;5.假设所有评酒员在除去自身品酒水平以外,其他条件相同;三、符号说明为了便于问题的求解,我们给出以下符号说明:符号符号说明①0H总体均值差②X总体差的样本均值③xS修正样本标准差④P配对总体差显著性⑤S每组红、白葡萄酒各自方差⑥4,3,2,1iTi每组红、白葡萄酒各样品的平均值四、问题分析葡萄酒在生活中也是常见的一种酒。因为每个人的喜好不同,所以葡萄酒会有各种不同的种类。对这些不同种类的葡萄酒的质量我们请评酒员对此做出了评价。对于问题一:分析附件一中两组评酒员的评价结果有无显著性差异,且哪组更可信。对于这个问题,我们选择采用SPSS软件中的配对样本t检验这种方法。首先应对附录一中的各个数据进行整理。求出附录一中四个表的10个评酒员对各个样品酒评价分数的平均值,并将这四组平均值进行分类后和样品酒编号对应起来放在Excel表中。最后利用SPSS软件对这两组数据中的显著性进行观察,从而判断评出酒员的评价结果有无显著性差异。对于哪组更可信这个问题可以通过比较最终结果表中的方差来判断。对于问题二:根据酿酒葡萄的理化指标和葡萄酒的质量对这些酿酒葡萄进行分级。对于这个问题,我们选择采用SPSS软件中的K-均值检验这种方法。首先应对在附件二中对数据进行舍取,并将整理后的数据放在Excel中。最后利用SPSS软件对这组数据进行K-均值聚类。最后通过整理聚类后的结果列出等级表。对于问题三:分析酿酒葡萄与葡萄酒的理化指标之间的联系。对于这个问题,我们选择对比分析的方法。首先将附件二中酿酒的红、白葡萄和红、白葡萄酒的理化指标整理出来后放入Excel中,利用SPSS软件对所选数据进行散点图的绘制。再通过运用MATLAB软件绘制拟合曲线。最后通过对散点图和拟合曲线的对比分析得出结果。对于问题四:分析酿酒葡萄和葡萄酒的理化指标对葡萄酒质量的影响,并论证能否用葡萄和葡萄酒的理化指标来评价葡萄酒的质量。对于这个问题,我们选择对比分析的方法。首先将酿酒的红、白葡萄和红、白葡萄酒的理化指标中选取出的理化指标整理出来后放入Excel中,利用MATLAB软件对所选数据绘制拟合曲线,最后通过对散点图和拟合曲线的对比分析得出结果。五、模型的建立与求解经过以上对题目和问题的分析和准备,将进一步阐述模型的实际建立过程和求解。5.1异常数据处理在假设中提到数据要真实有效,所以在处理数据前要对所给数据进行检查。当数据中出面漏写、填多等失误时,采取平均值法。就是将该项的平均值求出后填入所失误的位置,以此来减少误差。在对第一组白葡萄酒的数据中的样品3进行评价时,第七个评酒员在持久性的评价中出现了异常。对异常数据进行处理:6911098654321yyyyyyyyyY①其中,Y为样品3中持久性的平均值;10,..,2,1kyk为第几个评酒员。在对第一组红葡萄酒的数据中的样品20进行评价时,第四个评酒员在色调的评价中出现了异常。对异常数据进行处理:6911098765321xxxxxxxxxX②其中,X为样品20中色调的平均值;10,..,2,1jXj为第几个评酒员。5.1.1模型一的建立与求解题中的附录一给出了27样红葡萄酒和28样白葡萄酒,且有每组10个评酒员分别对红、白葡萄酒进行评价的分数等数据。利用这些数据对这两组数据进行处理,从而判断有无显著性差别和哪组更好。5.1.2显著性模型的建立(1)数据处理、求取平均值先对附录一中的第一张表格(第一组红葡萄酒)进行处理。这组红葡萄酒共有27种样品,且这10个评酒员分别需要对这27种红葡萄酒进行评分,所以可以先对各样品中小指标的分数进行求和,算出每个人对各样品的评价分数。然后将这些分数和对应的样品放入Excel表中。并将这10个评酒员对各个样品的分数进行求和取平均值,从而得到27个与样品对应的平均值。用同样的方法可以得到其他三个表中的平均值。其中,两组葡萄酒的平均值为表1:表一两组葡萄酒的平均值样品酒第一组红葡萄酒(1T)第一组白葡萄酒(2T)第二组红葡萄酒(3T)第二组白葡萄酒(4T)162.78268.177.9280.374.27475.8380.485.374.675.5468.679.471.276.9573.37172.181.5672.268.466.375.5771.577.565.374.2872.371.46672.3981.572.978.276.81074.274.368.879.81170.172.361.671.41253.963.368.372.41374.665.968.873.914717272.677.11558.772.465.778.41674.97469.976.31779.378.874.580.31859.773.165.476.7197872.272.676.42078.677.875.876.62177.176.472.279.22277.27171.679.42385.675.977.177.4247873.371.576.12569.277.168.279.52673.881.37274.3277364.871.5772881.379.6(2)数据导入在算出四张表中每个样品所对应的平均值后,将第一组的红葡萄酒和第二组的红葡萄酒中的葡萄酒样品、每个样品所对应的平均值放在一个新的Excel表格中,并注释好每一列的名称。用同种方法也可以得到第一组白葡萄酒和第二组白葡萄酒的新表格。5.1.2模型的求解先将第一组红葡萄酒与第二组红葡萄酒所建的新表格导入SPSS软件中。通过运用SPSS软件中的配对样本t检验可以对两总体均值差的原假设写成:0:210VVH①其中1V、2V代表配对样本的总体,都是未知的。选择检验统计量并给出统计量的分布。假设总体服从正太分布,检验统计量是t统计量,其构成为:nSXtx②在总体差的样本均值和修正样本标准差中:niiiXXnX1211③2121211niiixXXXnS④当原假设为真时,1~ntt。SPSS软件会根据样本观测值自动计算t统计量的观测值,并根据统计量的分布自动计算统计量观测值发生的概率(p值)。其中,第一组与第二组红葡萄酒的显著性概率为表2;第一组与第二组白葡萄酒的显著性概率为表3:(代码见附录一)表2第一组与第二组红葡萄的显著性NCorrelationSiq第一组白葡萄平均值&第二组白葡萄平均值270.6930.000表3第一组与第二组白葡萄的显著性NCorrelationSiq第一组白葡萄平均值&第二组白葡萄平均值280.2650.173观察表可知:在表1中可得000.0P,因为当P值(配对总体差显著性)小于0.05时,说明配对总体间均值有显著差异,反之无明显差异。由此可以得出:a.对于红葡萄酒的评分有显著性差异;b.对于白葡萄酒的评分无显著性差异;5.1.3优劣性评价模型的建立与求解在通过SPSS软件得出P值得同时,也会出现这两组中红、白葡萄各自的方差。比较这些方差可以选出哪组更可信。其中,两组各自红葡萄酒的方差为表4、两组各自白葡萄酒的方差为表5。表4两组各自红葡萄酒的方差meamNStd.DeviationStd.Errormean第一组红葡萄酒平均值72.952277.35031.4146第二组红葡萄酒平均值70.515273.97800.7656表5两组各自白葡萄酒的方差meamNStd.DeviationStd.Errormean第一组白葡萄酒平均值74.26285.2010.983第二组白葡萄酒平均值76.721282.51370.4750观察表可知:第一组红葡萄酒的方差3503.71S;第二组红葡萄酒的方差9780.32S;第一组白葡萄酒的方差201.53S;第二组白葡萄酒的方差5137.24S;由此数据可知:21SS;43SS;因为只有在方差越小时它的可行度才越高,所以我们得出第二组的更可信。5.2模型二的建立与求解在同样稳定的制造工艺下,不同的酿酒葡萄会酿出不同质量的酒。因此可以对酿酒葡萄的质量进行等级分类。5.2.1模型的建立(1)数据舍取从香气、外观、口感、保鲜度这四个角度考虑,选取了白黎芦醇、果皮颜色、黄酮醇、单宁这四个具有代表性的指标作为检验的数据。(表见附录二)(2)数据的导入在进行数据的舍取整理后,将这些新数据放入Excel中,并标注好表头。最后将该表导入SPSS软件中。5.2.2模型的求解在SPSS软件中运用K-均值聚类检验,首先对导入数据进行处理,从而得到酿酒葡萄的分类等级。通过聚类分析的原理:定义iD与jD之间的距离为两类最近样品的距离:ijDxDxijfFjjii,min⑤设类qD与pD合并成一个新类记为rD,则任一类nD与rD的距离为:rjniDxDxnrF,min⑥qpqpijDxDxijDxDxijFFfffpjniqjni,minmin,minmin,,⑦最短距离法进行聚类分析的步骤如下:(a)计算样品的两两距离,得一距离阵记为0F,开始每个样品自成一类,这时ijijfF。(b)找出最小距离,设为qpF,则将qD和pD合并成一个新类,记为rD,即pqrDDD,。(c)按上式计算新类与其他类的距离。(d)重复(b)、(c)两步,直到所有元素并成一类为止。如果某一步距离最小距离不止一个,则对应这些最小距离的类可以同时合并。模型求解结果:按评分从高到底,将红、白葡萄酒依次分为优秀、良好、较差这三个等级。红葡
本文标题:2012年数学建模a题论文
链接地址:https://www.777doc.com/doc-1280737 .html