您好,欢迎访问三七文档
封面院校:湖南理工学院题目:畅销品问题队员:杨洁熊翠文张志畅销品判断摘要:解决这道题我们使用SPSS软件与matlab软件进行分析。。主要采用以下两种方法,方法一:贝叶斯判断法,进行系数的判定。该模型构造了类别与商品的式样、包装和耐久性之间的线性关系函数,并由得到的函数判断新厂家产品的得分情况,判断产品是否受欢迎。方法二:classify函数判别法,在matlab软件中用已有的classify函数直接进行判定,该方法操作简便不但能明确的反映各个影响因素之间的关系,而且能快速判断产品的。且利用判别分析法,可预测到产品所属概率型。关键字:聚类分析贝叶斯判断信度分析目录一、问题重述与分析......................................41.1问题重述..........................................41.2问题分析..........................................4二、模型建立求解与分析...................................42.1模型假设..........................................42.2符号说明..........................................52.3模型建立..........................................52.4模型求解..........................................5三、模型评价与改进.......................................73.1模型分析与评价....................................73.2误差分析..........................................83.3模型改进..........................................9四、参考文献...........................................10一、问题重述与分析1.1问题重述某种产品的生产厂家有12家,其中7家的产品受消费者欢迎,属畅销品,定义为1类;5家的产品不受欢迎,属滞销品,定义为2类。将12家的产品的式样,包装和耐久性进行了评估后得分如下:厂家123456789101112式样978889743631包装867599546342耐久性768573646352类别111111122222今有一新厂家,得分为(6,4,5),该产品是否受欢迎。分析已给出的数据,并根据新厂家的产品的各项得分判断该厂家的产品是畅销品还是滞销品。1.2问题分析本题讲述的是畅销品判断问题,这道题所要解决的问题是日常生活中常见的问题,无论是商家还是顾客都很关注商品的畅销问题。一般的,商品是否畅销取决于商品的式样、包装和耐久性,这三个方面既是吸引顾客的主要因素,也是商品好坏的评判标准。本题给出实际问题的可能影响因素,并给出实际数据供我们分析,得出判断的函数。并由得到的函数判断新厂家产品的得分情况,判断产品是否受欢迎。二、模型建立求解与分析2.1模型假设从表格中可以看出有三个因素影响着类别的判断,故作出如下假设:﹙1﹚三个因数中由某个或多个对产品是否畅销起作用,不考虑其它因数﹙2﹚给出的数据是准确的没有记录错误2.2符号说明x1:表示式样得分x2:表示包装得分x3:表示耐久性得分a:表示x1系数b:表示x2系数c:表示x3系数d:常数项z1:表示产品为畅销品的判别函数z2:表示产品为滞销品的判别函数2.3模型建立根据模型假设中的分析则建立式样、包装、耐久性对产品为畅销品或是滞销品的一次线性函数关系,其形式如下:畅销品判断函数13121111dx*cx*bx*az(1)滞销品判断函数23222122dx*cx*bx*az(2)2.4模型求解方法一:贝叶斯判断法打开SPSS软件将表格中的数据录入表格中,并保存生成文件cxp.sav,对数据文件进行聚类分析,对数据进行UnivaritateANOVAs单变量方差或者Box’sM的描述性统计,函数系数用贝叶斯判断,在对数据进行统计分析时函数系数选择Fisher’s方法得到先验概率表如下PriorProbabilitiesforGroups.50077.000.50055.0001.0001212.000类别1.002.00TotalPriorUnweightedWeightedCasesUsedinAnalysis表(1)其中类别1和类别2的先验概率均为0.5当对数据进行K_Means分析时得到两类中的各个因素凝聚点的值如下图所示:FinalClusterCenters8.003.837.003.836.004.17式样包装耐久性12Cluster表(2)由贝叶斯线性判别函数得到1z和2z两函数的各个因素的系数如下表所示:ClassificationFunctionCoefficients4.4831.861.698.4662.2651.467-27.862-7.677式样包装耐久性(Constant)1.002.00类别Fisher'slineardiscriminantfunctions表(3)故得到模型建立函数如下:畅销品判断函数27.862-x*2.265x*0.698x*4.483z3211(3)滞销品判断函数7.677-x*1.467x*0.466x*1.861z3212(4)使用模型求解实际问题:任意代入(x1,x2,x3)到函数1z、z2中得到两个函数值分别1z、2z,比较1z、2z的大小,若1z2z,则产品为畅销品,若1z2z,则为滞销品。把(6,4,5)直接带入到上述两个函数得到1z=13.1530、2z=12.6880由于z1z2故该厂家产品为畅销品。为了测试模型的正确性任意输入其他数据测试模型的正确性:⑴如测试数据(7,5,6)代入到1z、z2两个方程中得到1z=20.5990、2z=16.4820,则判断得出该厂家产品为畅销品;⑵如测试数据(2,3,4)代入到1z、z2两个方程中得到1z=-7.7420、2z=3.3110则判断得出该厂家产品为滞销品。利用判别分析,预测到的结果完全一致。方法二:classify函数判别法用matlab中的classify函数直接求解,文件cxp.m程序如下:clear,clcsample=input('sample=');%输入要测试的产品training=[9,8,7;7,6,6;8,7,8;8,5,5;8,9,7;9,9,3;7,5,6;4,4,4;3,6,6;6,3,3;3,4,5;1,2,2];%将表格中的数据按列优先输入group=[1;1;1;1;1;1;1;2;2;2;2;2];%将键入每个厂家的产品的分类class=classify(sample,training,group)%用classify函数需要测试的产品的分类在命令行输入[6,4,5]运行结果:class=1故该厂家产品为畅销品。再输入其它数据如(7,5,6)、(2,3,4)分别得出两个数据测试的class值为12则判定两个厂家的产品分别为畅销品和滞销品。三、模型评价与改进3.1模型分析与评价经SPSS软件中的分析得到各个因素对于产品畅销与滞销影响的程度如下表所示:TestsofEqualityofGroupMeans.21835.882110.000.47311.144110.008.6904.487110.060式样包装耐久性Wilks'LambdaFdf1df2Sig.表(4)其中wilks'Lambda值越小说明该因素对模型的影响效果就越显著。由表可得式样对产品的畅销与滞销影响效果最明显,包装次之,耐久性影响效果最不显著。另外还可以从另一个角度来分析,式样和包装的Sig值均小于0.05,且式样的Sig值最小,故影响效果最明显,包装的Sig值稍大,故影响效果较好,耐久性的Sig值大于0.05故影响效果最不显著。模型中耐久性对产品是畅销品还是滞销品的影响不大,但是由下表所示的wilks'Lambda可知该模型的总体情况还不错。Wilks'Lambda.19214.0123.003TestofFunction(s)1Wilks'LambdaChi-squaredfSig.表(5)优点:利用贝叶斯判断法,构造了合理函数,为产品的判定提供了更准确的依据,减少了评价的误差,为消费者和厂家提供了清晰、准确的关系图,有利于产品的综合评定。3.2误差分析对数据用SPSS软件进行方差分析,分析后输出方差表如下所示:ANOVA56.09012.0761127.021.00032.39712.4391113.281.00410.85912.439114.452.059式样包装耐久性MeanSquaredfClusterMeanSquaredfErrorFSig.TheFtestsshouldbeusedonlyfordescriptivepurposesbecausetheclustershavebeenchosentomaximizethedifferencesamongcasesindifferentclusters.Theobservedsignificancelevelsarenotcorrectedforthisandthuscannotbeinterpretedastestsofthehypothesisthattheclustermeansareequal.表(6)由表中的F值和Sig值可以看出式样的F值和Sig值为27.021、0.000和包装的F值和Sig值为13.281、0.004均,而耐久性的Sig值为0.059大于0.05,故耐久性对产品是畅销品还是滞销品判断的影响不大反而对模型起到了反面作用,引起较大的误差,降低模型的准确性。用SPSS软件做一次信度分析,得到总体内在信度分析表如下:ReliabilityStatistics.8143Cronbach'sAlphaNofItems表(7)Cronbach’sAlpha值为0.814,虽然数值大于0.7但是不足0.9,故模型不是很合理。Item-TotalStatistics10.8313.424.706.72211.7521.477.557.85211.2515.295.789.614式样耐久性包装ScaleMeanifItemDeletedScaleVarianceifItemDeletedCorrectedItem-TotalCorrelationCronbach'sAlphaifItemDeleted表(8)再通过表(8),我们看到最后一列,耐久性这个条目被删除后,另外两个的因数层面系数都有所降低了,说明耐久性对厂品是否畅销没有强烈的相关性。3.3模型改进改进后方法一:由上模型分析可得耐久性对产品是畅销品还是滞销品的影响程度并不大,所以,只考虑式样与包装对产品是畅销品还是滞销品判断的影响。用SPSS软件再做一次聚类分析,只考虑式样和包装两个因素的影响得到函数系数表如下:ClassificationFunctionCoefficients4.0031.5511.507.990-21.978-5.210式样包装(Constant)1.002.00类别Fisher'slineardiscriminantfunctions表(9)可得到新的判别函数如下:畅销品判断函数978.21*507.1*003.421'1xxz(5)滞销品判断函数21.5*990.0*551.121'2xxz(6)将(6,4,5)代入'1z、'2z得到两个值'1z=8.0680、'2z=8.0560,'1z'2z得到该厂家的产品属于畅销品,受消费者欢迎。当代入(7,5,6)得'1z=13.5780、'2
本文标题:产品畅销判别
链接地址:https://www.777doc.com/doc-4616225 .html