您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 其它文档 > 应用多元统计朱建平第二版第四章答案
某超市经销十种品牌的饮料,其中有四种畅销,三种滞销,三种平销。下表是这十种品牌饮料的销售价格(元)和顾客对各种饮料的口味评分、信任度评分的平均数。销售情况产品序号销售价格口味评分信任度评分畅销158267339486平销576687798滞销8349421043⑴根据数据建立贝叶斯判别函数,并根据此判别函数对原样本进行回判。⑵现有一新品牌的饮料在该超市试销,其销售价格为,顾客对其口味的评分平均为8,信任评分平均为5,试预测该饮料的销售情况。解:贝叶斯判别法,由SPSS可得表1和表2表1分类函数系数销售情况畅销贫销滞销销售价格口味评分信任度评分(常量)Fisher的线性判别式函数如表1所示,销售情况栏中的每一列表示样品判入相应列的贝叶斯判别函数系数。则各类的贝叶斯判别式函数如下:第一组:F1=––++第二组:F2=––++第三组:F3=––++将样品的自变量代入上述三个贝叶斯判别函数,得到三个函数值,分别为:F1=,F2=,F3=比较三个值,可以看出F2=最大,据此可以得出该待判样品应该属于第2组。则改新品牌的饮料在该超市试销的销售情况是贫销。表2按照案例顺序的统计量案例数目最高组判别式得分P(Dd|G=g)实际组预测组pdfP(G=g|D=d)到质心的平方Mahalanobis距离函数1函数2初始111.5132.932211.9952.829.011311.5312.974412**.7342.714.619.791521**.5352.633.176622.9512.822.100.721722.3422.985833.2602933.5382.5481033.8112.418.69311未分组的2.1652.597.825.969**.错误分类的案例由表2可得,产品4和产品5实验组和预测组数据不同,且预测组数据上带有**,其中**表示错误分类的案例。产品4实际被分为第一组“畅销”中,预测出来的却被分到第二组“贫销”中;产品5实际是被分入第二组“贫销”中,预测出来的结果却被分到第一组“畅销”中;其他产品实际结果和预测结果保持一致。银行的贷款部门需要判别每个客户的信用好坏(是否未履行还贷责任),以决定是否给予贷款。可以根据贷款申请人的年龄(1X)、受教育程度(2X)、现在所从事工作的年数(3X)、未变更住址的年数(4X)、收入(5X)、负债收入比例(6X)、信用卡债务(7X)、其它债务(8X)等来判断其信用情况。下表是从某银行的客户资料中抽取的部分数据,⑴根据样本资料分别用距离判别法、Bayes判别法和Fisher判别法建立判别函数和判别规则。⑵某客户的如上情况资料为(53,1,9,18,50,,,),对其进行信用好坏的判别。目前信用好坏客户序号1X2X3X4X5X6X7X8X已履行还贷责任12317231234117359342272341.9443911954853519134未履行还贷责任6371132472911314283221167592822323102614327.36⑴费希尔判别法,由SPSS可得表3和表4表3典型判别式函数系数函数1年龄受教育程度现在所从事工作的年数.173未变更地址的年数收入.024负债收入比例.710信用卡债务.792其他债务(常量)非标准化系数表4组质心处的函数目前信用好坏函数1已履行还债责任未履行还债责任在组均值处评估的非标准化典型判别式函数由表3可知,费希尔判别函数为Y=––++–+++–将待判的资料数据代入上式中,可得Y=—,再将该数据和表4中的数据进行比较,该数据比较接近–,属于第一组,其信用好坏是已履行还债业务。⑵贝叶斯判别法,由SPSS可得表5表5分类函数系数目前信用好坏已履行还债责任未履行还债责任年龄.340.184受教育程度现在所从事工作的年数未变更地址的年数收入负债收入比例信用卡债务其他债务(常量)Fisher的线性判别式函数由表5贝叶斯判别系数可知,GROUP(目前信用好坏)栏中的每一列表示样本判入相应列的贝叶斯判别函数系数。则各类的贝叶斯判别函数如下:F1=–+++–++––F2=–+++–++––将样品的自变量值代入上述两个贝叶斯判别函数,则F1=59.3954F2=比较这两个值,可以看出F=最大,据此得出该待判样品应该属于第一组,即其信用好坏是已履行还债业务。⑶个案观察结果表,由SPSS可得表6由表6可知,预测组和实际组相同,没有出现误差。即该客户的信用度是好的,已履行还款业务。表6按照案例顺序的统计量案例数目最高组第二最高组判别式得分P(Dd|G=g)实际组预测组pdfP(G=g|D=d)到质心的平方Mahalanobis距离组P(G=g|D=d)到质心的平方Mahalanobis距离函数1初始111.7731.0832.000211.4851.4882.000311.5701.3222.000411.8671.0282.000511.9931.0002.000622.8101.0581.000722.0361.8381.162.337822.8411.0401.000922.4871.4831.0001022.14911.00011未分组的1.00012.000从胃癌患者、萎缩性胃炎患者和非胃炎患者中分别抽取五个病人进行四项生化指标的化验:血清铜蛋白1X、蓝色反应2X、尿吲哚乙酸3X和中性硫化物4X,数据见下表。试用距离判别法建立判别函数,并根据此判别函数对原样本进行回判。类别病人序号1X2X3X4X胃癌患者12281342011224513410403200167122741701507851001672014胃炎患者萎缩性622512571471301006128150117769120133102610160100510非胃炎患者1118511551912170125641316514253141351082121510011772解:在假设各类出现的先验概率相等且误判造成的损失也相等时,距离判别法与bayes判别法是完全一致的。用spss得出以下结论:根据判别分析的结果(见表7)建立Bayes判别函数:表7分类函数系数类别胃癌患者萎缩性胃炎患者非胃炎患者血清铜蛋白.164.130.130蓝色反应.753.595.637尿吲哚乙酸.778.317.100中性硫化物.073.012(常量)Fisher的线性判别式函数由表中每一列表示样本判入相应类的Bayes判别函数系数。由此可建立判别函数如下:Group1:4073.03778.02753.01164.0212.791XXXXYGroup2:4012.03317.02595.01130.0721.462XXXXYGroup3:4059.03100.02637.01130.0598.493XXXXY将各样品的自变量值代入上述三个Bayes判别函数,得到三个函数值。比较这三个函数值,哪个函数值比较大就可以判断该样品判入哪一类。表8按照案例顺序的统计量案例数目最高组第二最高组判别式得分P(Dd|G=g)实际组预测组pdfP(G=g|D=d)到质心的平方Mahalanobis距离组P(G=g|D=d)到质心的平方Mahalanobis距离函数1函数2初始111.4292.9982.002211.4192.9772.021311.5752.9992.000413**.1002.5781.265.430511.7882.999.4752.001.008622.4022.4573.403.161722.4382.7003.300823**.9032.518.2052.480.356922.4162.6621.169.323.9321022.5652.6163.384.7861132**.9912.616.0173.379.987.4281233.8692.681.2802.3141333.2362.8392.1441433.4632.5872.413.0901533.8112.583.4192.417根据此判别函数对样本进行回判,结果如表8。由表8个案观察结果表可知,病人序号4实际是第一组“胃癌患者”,被判为第3组“非胃炎患者”;病人序号8实际是第二组“萎缩性胃炎患者”,被判为第3组“非胃炎患者”;病人序号11实际是第三组“非胃炎患者”,被判为第二组“萎缩性胃炎患者”。
本文标题:应用多元统计朱建平第二版第四章答案
链接地址:https://www.777doc.com/doc-5810662 .html