您好,欢迎访问三七文档
聚类分析练习题练习题一假设数据挖掘的任务是将8个点聚类成3个簇,A1(2,10),A2(2,5),A3(8,4),B1(5,8),B2(7,5),B3(6,4),C1(1,2),C3(4,9),距离函数是欧几里得距离。假设初始选择A1,B1,C1分别作为每个聚类的中心,用k—平均算法来给出:1.第一次循环执行后的三个聚类中心;2.最后的三个簇。答:1.第一轮A1(2,10)B1(5,8),A3(8,4),B2(7,5),B3(6,4),C2(4,9)C1(1,2),A2(2,5)对应中心分别是(2,10),(6,6),(1.5,3.5)2.最后结果:{A1(2,10),B1(5,8),C2(4,9)}{A3(8,4),B2(7,5),B3(6,4)}{C1(1,2),A2(2,5)}练习题二给定6维分类样本C=(A,B,A,B,A,A),D=(B,B,A,B,B,A),试求:1.样本间相似性的简单匹配系数;Jaccard系数。答:A的编码为0、B的编码为1101220021.所以简单匹配系数d(A,B)=(2+0)/(2+2+0)=1/22.Text1Text2Text3Text4Text5Text6cABABAAdBBABBAD(c,d)=(B+B+A+A)/(A+B+B+A+B+A+B+A)=1/2
本文标题:聚类分析练习题
链接地址:https://www.777doc.com/doc-4813008 .html