您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > kmeans算法(算法+数据+代码)
K-means聚类算法聚类分析概念1K-means算法2K-means实验-国民健康3K-means实验-图像分割4K-means实验-商户评级5目录1.聚类分析概念聚类与分类的不同在于:分类简单来说,就是根据文本的特征或属性,划分到已有类别中。也就是说,这些类别是已知的,通过对已知分类的数据进行训练和学习,找到这些不同类的特征,再对未分类的数据进行分类。聚类的理解更简单,就是你压根不知道数据会分为几类,通过聚类分析将数据或者说用户聚合成几个群体,那就是聚类了。聚类不需要对数据进行训练和学习。2.K-means算法Q1:K是什么?A1:k是聚类算法当中类的个数。Summary:Kmeans是用均值算法把数据分成K个类的算法!Q2:means是什么?A2:means是均值算法。2.K-means算法距离的定义欧式距离:N维空间点或向量的距离曼哈顿距离:城市街区距离夹角余弦:向量方向的差异相关系数:信息熵:221212d=()yy(x-x)1212dxxyycosabab2.K-means算法K-means算法详解步骤一:取得k个初始中心点从数据中随机抽取k个点作为初始聚类的中心,由这个中心代表各个聚类2.K-means算法K-means算法详解MinofthreeduetotheEuclidDistance步骤二:把每个点划分进相应的簇根据欧氏距离最小原则,把每个点划分进相应的簇2.K-means算法K-means算法详解MinofthreeduetotheEuclidDistance步骤三:重新计算中心点根据均值等方法,重新计算每个类的中心点2.K-means算法K-means算法详解步骤四:迭代计算中心点重复第二步和第三步2.K-means算法K-means算法详解步骤五:收敛聚类中心不再发生移动3.K-means实验-国民健康数据示意图国家和地区婴儿死亡率(‰)出生时平均预期寿命/岁1990年2000年2006年1990年2000年2006年中国36.329.920.168.970.372中国香港77.480.981.6孟加拉国1006651.654.86163.7文莱108874.276.277.1柬埔寨84.57864.854.956.558.9印度806857.459.162.964.5印度尼西亚603626.461.765.868.2伊朗54363064.868.970.7以色列105.64.276.67980日本4.63.22.678.881.182.3哈萨克斯坦50.537.125.868.365.566.2朝鲜42424269.966.867韩国854.571.375.978.5老挝120775954.660.963.9马来西亚16119.870.372.674蒙古78.547.634.262.765.167.2缅甸917874.45960.161.6巴基斯坦1008577.859.16365.2菲律宾41302465.669.671.4新加坡6.72.92.374.378.179.9斯里兰卡25.616.111.271.273.675泰国25.711.77.26768.370.2越南382314.664.869.170.8埃及66.74028.962.268.871尼日利亚12010798.647.246.946.8南非45505661.948.550.7加拿大6.84.977.479.280.4墨西哥41.531.629.170.97474.5美国9.46.96.575.27777.8[X,textdata]=xlsread('examp09_04.xls');row=~any(isnan(X),2);X=X(row,:);countryname=textdata(3:end,1);countryname=countryname(row);X=zscore(X);startdata=X([8,27,42],:);idx=kmeans(X,3,'Start',startdata);[S,H]=silhouette(X,idx);代码轮廓图聚类结果3.K-means实验-国民健康4.K-means实验-图像分割灰度图代码分割后二值图像4.K-means实验-图像分割真彩图4.K-means实验-商户评价数据示意图代码大众点评网上1000家商户的评分4.K-means实验-商户评价聚类结果MINMAX67.4666677.96666756.3666676.945.36.33333336.8333337.43333327.9666678.46666718.4333339.333333谢谢
本文标题:kmeans算法(算法+数据+代码)
链接地址:https://www.777doc.com/doc-4645341 .html