您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 数据挖掘中聚类分析的技术方法_梁志荣
* 2006-12-25,2007-04-01**,,1965,,:。:1003-5850(2007)06-0037-03TechniqueofClusterAnalysisinDataMining梁志荣(肇庆学院现代教育技术中心 肇庆 526061)【 】数据挖掘是信息产业界近年来非常热门的研究方向,聚类分析是数据挖掘中的核心技术。对各种聚类算法进行了分类,对代表算法作了详细的分析,并对这些算法从多个方面进行了比较,从而为研究和在不同领域使用这些算法提供了参考。同时还阐述了聚类分析在数据挖掘中的应用。【】数据挖掘,聚类分析,聚类算法:TP311:AABSTRACT Dataminingisoneofthefocusresearchininformationindustryinthelatestyears.Clusteranalysisisthecoretechniqueofdatamining.Thispaperanalysestheclusteranalysismethodandrepresentationclusteralgorithmintheareaofdatamining,comparesthealgorithmcapability,providesreferenceforresearchinganduseingthesealgorithmsindifferentfields,andalsoexpatiatestheapplicationoftheclusteranalysisindatamining.KEYWORDS datamining,clusteranalysis,clusteralgorithm (DataMining)2080,、、、、、、,。、、、、、、[1]。“”,“,”。,,。,,。,,。1 ,。、、、[2]。1.1 n,k。(),Jaccard。k-means、k-modes、CLARACLARANS。。1.2 ,,。,。,(),,。,。1.3 。,,,。DBSCAN,OPTICSDENCUE。1.4 。(cell),。·37· 20 6(411)(WaveCluster)(CIQUE)。1.5 ,。COBWEB(SOFM)。2 2.1 CLARANSCLARANS[3]CLARA。CLARA,,,。,,。,。O(n2)。2.2 CURECURE[4],“”,。,,CURE。,,CURE,。CUREO(n)。2.3 BIRCHBIRCH。(CF)。Nd{xi}(i=1,2,3,...,N),:CF=(N,LS,SS)N;LSN(∑Ni=1oi),,SS(∑Ni=1o2i),。CFBT,。,。BIRCH、、、,,O(n)。2.4 DBSCANDBSCAN[5],“”。DBSCANε-。PX-MinPts,P。,,。,DBSCANO(nlogn)。2.5 STINGSTING,。,,:。。:count;m(),s(),min(),max(),(distribution)。STING,。,。STING,O(n)。2.6 COBWEBCOBWEB,-。,。P(Ai=Vij|Ck),Ai=Vij-,Ck。。COBWEB——。:∑nk=1P(Ck)[∑i∑jP(Ai=Vij|Ck)2-∑i∑jP(Ai=Vij)2]nn{C1,C2,…,Cn}、“”。2.7 FCM,·38·(412)2007 ,,,。,,。CFCM(FuzzyC-Means)[6]。FCM,:Jf=∑cj=1∑ni=1[_j(xi)]b‖xi-mj‖2(1),b1。1,∑cj=1_j(xi)=1,i=1,2,…,n(2)(2)(1),Jfmi_j(xi)0,:mj=∑ni=1[_j(xi)]bxi∑ni=1[_j(xi)]b,j=1,2,…,c,(3)_j(xi)=(1/‖xi-mj‖2)1/(b-1)∑ck=1(1/‖xi-mk‖2)1/(b-1),i=1,2,…,n j=1,2,…,c。(4)(3)(4),FCM。,,。3 ,1、、“”、、。,。1 “”CLARANSCUREBIRCHSTINGDBSCANCOBWEBFCM4 :①,。,。②,,。、、、。,,。,。,。,。[1],.:[M].:,2001.[2].[J].,2001(2):34-37.[3]MHalkidi,YBatistakis,MVazirgiannis.Clusteringalgorithmsandvaliditymeasures.IEEE,2001:3-22.[4]GEHRKEJ,AGRAWALR,GUNOPULOSD.AutomaticSubspaceClusteringofHighDimensionalDatafromDatacaitons[J].ACMSIMOD,1998,72(2):94-105.[5]NgRT,CALBERSONJ.EfficientandEffectiveClusteringMethodsforSpatialDataMining[A].In:PorcoftheV[C].Santiago,Chile,1994:144-155.[6],.()[M].:,2002. 《》200746480,,、!:(0351)8725025E-mail:DNKF@chinajournal.net.cn·39· 20 6(413)
本文标题:数据挖掘中聚类分析的技术方法_梁志荣
链接地址:https://www.777doc.com/doc-5118782 .html