您好,欢迎访问三七文档
1模糊聚类分析一.数据规格化;二.构造模糊等价矩阵.2数据规格化常用的数据规格化方法有如下几种:1.数据标准化(i)对特性指标矩阵U*的第j列,计算(ii)作变换则以uij作为元素的特性指标矩阵就是数据规格化的特性指标矩阵,记作U*=(uij)n×mmjuunununijijjniijj,...,2,11,11221mjniuuujjijij,...,2,1;,...2,1,目录32.均值规格化(i)对U*的第j列,计算(ii)作变换则U*=(uij)n×m为规格话后的特性指标矩阵.nijijjuun121mjniuujijij,...,2,1;,...,2,1,43.最大值规格化(i)对U*的第j列,计算则U*=(uij)n×m为规格化后的特性指标矩阵.还有中心规格化、极差规格化、对数规格化等.4,3,2,1;5,...,2,1,jiMuujijij5构造模糊等价矩阵设被分类对象的集合为U={u1,u2,…,un},每一个对象ui有m个特性指标(即反映对象特征的主要指标),并记ui={ui1,ui2,…,uim},i=1,2,…,n其中uij表示第i个对象的第j个特性指标,则n个对象的所有特性指标构成一个矩阵,记作称U*为U的特性指标矩阵.nmnnmmuuuuuuuuuU212222111211*目录6构造模糊相似矩阵设数据uij(i=1,2,…,n;j=1,2,…,m)均已规格化,下面用多元分析的方法来确定对象ui=(ui1,ui2,…,uin)和uj=(uj1,uj2,…,ujn)之间的相似程度rij=R(ui,uj)[0,1],(i=1,2,…,n;j=1,2,…,m)从而构造出一个对象与对象之间的模糊相似矩阵nmnnmmrrrrrrrrrR212222111211目录7下面介绍几种确定的常用方法.1.相似系数法相似系数法包括:数量积法、夹角余弦法、相关系数法、指数相似系数法、非参数相似程度法等等,例如,(2)交角余弦法(3)相关系数法niuuuuuurmiikijijiij,...,2,1,,2112其中mkjikmkiikmkijkiikijuuuuuuuur1212182.距离法设d(ui,uj)表示对象ui和uj的距离,则d(ui,uj)越大,rij就越小,而d(ui,uj)越小,rij就越大。一般地,可取rij=1-c(d(ui,uj))其中c和是两个适当选取的正数,使rij∈[0,1]。在实际应用中,常采用如下距离来确定rij目录911122111(1)Chebyshev:,max;(2)Hamming,;(3)Euclid,;,,(4)Minkowski:1.ijikjkkmmijikjkkmijikjkkmppijikjkkduuuuduuuuduuuuduuuup距离距离:距离:距离其中103.贴近度法当对象ui=(ui1,ui2,…,uim)为模糊向量(即uik∈[0,1])时,ui与uj的相似程度rij可由如下方法确定(1)最大最小法(2)算术平均最小法(3)几何平均最小法;;21;111111mkjkikmkjkikijmkjkikmkjkikijmkjkikmkjkikijuuuuruuuuruuuur目录114.主观评定法在一些实际问题中,被分类对象的特性指标是定性指标,这是可请有关专家和有实际经验的人员用评分的办法来主观评定被分类对象间的相似程度。12模糊关系的合成运算定义:设R∈F(U×V),Q∈F(V×W),则对R,Q的合成R◦Q∈F(U×W),定义为R◦Q(u,w)=∨v∈V[R(u,v)∧Q(v,w)](1)若R∈F(U×U),则记R0=I,Rn=Rn-1◦R(n=1,2,…);(2)若R=(rij)m×n,Q=(qjk)n×l,则R◦Q=(pik)m×l,其中即pik为R中第i行的元素与Q中第j列的元素对应取小后再取大而得到.lkmiqrpjkijnjik,...,2,1;,...,2,11目录13例1设U={u1,u2,u3,u4}为生产资料商品集,V={v1,v2}为两种消费品的集合,W={w1,w2,w3}为三个市场的细分,以R表示U到V的原料供应关系,以Q表示V到W的市场占有关系.若取试求生产资料对市场的间接占有关系R◦Q.82.053.047.024.045.038.0,60.025.063.012.080.030.040.060.0QR14解:由定义3.1.6(2)知82.060.024.025.053.060.045.025.047.060.038.025.082.063.024.012.053.063.045.012.047.063.038.012.082.080.024.030.053.080.045.030.047.08.038.030.082.04.024.060.053.040.045.060.047.04.038.060.0QR60.053.047.063.053.047.080.053.047.040.045.040.060.024.053.025.047.025.063.012.053.012.047.012.080.034.053.030.047.030.040.024.040.045.040.038.015模糊关系的传递性定义:设R∈F(U×U),则(1)R称为传递的,如果R◦RR(2)称包含R的最小的传递模糊关系为R的传递闭包,记作t(R).例3.2.3设U={u1,u2,u3},R∈F(U×U),且则R2=R,故R是传递的模糊矩阵.3.0003.02.003.02.01.0R目录16定理3设U={u1,u2,…,un},R∈F(U×U),则若R是自反的,则m≥n,有t(R)=Rm由此可见,当R为自反模糊关系时,必有自然数m≥n,使t(R)=Rm下面介绍一种快速求m的方法------平方自合成法:第一步:R◦R=R2R,则t(R)=R;否则,进行如下第二步.第二步:R2◦R2=R4R2,则t(R)=R2;否则,进行如下第三步.第三步:R4◦R4=R8R4,则t(R)=R4;否则,进行如下一步,如此继续下去,必有自然数k,使2k-1n≤2k且RR2R4…R2k=t(R)即对于n阶自反模糊矩阵,至多只需进行k=[log2n]+1步平方合成运算就可达到t(R),因此,可取m=2k,k=[log2n]+1这里[log2n]表示不超过log2n的最大整数.例如当n=30时,至多只需平方合成5次便可达到目的.目录17例2设).(,13.03.01.02.012.03.01.03.012.02.01.03.01RtR试求目录18模糊分类下面我们介绍四种常用的模糊分类方法.1.模糊传递闭包法(1)利用平方自合成方法求(2)对t(R)中的元素从大到小进行排序,设为1=12m()()ijnntRr19(3)对=i(i=1,2,…,m),求出t(R)的-截矩阵然后按t(R)进行分类,所得到的分类就是在水平上的等价分类,具体聚类原则为:若,则在水平上将对象ui和对象uj归为同一类.(4)画动态聚类图为了能直观地看到被分类对象之间的相关程度,通常将t(R)中所有互不相同的元素=i(i=1,2,…,m)水平上的等价分类画在同一个图上,即得动态聚类图.ijijijrrr当当,0,11ijr目录()(),1,;0,.ijnnijijijtRrrrr这里1ijr20例1考虑某环保部门对该地区五个环境区域U={u1,u2,u3,u4,u5},按污染情况进行分类,设每个区域包含空气、水分、土壤、作物四个要素,环境区域的污染情况有污染物在四个要素中的含量超过的程度来衡量。设这五个环境区域的污染数据为u1=(80,10,6,2),u2=(50,1,6,4),u3=(90,6,4,5),u4=(40,5,7,3),u5=(10,1,2,4)试用模糊传递闭包法对U进行分类。21解:由题设知特性指标为污染物在空气、水分、土壤、作物这四个要素中的含量.其特性指标矩阵为(1)数据规格化采用最大值规格化,作变换把U*规格化为42110375406469046150261080*U4,3,2,1;5,...,2,1,jiMuujijij67.029.010.011.050.0150.044.0157.060.0167.086.010.056.033.086.0189.00U目录22(2)构造模糊相似矩阵R=(rij)5×5采用最大最小法,即确定模糊相似矩阵为4141kjkikkjkikijuuuur138.037.053.024.038.0156.070.063.037.056.0155.062.053.070.055.0154.024.063.062.054.01R23(3)利用平方合成法求t(R)因为而R8=R4,所以(4)选取适当的置信水平值∈[0,1],按截矩阵进行t(R)动态聚类首先把t(R)中的元素从大到小排序为10.700.630.620.53,,242RRRR153.053.053.053.053.0162.070.063.053.062.0162.062.053.070.062.0163.053.063.062.063.014RRt目录24①取=1,得根据分类原则,U被分成五类:{u1},{u2},{u3},{u4},{u5}.②取=0.70,得因为根据分类原则,U被分成四类:{u1},{u2,u4},{u3},{u5}.③取=0.63,得因为根据分类原则,被分成三类:{u1,u2,u4},{u3},{u5}.同理可得,取=0.62,可得U被分成二类:{u1,u2,u3,u4},{u5}.取=0.53,可得U被分成一类:{u1,u2,u3,u4,u5}.10000010000010000010000011Rt100000101100100010110101163.0Rt100000101000100010100000170.0Rt,170.070.04224rr,163.063.063.0241412rrr目录25(5)画动态聚类图目录262.直接聚类法(1)将模糊相似矩阵中的所有不同的元素从大到小排序,设为1=12m(2)选取=k(k=1,2,…m)直接在R上找出k水平上的相似类.并进行归并,即得到k水平上的等价分类.寻找相似类和归并的原则:若rij≥k,则将ui与uj分为同一类,设B1,B2是k水平上的两个类,若B1∩B2≠,则称它们为相似的,将所有相似类的类合成一类,最后得到的分类就
本文标题:1.2模糊聚类分析
链接地址:https://www.777doc.com/doc-4584530 .html