您好,欢迎访问三七文档
对应分析(CorrespondenceAnalysis)对应分析是1970年法国巴黎科学院统计研究室的Bezecri教授首先提出的,1977年引入国内。对应分析是在因子分析的基础上发展起来的一种新的因子分析方法。因子分析R—型研究指标Q—型研究样品特征值方法找出代表性指标,进行地质成因解释找出代表性样品,进行地质作用解释因子分析的优点1、降维,即化多为少,以少代多;2、浓缩,即把多个指标的分散信息集中到少数几个主因子上;3、分割,即把具有复杂相关关系的指标分割成各个不同特征的独立类型。因子分析的缺点1、割裂即把R—型与Q—型截然分开,割断了指标与样品间的联系,损失了一些指标的信息;2、局限即对Q—型因子分析,当N很大时,求逆、求特征值都很困难,通常只做R—型因子分析,使对指标与样品的研究不是处于等同的位置;3、不对等即对指标可以进行标准化处理,对样品则不能,指标和样品不是对等的,对样品的研究带来困难。不对等是因子分析的一条致命缺点,因为因子分析的模型是在标准化以后导出来的。对应分析对应分析将R—型因子分析和Q—型因子分析联系在一起,由R—型因子分析的结果导出Q—型因子分析的结果。对应分析的目的在于给出两个集合的主轴,把样品和指标投影到由某两个主轴所决定的同一因子平面上,同时研究指标和样品的相互关系,即在同一因子平面所反映的信息:(1)靠近的一些指标点密切相关,说明他们具有成因上的联系,指示,某一特定的地质作用或过程;(2)靠近的一些样品点具有相似的性质,是同一地质过程的产物或者说他们属同一类型;(3)同类型的样品点将由它们邻近的指标点所表征,这就有助于对样品类型的解释,并通过样品在空间的分布可以了解地质过程的空间关系。目的对应分析的特点:1、统一性:同时对样品和指标进行因子分析,得出统一的解,反映在同一平面图内,直观地解释指标和样品,便于进行成因解释分析;2、互推性:对应分析可以从R—型因子分析的结果导出Q—型因子分析的结果,使我们只须从,ijppRr出发,推出Q—型相应的结果,克服了由于iknnQCOS阶数高,计算量大,研究Q—型因子分析的的困难;3、对等性:经过一种数据变换,使样品和指标都处于对等地位。推导过程111,1nijppnxxXxxx1111njjnpjpjXXXX.111piiXX.221piiXX。。。.1pNiNiXX指标样品假设有N个样品,每个样品测了P个指标11pnijiiTX(P×N)个元素ijx的总和1PT1111nppnppXpp1.11.1njJnppjJPPPP..1niiijjxPPT..1pjjijixPPT(i=1,2,…,pj=1,2,…,N)1、R—型情况在PR维空间中,将用其坐标:第j个样品12...,,,jjpjjjjppppppj=1,2,…,N每个样品点的坐标是各个指标在该样品中的相对比例,经过变换后,对N个样品的研究就变成了对N个样品点相对关系的研究,对任意二个样品的相关程度,普通的欧氏距离:211..,PiiiPPDPP由于指标之间的数量的不同,而我们关心的是指标的相对作用,采用加权的距离公式2211.......1,PPiiiiiiiiiPPPPDPPpPPPP为了继续引用普通的欧氏距离,只须把每个样品点看作具有如下坐标的向量(第j个样品)12..1..2....:,,...,ijjjpjijjjpjPPPPPPPPPPPP(i=1,2,…,pj=1,2,..,N)此时,可以直接计算两两样品之间的距离,以进行分类。但这样做没有达到降维的目的,如果进行因子分析,就需计算样品点的方差—协方差矩阵。然后求方差—协方差矩阵的特征值及相应的特征向量即可得到主因子。样品点中第i个指标的平均值:...11....1nnijiijijijjjiiippPppppppp这样第i个指标与第j个指标的协方差为:...1....njiijijijppappppppp....1....njiijijpppppppppp......1....njiijijpppppppppppp....1....njiijijpppppppppp....1....njjiiijpppppppppp令:............./iiiiiiiiiixxxpppxxxTTTTzppxxxxTTiz对样品和指标都是对等的,.p—对指标求和,.ip—对样品求和。则:1nijijaZZ1nppijijPNNPCaZZZZ从CZZ出发进行R—型因子分析2、Q—型情况在NR空间中,将用具有坐标:12....1..2..:,,...,ijiiiNijiiiNpppppppppppp的P个点表示P个指标,任意两样品K、L之间的协方差为:NNKLBb...1....pikilKLikliikilppbppppppp....1....pikilikiliikilpppppppppp....1....pikilikiliikilpppppppppp....1....pikikililiikilpppppppppp1pikiliZZ即:NNNPPNBZZA与B之间存在着简单的对应关系,即认为从Xij到Zij的变换对指标和样品是对等的R—型与Q—型的对应关系?3对偶定理定理:A与B的非零特征值相同(1)设12,,...,i是矩阵AZZ的非零特征值,则有特征向量12,,...,iuuu使得:iiiZZuu用Z去左乘上式的两边,得:iiiZZZUZUI=1,2,…,k即:i也是ZZ的特征值,其相应的特征向量是iZU。(2)如果是ZZ的重特征值,即存在个线性无关的向量12,,...,VVV,得:iiZZVVI=1,2,…,r则:12,,...,iZVZVZV也是线性无关的。(3)反之亦然,对于BZZ的特征值。特征向量与ZZ类似与(1)(2)的关系。结论:A与B的非零特征值是相同的,如果V是ZZ的特征向量,则ZV是ZZ的特征向量。由于特征值表示各个因子所提供的方差,即各个公因子所有公因子方差的贡献,那么,在空间PR中的第K个因子与在空间NR中的第K个因子(K=1,2,…,m)提供相同的方差。从几何的意义看,即pR中诸样品点与pR中各因子轴的距离和NR中诸指标点与NR中相对应的各因子轴的距离完全相同。正是由于这一点,我们可以用相同的因子轴去同时表示指标和样品,即把R—型和Q—型统一起来,把指标和样品同时反映在一个因子平面上。(1)靠近的一些指标点密切相关,说明他们具有成因上的联系,指示,某一特定的地质作用或过程;(2)靠近的一些样品点具有相似的性质,是同一地质过程的产物或者说他们属同一类型;(3)同类型的样品点将由它们邻近的指标点所表征,这就有助于对样品类型的解释,并通过样品在空间的分布可以了解地质过程的空间关系。五、计算步骤1、将x按行、列分别求和,即:2、计算Z矩阵,即:111212122212,,,nnpppnxxxxxxxxx11.122.1.1njinjinpjpixxxxxx1.12.2.111,,,pppiiinniiixxxxxx11pnijiiTX2、计算Z矩阵,即:3、因子分析(1)计算矩阵ZZ的特征值和特征向量(Jacobi);12p12,,pUuuu(2)确定主因子;计算特征值的累计百分比,即:11/100%80%pk确定主因子数K(K=2,3)一般取K=2或3即可。PNijZZ式中:..../ijijijijxxxTZxx(3)计算因子载荷矩阵;(4)在两两因子轴平面上做指标点图。F111122121122221122,,,,,,,,,kkkkpppkkuuuuuuuuu1x2xpx1F2FKF对Q—型(1)对R—型的K个特征值12k计算其对应与矩阵BZZ的单位特征向量:1iiiqzu(i=1,2,…,k);(2)求Q—型载荷矩阵;令:iiiiVqZu(i=1,2,…,k)则:(3)在与R—型相应的因子平面上作样品点图,并进行指标与样品的地质解释。1x2xpx111122121122221122,,,,,,,,,kkkknnnkkvvvvvvvvvG1G2GKGSPSS操作
本文标题:对应分析
链接地址:https://www.777doc.com/doc-3334326 .html