您好,欢迎访问三七文档
典范对应分析CCADCCA2引言◆CCA方法简介◆CCA方法优缺点◆CCA排序的基本步骤◆DCCA排序3一、CCA方法简介◆典范对应分析(canonicalcorrespondenceanalysis,CCA),是基于对应分析发展而来的一种排序方法,将对应分析与多元回归分析相结合,每一步计算均与环境因子进行回归,又称多元直接梯度分析。其基本思路是在对应分析的迭代过程中,每次得到的样方排序坐标值均与环境因子进行多元线性回归。CCA要求两个数据矩阵,一个是植被数据矩阵,一个是环境数据矩阵。首先计算出一组样方排序值和种类排序值(同对应分析),然后将样方排序值与环境因子用回归分析方法结合起来,这样得到的样方排序值即反映了样方种类组成及生态重要值对群落的作用,同时也反映了环境因子的影响,再用样方排序值加权平均求种类排序值,使种类排序坐标值值也间接地与环境因子相联系。其算法可由Canoco软件快速实现。4最大优点:CCA是一种基于单峰模型的排序方法,样方排序与对象排序对应分析,而且在排序过程中结合多个环境因子,因此可以把样方、对象与环境因子的排序结果表示在同一排序图上。缺点:存在“弓形效应”。克服弓形效应可以采用除趋势典范对应分析(detrendedcanonicalcorrespondence,DCCA).结果可信性:查看累计贡献率及环境与研究对象前两个排序轴之间的相关性。二、CCA优点缺点5三、CCA排序的基本步骤基于CA/RA(修正的CA/RA)的CCA排序基本步骤:我们举一个虚拟的计算例子:假使我们得到7个样方5个中的多度数据及两个环境因子(长金屯1995),有两个矩阵:样方种1234567ri110010204200101013302010104430011027511200105Cj53332436由于环境因子见得测量指标往往差别悬殊,一般需要对环境数据进行标准化,这里是个简单的例子,我们将两环境因子中心化得到新的矩阵样方环境因子123456710.20.10.10.30.60.60.220.50.90.80.40.40.80.77下面是CCA排序的基本过程:第一步:任意给定样方排序初始值(1,2,3,4,1,2,3)第二步:计算种类排序值Zj,其是样方初始值的加权平均:(2.25,2.33,2.5,2.0,2.2)11pijjijpijixyzx样方12345671-0.03-0.13-0.130.70.37-0.13-0.032-0.140.260.16-0.24-0.240.160.06环境因子jzjzjzZj为样方排序值8()min100maxminjjajjjzzzzz第三步:再用加权平均法求样方新值,得:(2.09,2.57,2.24,2.2.5,2.17,2.30,2.11)()1'1NaijjjiNijjxzyx得到一组样方排序值,并用下式调试,使得Zj的最大值为100,最小值为0,这是为了阻止排序坐标值在迭代过程中逐步变小9第四步:用多多元回归分析计算样方排序值与环境因子间的回归系数,得:b0=2.25,b1=0.255,b2=0.655用多元回归计算样方与环境因子之间的回归系数bk,用矩阵形式表示:b=(UCUT)-1UC(Z*)T这里的b为一列向量,b=(b0,b1,...,bq)T;C是种类x样方原始数据矩阵列和Cj组成的对角矩阵;Z*为第三步得到的样方排序值:Z*={Zj*}=(z1*,z2*,...,zn*)U={Ukj},为(q+1)xN维矩阵,包括环境因子原始数据矩阵和一行1(用于计算b0):1113212310...0..................qqNUUUUUUU由最后一次迭代所求的b称为典范系数。它反映了各环境因子对排序轴所起的作用大小,是一个生态学指标。第五步:计算样方新值Z=Ub比如:z1=2.2.5+0.225*(-0.03)+0.655*(-0.14)=2.15同法可得:Z=(2.15,2.38,2.32,2.11,2.19,2.32,2.28)第六步:对Z值进行标准化:a计算样方坐标值的形心V11/NNjjjjjVCZC这里的Cj为原始数据矩阵1pjijiCx11b计算离差211()/NNjjjjjSCZVC有最后一次迭代结果所求得的S实际上等于特征值C标准化得新值()jajZVZSZj(a)为标准化后的样方排序值,Zj是其未经标准化的值。这一标准化使得样方排序轴和种类排序轴具有相等的特征值。由于种类排序和样方排序具有相互平均的关系,也可以种类排序进行标准化后以代替对样方的标准化,其最终结果是一致的。计算得:V=2.42S=0.18Z(a)=(1.06,0.22,-0.56,-1.72,-1.28,-0.56,-0.78)12第七步:以Z(a)为基础回到第二步,重复以上过程,最后得到:7个样方在第一排序轴上的坐标:0.059,-0.129,-0.078,0.011,0.098,-0.061,0.113(λ=0.216)5个种在第一排序轴上的坐标:0.010,0.054,-0.121,0.143,-0.144(λ=0.269)第八步:求第二排序轴上的坐标:第二排序轴的基本过程与第一轴一致,不同的是要进行正交化。在选出初选值时可以选第一轴某一步的结果,以加快迭代收敛速度。与修正的CA/RA一样,先进行正交化,再进行标准化,正交化方法同下。a.计算正交化系数11/NNjjjjjjCzeC13b.正交化()bjjjZze这里,Zj(b)是正交化后的样方坐标值,Zj是其未经标准化的值。7个样方在第二排序轴上的坐标为:-0.053,0.017,0.065,-0.042,0.108,-0.062,0.060(λ=0.18)5个种在第二排序轴上的坐标为:-0.130,0.252,0.040,-0.036,-0.028(λ=0.18)第九步:计算环境因子的排序坐标:先求得以上得到的两个样方排序轴与环境因子间的相关系数akm的下表:(相关系数akm可以在EXCEL中求得)14环境因子第一排序轴第二排序轴10.6300.3832-0.7200.125(1)kmmmkmfa再计算环境因子的的坐标:fkm代表第k个环境因子在第m排序轴上的坐标值,λm为第一排序轴的特征值,akm为第k个环境因子与第m个排序轴间的系数。比如:110.269(10.269)*0.6300.279f同法可得:f12=0.170,f21=-0.274,f22=0.04715第十步:绘双序图,为了便图形的表示,我们将上面求得的坐标值全部扩大1000倍,绘得下图16第十一步:结果分析从图可知,第一个环境因子与前两个排序轴都是正相关;而第二个环境因子与第一轴是强负相关,与第二轴则是正相关,但关系不十分密切(因为其与第二轴的夹角很大)。从样方分布看,样方5和7与第一环境因子密切相关;样方2则与环境因子2有较密切的关系。种类分布也同样可做这样的解释。比如种3和环境因子2相关联。由于这个例子很简单,从原始数据矩阵我们就可以看到这些关系。CCA排序图的解释:箭头表示环境因子,箭头所处的象限表示环境因子与排序轴之间的正负相关性,箭头连线的长度代表着某个环境因子与研究对象分布相关程度的大小,连线越长,代表这个环境因子对研究对象的分布影响越大。箭头连线与排序轴的夹角代表这某个环境因子与排序轴的相关性大小,夹角越小,相关性越高。17关键问题:(1)RDA或CCA的选择问题:RDA是基于线性模型,CCA是基于单峰模型。一般我们会选择CCA来做直接梯度分析。但是如果CCA排序的效果不太好,就可以考虑是不是用RDA分析。RDA或CCA选择原则:先用species-sample资料做DCA分析,看结果中Lengthsofgradient的第一轴的大小,如果大于4.0就应该选CCA,如果在3.0-4.0之间,选RDA和CCA均可,如果小于3.0,RDA的结果要好于CCA.(2)计算单个环境因子的贡献率:CCA分析里面所得到的累计贡献率是所有环境因子的贡献率,怎么得到每个环境因子的贡献率:生成三个矩阵,第一个是物种样方矩阵,第二个是目标环境因子矩阵,第三个是剔除目标环境因子矩阵后的环境因子矩阵。分别输入Canoco软件中,这样CCA分析得到的特征根贡献率即是单个目标环境因子的贡献率。18四DCCA
本文标题:典范对应分析
链接地址:https://www.777doc.com/doc-4946629 .html