您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > CANOCO--软件的使用简单教程
基于CANOCO的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖江山 编译 4.CANOCO4.5软件的使用UsingtheCanocoforWindows4.5package4.1概述(Overviewofthepackage)Window版CANOCO4.5软件由几个相关程序组合成。在这一节我们将简单介绍一下各个程序的功能。然后再接着介绍这些程序的具体使用方法。这一章不能代替CANOCO软件的自带说明书,但对于初学者使用CANOCO还是很有帮助的。CANOCOforWindow4.5这个程序是CANOCO的核心。通过使用它,你可以指定要分析的数据和排序模型,选择分析的类型。你也可以选定一部分的被解释的变量和环境因子进入分析,也可以任意改变样方或物种的权重。所以这些选择都被集中在CANOCO程序的对话框中。CANOCOforWindow带有比较全面的排序方法。核心部分是基于线性模型的PCA和RDA,基于单峰的模型的CA,DCA和CCA。在这些基本排序方法基础上,CANOCO也可以做CVA(典范变量分析),PCoA(主坐标分析)。但NMDS并没有被包括,因为的确用得很少。WCanoImp这个程序的功能在1.7节已经讨论。但这个程序用法受到了window的剪贴板和电子表格文件的限制。比如在Excel2003以前的版本,列数仅有256列,这就意味着样方数或物种数不能两个同时超过256个,否则需要分割。当然行数宽松点,但不能超过65536行。如果你的数据超过这个限制,你可以将你的数据分割为几个部分,经过WCanoImp转化后,再用CanoMerge程序拼接起来。(Excel2007的行列已经没有限制,这个问题已经不复存在)CanoMerge这个程序有如下三个用途,1)首要的任务是连接两个或多个包含相同样方但不同变量的数据文件。这个功能对于行数或列数两者均超过255个变量很有用,能够拼接起来。如果你的数据列数超过了255列,就可以分割为多个文件,注意,昀好每个文件行数一样,而且行数昀好是代表样方。分别将这些分割开的表格用1.7节介绍的方法,转化一个个单独文件,然后利用CanoMerge(如图4-1)将几个文件合成一个新的文件。“Addfile”是添加文件的按钮,把需要合成的文件加进来,然后按Merge按钮,给新的文件名字,就可以了。2)可以用来将您的数据文件输出带制表符分隔的ASCII(文本)文件。这个功能是非常有用的,特别是如果您的数据因为太大而不适合存在Excel表格里。而制表符格式文件可以被常有统计软件包直接应用。你直接将需要转为文本文件的数据文件用addfiles按钮选到对话框,然后选中对话框昀底下的选项“WritemergedtableinTAB-separatedvaluesformat”(图4-1),按下“Merge”按钮,即可生成文本文件。3)昀后一个功能是可以过滤掉一些低频率的物种。在“ExcludevariableswithlessthanXpositivevalues”中的框中填上一个数字(图4-1),这个数字代表如果一个物种所存在的样方少于X个,将被剔除出去。这个功能是相当有用的,因为在Canoco程序里面,尽管你可以任意剔除任一变量,也可以用“downweightingofrarespecies”来减少稀少种的权重,但都是很盲目的,无量化的标准。而CanoMerge程序中这个选项可以让你有目标地剔除一些低频率的物种。 1 基于CANOCO的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖江山 编译 CanoDrawforWindowsCanoDrawforWindows是用来做排图的程序。CanoDraw的作图基础数据主要来自Canoco分析的结果,包括.con文件和.sol文件。CanoDraw的输出文件是.cdw文件,这个文件独立于.con文件和.sol文件。CanoDraw不仅可以生成排序图,也可以生成很多种等值线图和回归模型图。详见第10章。4.2CANOCO典型分析流程图(Typicalflow-chartofdataanalysiswithCanocoforWindows) 输数据到电子表格里 用WCanoImp将数据转换为Canoco能识别格式文件 选择合适的模型并进行排序分析 图4‐2 用CANOCO作排序分析的简单流程图。 图4-2展示的是用CANOCO分析多元数据一般的流程。首先你必须打开你的电子表格的数据,然后用WCanoImp程序将数据转化为CACOCO能兼容的文件。在Canocofor决定排序的模型 输出结果并用CanoDraw作图 2 基于CANOCO的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖江山 编译 Windows的窗口中,你可以重新创建一个新的“newproject”,也可以打开原来已经存储过的分析文件(打开文件后,filesaveas,即可另存一个新的文件。另存的文件自然是保持了原来文件所有的背景选项设置,必要的时候,我们仅仅修改一些选择即可,这样更方便)。在图4-2中关于排序模型的选择,以及模型对应的数据标准化,物种数据和环境因子的取舍、组合等等,可以参考后面将要讲的内容及每个窗口的“help”的命令。当所有选择完成后,按下“analyze”按钮后,程序即可运行排序分析,分析完后,界面上会保持两个窗口,一个窗口为“ProjectView”,这个窗口为project的一些属性特征(比如,排序的类型、数据的维数、数据文件的名称等等),还有一些相关按钮。另外一个窗口是“LogView”,记录的是分析过程与分析的结果。但仅仅是一部分的统计结果(四个轴的统计总结、轴与环境因子的相关性、蒙特卡罗检验结果)被存储在这个窗口中,其他一些分析结果,比如物种、环境因子及样方的得分(坐标)均存在另外一个与.sol作为后缀的文件中,此文件一般在当前目录下,以记事本打开即可。分析完后,直接在“ProjectView”的窗口选择CanoDraw的按钮,便可直接将分析的结果进行做图,无需到桌面或是开始任务栏去打开CanoDraw程序。至于如何使用CanoDraw,可以参考4.7节和第10章的内容。4.3决定排序的模型:单峰还是线性(Decidingontheordinationmethod:unimodalorlinear?)这一节提供简单易用的“菜谱”用于判断该选择线性模型还是单峰模型的排序方法,但需要注意的该“菜谱”是难免过于简化,因此它不应该被盲目遵循。在CanocoforWindows的分析过程,有一个关于模型的选择窗口,你必须对排序的模型进行选择。为了选择更合适的模型,你尽可能将各种模型都尝试一下,选择一个你昀想要的分析结果及排序图。当然,如果你不知道到底是用线性、还好单峰模型好,有一个比较简单方法可以帮助你来选择。可以先将物种数据进行DCA分析,其他的窗口的选项均可以选择默认程序。分析完成后,在“LogView”内,各轴特征根分析那部分,可以找到“Lengthsofgradient”这样一栏信息,这个“Lengthsofgradient”是展示每个轴的梯度长度。如果这四个轴中梯度昀长(昀大值)超过4,选择单峰模型排序(CA、CCA、DCA)更合适。如果是小于3,选择线性模型(PCA、RDA)比较合理。如果介于3-4之间,单峰模型和线性模型都是合适的。当然,这个选择并不是绝对的,昀长梯度小于3,依然可以用单峰模型,因为线性模型可以看作单峰模型一种特例。但是梯度大于4,昀好还是不用线性模型,线性模型可能误差比较大,会丢失比较多的信息。当你选择单峰还是线形模型的时候,你必须预先认识到,不是所有的数据类型都是适合用单峰模型,比如物种数据是不同量纲的数据(单位不一致)就不适合做单峰模型的排序。还有,如果有个样方的空的(即值都为0),这样的数据进行单峰排序分析,系统会自动告诉你有空的样方,不能进行分析。如果非要做单峰模型的排序分析,首先要把这些空样方去掉。4.4PCA或RDA排序:中心化和标准化(PCAorRDAordination:centringandstandardizing)CANOCO里面的线性模型(PCA和RDA)过程有个物种中心化和标准化的选择(图 3 基于CANOCO的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖江山 编译 4.3),这个选择可以很大程度上影响分析的结果。实际上,你必须根据你的数据情况和所回答的问题来选择物种数据中心化和标准化(将在14.3节的案例讨论)。在这里,我们仅仅简要介绍一下如何正确选择中心化和标准化。 对话框展示的线性排序(PCA和RDA)分析前物种数据的处理选择。样方的中心化(图4-3左半部分的对话框)是让每行(每个样方)的平均值为零。同样,物种的中心化(图4-3右半部分的对话框),也是让每列(每个物种)的和为0。对于RDA及PartialRDA,物种的中心化是必须的。物种(样方)的标准化结果是让每列(行)范数(norm)等于1。范数是列(行)内各值的平方和的平方根(Thenormisthesquarerootofsumofsquaresofthecolumn(row)values)。如果同时使用中心化和标准化,中心化必须先进行。物种数据中心化和标准化后,各列变量平均值为0,方差为1,这样的话,PCA的分析是基于物种的相关矩阵。如果没有进行范数标准化,PCA的分析基于方差-协方差矩阵(variance-covariancematrix)。需要注意的是,在物种的平均频率与平均数量差异比较大的时候,如果进行标准化,等于的扩大了稀有种的权重。也要注意的是,如果物种数据的量纲不同的属性数据,比如不同的物理或化学参数,物种变量必须标准化(但样方数据则不必)。如果是带有环境变量的线性排序(比如RDA),你可以选择误差方差标准化(standardizationbyerrorvariance)。在这种情况下,CANOCO会单独计算每个物种的多少方差可以被环境变量(协变量)解释。然后误差方差的倒数被作为物种的权重。这样,如果一个物种变化被环境因子解释越多,该物种在昀终分析中的权重就越大。4.5DCA排序:除趋势对应分析(DCAordination:detrending)对应分析(CA)第二轴开始的除趋势的作用在于消除弓形效应(archeffect)的影响,图4-4展示的对应分析(CA)头两轴的样方排序图。对应分析中,样方在第二轴的位置很大程度上依赖于其在第一轴的位置。这个效应源于 4 基于CANOCO的生态学数据的多元统计分析 Jan Leps, Petr Smilauer 著 赖江山 编译 方法的局限性。就是CA的第二排序轴在许多情况下是第一轴的二次变形,即所谓的“弓形效应”(Archeffect)或者“马蹄形效应”(Horse—shoeeffect)。样方在第二轴上的坐标与第一轴的坐标是二次曲线关系,这是正交化的必然结果(Gauch1982)。区间除趋势(Detrendingbysegments),就是把第一轴分成一系列区间,在每个区间将平均数定为零而对第二轴的坐标值进行调整,从而克服了弓形效应,提高了排序精度。图4-5展示的是CANOCO里面除趋势的对话框。对于无环境因子的对应分析(CA),我们推荐使用区间除趋势方法(Detrendingbysegments)。在一些情况下,多项式的除趋势方法(detrendingbypolynomials)也是可以推荐的选择。你可以从CANOCO使用手册里面得知在什么情况下选择多项式的除趋势方法效果比较好。(Minchin(1987)发现有时区间除趋势方法在有潜在的环境因子没有加入分析的时候,而会把一些变量弄平,使其无法展示出来。)。因此提出用多项式的除趋势方法效果比较。Polyn
本文标题:CANOCO--软件的使用简单教程
链接地址:https://www.777doc.com/doc-6761022 .html