您好,欢迎访问三七文档
刘芳2015.12.11系统发育分析方法系统发育分析常用方法一、基于距离方法Distancebased(Algorithmic)methods二、基于特征符方法Characterbased(Treesearching)methodsMaximumparsimony(MP)Maximumlikelihood(ML)Bayesianinference(BI)unweightedpairgroupmethodwitharithmeticmean(UPGMA)Neighbor-JoiningMethod(NJ)MinimumEvolution(ME)Fitch-MargoliashMethod(FM)方法基本特征适用范围优点缺点NJ不需要分子钟假设,是基于最小进化原理,进行类的合并时,不仅要求待合并的类是相近的,而且要求待合并的类远离其他的类。远缘序列,进化距离不大,信息位点少的短序列假设少,树的构建相对准确,计算速度快,只得一颗树,可以分析较多的序列,运行速度优于最大简约法序列上的所有位点等同对待,且所分析的序列的进化距离不能太大MP基于进化过程中碱基替代数目最少这一假说,不需要替代模型,对所有可能的拓扑结构进行计算,并计算出所需替代数最小的那个拓扑结构,作为最优树近缘序列物种序列的数目≤12.善于分析某些特殊的分子数据如插入、缺失等序列有用。只适于序列数目N≤12。存在较多回复突变或平行突变时,结果较差。变异大的序列会出现长枝吸引而导致建树错误。ML依赖于某一个特定的替代模型来分析给定的一组序列数据,使得获得的每一个拓扑结构的似然率都为最大值,然后再挑出其中似然率最大的拓扑结构作为最优树。特定的替代的模,远缘序列很好的统计学基础,大样本时似然法可以获得参数统计的最小方差,在进化模型确定的情况下,ML法是与进化事实吻合最好的建树算法.所有可能的系统发育树都计算似然函数,计算量大,耗时时间长。依赖于合适的替代模型,BI基因进化模型的统计推论法,通过后验概率直观反映出各分支的可靠性而不需要自检法检验大而复杂的数据集具有坚实的数学和统计学基础,可以处理复杂和接近实际情况的进化模型对进化模型比较敏感,后验概率是建立在许多假说上,在现实中可能不成立系统发育树构建的软件常见软件软件名称用途DNAMAN序列分析的综合工具BioEdit序列分析的综合工具DNASTAR序列分析的综合工具MAFFT多重序列比对工具Muscle多重序列比对工具ClustalX图形化的多序列比对工具;构建N-J系统树Gblocks冗余序列处理工具jModelTest,ModelTest,ModelGenerator进化模型选择工具PHYLIP集成的进化分析工具MEGA图形化、集成的进化分析工具PAUP集成的进化分析工具PHYML,PAML,RAxMLML建树工具MrBayes基于贝叶斯方法的建树工具TreeView进化树显示工具FigTree,AdobeIllustrator进化树显示和编辑工具系统发育树构建的过程多序列比对(MAFFT)进化模型的选择(ModelTest)系统发育树的构建(RAxML,MrBayes,PAUP)系统发育树显示和编辑(FigTree,AdobeIllustrator)序列拼接(Mega)序列拼接•BioEdit•Mega•Seqman•Contig•Sequencer多序列比对速度:MuscleMAFFTClustal比对准确性:MAFFTMuscleClustal比对前MAFFT7.0onlinealignment软件使用流程(系统树构建)1.将比对后的fasta格式文件转换成Nexus格式2.将paup命令粘贴到Nexus文件下方,在命令程序中指定外群,保存。beginpaup;logfile=p_buffer.txt;psetcollapse=minbrlen;[ctype1.5_1:all;]setmaxtrees=5000increase=no;outgroup****;setcriterion=parsimony;hsearchaddseq=randomnreps=1000;roottreesoutroot=monophyl;savetreesbrlens=yesfile=MP.tre;pscoresALL/ci=yestl=yeshi=yesrc=yesri=yeskhtest=yes;bootstrapnreps=1000Keepall=yes/AddSeq=randomnreps=10;roottreesoutroot=monophyl;savetreesfile=BT.trefrom=1to=1savebootp=bothmaxdec=0;end;转换文件格式.....3.打开paup软件,打开Nexus文件然后运行即可。4.运行界面。MP树运行完后,点击“Stop”,继续运行BT树。运行结果文件:MP树BT树P-buffer文件RAxML建树Page26•程序自带的文件:raxmlHPC、raxmlHPC-PTHREADS、run三个•准备文件两个:phy格式的比对好的序列,txt格式的partition文件Run文件基因的名字和序列所在位置跑多少次比对好序列的文件名字输出结果的的名字Partition文件的名字Partition文件MrBayes建树(Mrmodeltest2.3和Mrbayes3.2.2)操作步骤•1.Fasta文件转换成Nexus格式的文件•2.把Mrmodelblock文件夹中对应的MrModelblock*loci文件中的内容粘贴到Nexus文件最下方(几个基因即对应几个loci的文件,比如4个基因,则需要复制MrModelblock4loci中的内容)•3.修改刚刚粘贴的命令参看文件红色框中是要修改的地方•4.Paup运行刚刚修改好的Nexus文件,得到SCORES文件•5.将SCORES文件复制到MrModeltest2.3文件夹中,此时该文件夹包含以下文件:•6.运行cmd•得到txt文件•7.打开刚刚得到的txt文件,从每一个txt文件中找到如下Bayes的模型:•8.把得到的models复制到一个text文本中•9.打开之前的NEXUS文件,删掉mrmodeltest命令,粘贴bayes命令:•beginmrbayes;•[Thisblocksetsupseveraldifferentpartitionsthatcouldbeusedintheanalysisofthisdataset]•outgroupM_infuscans_CBS_869_96;[replacefungusXwithyouroutgrouptaxon]•[Whendefiningyourcharsetsbelow,thecharactersmustfolloweachotherdirectly,e.g.1-300,301-500,501-600and•not5-300,325-500,530-600.Youwillexcludedeverythingyoudonotwanttoincludeintheanalysis(e.g.1-4,301-324•and501-529inthecharsetexcludedcharactersline.]•charsetlocus1=1-286;[replacethexx'swithnumbersreflectingthecharacterspanningofyourgene1]•charsetlocus2=287-605;[replacethexx'swithnumbersreflectingthecharacterspanningofyourgene2]•charsetlocus3=606-1159;[replacethexx'swithnumbersreflectingthecharacterspanningofyourgene3]•charsetlocus4=1160-1678;[replacethexx'swithnumbersreflectingthecharacterspanningofyourgene4]•charsetexcludedchars=282-286601-6051155-11591674-1678;[listhereallofthecharactersthatyoudonotwanttoinclude.e.g.thebitsbetweentheloci]•excludeexcludedchars;•partitionAllLoci=4:locus1,locus2,locus3,locus4;•logstartfilename=mydata.log;•end;•beginmrbayes;•outgroupM_infuscans_CBS_869_96;•setpartition=AllLoci;•prsetapplyto=(1,2,4)statefreqpr=dirichlet(1,1,1,1);[Thismeanslocus1andlocus3aresame]•prsetapplyto=(3)statefreqpr=fixed(equal);[Thisisthemodeloflocus2]•lsetapplyto=(1,2)nst=2rates=gamma;•lsetapplyto=(3,4)nst=2rates=propinv;•unlinkshape=(all)pinvar=(all)statefreq=(all)revmat=(all);•mcmcpngen=10000000relburnin=yesburninfrac=0.25printfreq=1000samplefreq=1000nchains=4savebrlens=yesstoprule=yesstopval=0.01;•mcmc;•sumt[conformat=simple];[usingMrbayes3.2.1shouldaddconformat=simple]•end;红色字体文字是需要修改的地方;蓝色字体视情况修改,也可不修改。•10.把修改好的NEXUS文件放在Mrbayes文件夹中,打开Mrbayes,输入命定:exeNEXUS的文件名.nex•11.Over~CIPRES在线建树CIPRES在线建ML树(RAxML)!input.actionCreatenewfolderUploaddataCreatenewtaskSelecttoolsSetparameters最开始可以先输入=0.5,数据合适再输入0.5ResultCIPRES在线建贝叶斯树•如果上传的NEXUS文件中不包含贝叶斯的命令,按照上图红色方框的内容设置。•点击“AdvanceParameters”,然后设置其他的命令(类似我们用的贝叶斯命令,只是将命令程序改成了选项,即选择题......)Setparameters根据情况设定时间,可以先设0.5试一下Setparameters•如果上传的NEXUS文件中已包含了贝叶斯的命令,则按照上图设置。可以先设0.5试一下ResultFig
本文标题:系统发育分析方法
链接地址:https://www.777doc.com/doc-5098365 .html