您好,欢迎访问三七文档
基础生物信息学及应用李裕强2009.09基础生物信息学及应用第Ⅲ部分生物分子信息的分析第八章分子进化分析——系统发生树构建基础生物信息学及应用本章内容:分子进化分析介绍系统发生树构建方法系统发生树构建实例基础生物信息学及应用第一节分子进化分析介绍基本概念:系统发生(phylogeny)——是指生物形成或进化的历史系统发生学(phylogenetics)——研究物种之间的进化关系系统发生树(phylogenetictree)——表示形式,描述物种之间进化关系基础生物信息学及应用分子进化研究的目的从物种的一些分子特性出发,从而了解物种之间的生物系统发生的关系。蛋白和核酸序列通过序列同源性的比较进而了解基因的进化以及生物系统发生的内在规律分子进化分析介绍基础生物信息学及应用分子进化分析介绍分子进化研究的基础基本理论:在各种不同的发育谱系及足够大的进化时间尺度中,许多序列的进化速率几乎是恒定不变的。(分子钟理论,Molecularclock1965)基础生物信息学及应用分子进化分析介绍主要假定条件:Tousemoleculardatatoreconstructevolutionaryhistoryrequiresmakinganumberofreasonableassumptions:Thefirstisthatthemolecularsequencesusedinphylogeneticconstructionarehomologous,meaningthattheyshareacommonoriginandsubsequentlydivergedthroughtime.Phylogeneticdivergenceisassumedtobebifurcating,meaningthataparentbranchsplitsintotwodaughterbranchesatanygivenpoint.Anotherassumptioninphylogeneticsisthateachpositioninasequenceevolvedindependently.Thevariabilityamongsequencesissufficientlyinformativeforconstructingunambiguousphylogenetictrees.基础生物信息学及应用分子进化分析介绍实际情况:虽然很多时候仍然存在争议,但是分子进化确实能阐述一些生物系统发生的内在规律基础生物信息学及应用分子进化分析介绍直系同源与旁系同源Orthologs(直系同源):Homologoussequencesindifferentspeciesthatarosefromacommonancestralgeneduringspeciation;mayormaynotberesponsibleforasimilarfunction.Paralogs(旁系同源):Homologoussequenceswithinasinglespeciesthatarosebygeneduplication.。以上两个概念代表了两个不同的进化事件。用于分子进化分析中的序列必须是直系同源的,才能真实反映进化过程。基础生物信息学及应用分子进化分析介绍基础生物信息学及应用分子进化分析介绍系统发生树(phylogenetictree):又名进化树(evolutionarytree)已发展成为多学科交叉形成的一个边缘领域。包括生命科学中的进化论、遗传学、分类学、分子生物学、生物化学、生物物理学和生态学,又包括数学中的概率统计、图论、计算机科学和群论。闻名国际生物学界的美国冷泉港定量生物学会议于1987年特辟出进化树专栏进行学术讨论,标志着该领域已成为现代生物学的前沿之一,迄今仍很活跃。基础生物信息学及应用分子进化分析介绍基础生物信息学及应用分子进化分析介绍系统发生树结构Thelinesinthetreearecalledbranches(分支).Atthetipsofthebranchesarepresent-dayspeciesorsequencesknownastaxa(分类,thesingularformistaxon)oroperationaltaxonomicunits(运筹分类单位).Theconnectingpointwheretwoadjacentbranchesjoiniscalledanode(节点),whichrepresentsaninferredancestorofextanttaxa.Thebifurcatingpointattheverybottomofthetreeistherootnode(根节),whichrepresentsthecommonancestorofallmembersofthetree.Agroupoftaxadescendedfromasinglecommonancestorisdefinedasacladeormonophyleticgroup(单源群).Thebranchingpatterninatreeiscalledtreetopology(拓扑结构).基础生物信息学及应用分子进化分析介绍有根树与无根树树根代表一组分类的共同祖先基础生物信息学及应用分子进化分析介绍如何确定树根根据外围群:Oneistouseanoutgroup(外围群),whichisasequencethatishomologoustothesequencesunderconsideration,butseparatedfromthosesequencesatanearlyevolutionarytime.根据中点:Intheabsenceofagoodoutgroup,atreecanberootedusingthemidpointrootingapproach,inwhichthemidpointofthetwomostdivergentgroupsjudgedbyoverallbranchlengthsisassignedastheroot.基础生物信息学及应用RootedbyoutgroupbacteriaoutgrouprooteukaryoteeukaryoteeukaryoteeukaryotearchaeaarchaeaarchaeaMonophyleticgroup(单源群)Monophyleticgroup外围群分子进化分析介绍基础生物信息学及应用分子进化分析介绍树形系统发生图(Phylograms):有分支和支长信息分支图(Cladograms)只有分支信息,无支长信息基础生物信息学及应用第二节系统发生树构建方法Molecularphylogenetictreeconstructioncanbedividedintofivesteps:(1)choosingmolecularmarkers;(2)performingmultiplesequencealignment;(3)choosingamodelofevolution;(4)determiningatreebuildingmethod;(5)assessingtreereliability.基础生物信息学及应用系统发生树构建方法(1)ChoosingmolecularmarkersForstudyingverycloselyrelatedorganisms,nucleotidesequences,whichevolvemorerapidlythanproteins,canbeused.Forstudyingtheevolutionofmorewidelydivergentgroupsoforganisms,onemaychooseeitherslowlyevolvingnucleotidesequences,suchasribosomalRNAorproteinsequences.基础生物信息学及应用(2)Performingmultiplesequencealignment:Probablythemostcriticalstepintheprocedure.Onlythecorrectalignmentproducescorrectphylogeneticinference.Multiplestate-of-the-artalignmentprograms(suchasT-Coffee)shouldbeused.Manualeditingisoftencriticalinensuringalignmentquality.Itisalsooftennecessarytodecidewhethertousethefullalignmentortoextractpartsofit.Trulyambiguouslyalignedregionshavetoberemovedfromconsiderationpriortophylogeneticanalysis.系统发生树构建方法基础生物信息学及应用(2)Performingmultiplesequencealignment:Usingautomaticapproachtoimprovingalignmentquality.Rascal()andNorMD()canhelptoimprovealignmentbycorrectingalignmenterrorsandremovingpotentiallyunrelatedorhighlydivergentsequences.theprogramGblocks()canhelptodetectandeliminatethepoorlyalignedpositionsanddivergentregionssotomakethealignmentmoresuitableforphylogeneticanalysis.系统发生树构建方法基础生物信息学及应用(3)Choosingamodelofevolution:何为进化模型Thestatisticalmodelsusedtocorrecthomoplasy(非同源相似,平行演化)arecalledsubstitutionmodelsorevolutionarymodels.系统发生树构建方法基础生物信息学及应用(3)Choosingamodelofevolution:为何要考虑进化模型:Theobservednumberofsubstitutionsmaynotrepresentthetrueevolutionaryeventsthatactuallyoccurred.Forinstance,Observed:AreplacedbyC,actually:A→T→G→CBackmutation(回复突变)couldhaveoccurred:G→C→GParallelmutations(平行突变):bothsequencesmutateintoT,.Suchmultiplesubstitutionsandconvergenceatindividualpositionsobscuretheestimationofthetrueevolutionarydistancesbetweensequences.Thiseffectisknownashomoplasy,which,ifnotcorrected,canleadtothegenerationofincorrec
本文标题:系统发生树构建
链接地址:https://www.777doc.com/doc-4755255 .html