您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 比较基因组学与分子进化5
比较基因组学与分子进化Comparativegenomicsandmolecularevolution11/24/2010反向遗传(水稻吸收铁为案例)No.4:模式生物基因功能(C.elegans)生物数据库的使用序列获得和比对分析,,No.5:基因结构分析和功能预测(C.elegasns)进化分析--构建进化树GFP构建验证生物学功能No.6:非模式生物功能研究花生No.7:非模式生物功能研究植物寄生线虫基因结构的原核细胞真核细胞不同点相同点原核细胞真核细胞不同点编码区是连续的编码区是间隔的、不连续的相同点都由能够编码蛋白质的编码区和具有调控作用的非编码区组成的原核细胞与真核细胞的基因结构比较:Somecases:://:://多序列比对数据库数据库名称描述网址BLOCKS类隐与模型库,无空隙联合了PROSITE,PRINTS,ProDom,Pfam,SMART,TIGRfam的资源来自PIR联合了6个数据库的蛋白质数据库隐马模型库的蛋白指纹利用PSI-BLAST对SwissProt蛋白质数据聚类蛋白质模体字典简单分子构架研究工具蛋白家族的隐马模型库•Predictfeaturesofalignedobjects•Makepatterns—Canmakeaprofileorapatternthatcanbeusedtomatchagainstasequencedatabaseandidentifynewfamilymembers—Motif/profilecanbeusedtopredictfamilymembershipofnewsequences—Databasesofmotif/profile•PROSITE()•BLOCKS()://psort.hgc.jp/://序列相似性比较和序列同源性分析序列相似性比较:就是将待研究序列与DNA或蛋白质序列库进行比较,用于确定该序列的生物属性,也就是找出与此序列相似的已知序列是什么。完成这一工作只需要使用两两序列比较算法。常用的程序包有BLAST、FASTA等;序列同源性分析:是将待研究序列加入到一组与之同源,但来自不同物种的序列中进行多序列同时比较,以确定该序列与其它序列间的同源性大小。这是理论分析方法中最关键的一步。完成这一工作必须使用多序列比较算法。常用的程序包有CLUSTAL等;多序列比对工具•CLUSTALW/X•AMAS•CINEMA•DIALIGN•HMMT•Match-Box•MultAlin•MSA•Musca•PileUp•SAGA•T-COFFEE•ClustaW/XisageneralpurposemultiplealignmentprogramforDNAorproteins.•ClustalW/XisproducedbyJulieD.Thompson,TobyGibsonofEuropeanMolecularBiologyLaboratory,GermanyandDesmondHigginsofEuropeanBioinformaticsInstitute,Cambridge,UK.AlgorithmicClustalW/XClustal简介•CLUSTAL是一种渐进的比对方法,先将多个序列两两比对构建距离矩阵,反应序列之间两两关系;然后根据距离矩阵计算产生系统进化指导树,对关系密切的序列进行加权;然后从最紧密的两条序列开始,逐步引入临近的序列并不断重新构建比对,直到所有序列都被加入为止。Clustal的渐进比对过程在比对过程中,先对所有的序列进行两两比对并计算它们相似性分值,然后根据相似性分值将它们分成若干组,并在每组之间进行比对,计算相似性分值。根据相似性分值继续分组比对,直到得到最终比对结果。在比对过程中,相似性程度较高的序列先进行比对而距离较远的序列添加在后面。多序列比对工具-clustalXClustal是一个单机版的基于渐进比对的多序列比对工具,由HigginsD.G.等开发。有应用于多种操作系统平台的版本,包括linux版,DOS版的clustlw,windows版本的clustalx等。ClustalX•ClustalXprovidesanewwindow-baseduserinterfacetotheClustalWprogram.•ItusestheVibrantmulti-platformuserinterfacedevelopmentlibrary,developedbytheNationalCenterforBiotechnologyInformation.Clustalx的工作界面(多序列比对模式)Clustalx的工作界面(剖面(profile)比对模式)Clustal的工作原理Clustal输入多个序列快速的序列两两比对,计算序列间的距离,获得一个距离矩阵。邻接法(NJ)构建一个树(引导树)根据引导树,渐进比对多个序列。Clustal的应用1.输入输出格式。输入序列的格式比较灵活,可以是前面介绍过的FASTA格式,还可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。输出格式也可以选择,有ALN、GCG、PHYLIP和NEXUS等,用户可以根据自己的需要选择合适的输出格式。2.两种工作模式。a.多序列比对模式。b.剖面(profile)比对模式。3.一个实际的例子。Clustal的应用多序列比对实例输入文件的格式(fasta):KCC2_YEASTNYIFGRTLGAGSFGVVRQARKLSTN……DMK_HUMANDFEILKVIGRGAFSEVAVVKMKQTGQVYAMKIMNK…….KPRO_MAIZETRKFKVELGRGESGTVYKGVLEDDRHVAVKKLEN……DAF1_CAEELQIRLTGRVGSGRFGNVSRGDYRGEAVAVKVFNALD……1CSNHYKVGRRIGEGSFGVIFEGTNLLNN……第一步:输入序列文件。第二步:设定比对的一些参数。参数设定窗口。第三步:开始序列比对。第四步:比对完成,选择保存结果文件的格式常用的系统发育分析软件:•MEGA(MolecularEvolutionaryGeneticsAnalysis)–•Phylip(thePHYLogenyInferencePackage)–•PAUP(phylogeneticinferencepackage)–界面文件输入:.meg文件发育树构建比对举例:从其它工具得到的比对结果中构建系统发育树将比对结果文件打开(.mas)将比对结果序列粘贴将比对结果文件打开保存为.mas文件.meg文件是用于分析的.meg文件打开界面系统发育树构建界面Clickgreenboxestoobtainoptionsoptions设置菜单距离:MYH9HUMAN与MYH9RAT的距离是:0.037+0.015MYH9RAT与MYH9CHICK的距离是:0.015+0.045+0.054HowIsExpressionStudied?Thepromoterregionofthegeneinquestioncanbeisolatedfromtherestofthegenome,attachedtoamarkergene,andreinsertedintotheworm.Withthepromoterregion,themarkergenewillberegulatedinthesamewayasthestudiedgene.Thus,cellsexpressingthestudiedgenewillalsoexpressthemarker.HowAreGenesRegulated?Differentcellsunderdifferentconditionsneedtoturngenesonoroff.Theyregulateexpressionusingaregionofthegenethatinteractswithactivatororrepressorproteins.Thisregioniscalledthepromoterregion.What’saGoodMarkerGene?AequoreavictoriaBioluminescenceGreenFluorescentProtein(GFP),whichglowswhenexposedtoUVlight,hasbeenisolatedfromthebioluminescentjellyfishAequoreavictoria.Promoterregion:3-5kb
本文标题:比较基因组学与分子进化5
链接地址:https://www.777doc.com/doc-3546907 .html