您好,欢迎访问三七文档
生物信息学课程论文一个玉米Mlo基因的电子克隆与生物信息学分析姓名:学号:班级:生科2班一个玉米Mlo基因的电子克隆与生物信息学分析摘要:Mlo基因家族在植物抗病方面有极大的优势,但有些Mlo基因的功能还未知。经序列拼接电子克隆得到1个玉米的Mlo基因,采用生物信息学方法预测分析了编码蛋白的一、二、三级结构,并对其功能进行了预测。结果表明:玉米Mlo基因编码的蛋白有一个保守的DUF1084结构域,此结构域功能在植物中尚未知。生物信息学分析表明,此蛋白很可能是一种类似于G蛋白偶联受体的膜结合转运蛋白而参与到信号传递过程中。关键词:玉米;Mlo基因;电子克隆;生物信息学植物在长期的生物进化中形成了一系列复杂而严密的防御机制,使自身免受病原物的侵害[1,2]。抗病基因是植物防御体系中的最重要组成部分。Mlo基因最初在大麦中被发现,这类基因在植物中编码一个七次跨膜结构域的蛋白家族,可能起到与G蛋白偶联受体(GProteinCoupledReceptor,GPCR)类似的功能。他们的拓扑结构、亚细胞定位和序列多样化与动物和真菌的G蛋白偶联受体很相似。野生型mlo基因赋予大麦对白粉菌的广谱抗性[3]。白粉病是由白粉菌引起的真菌性病害,白粉菌能侵染650多种单子叶植物和9000多种双子叶植物[4,5]。目前已对拟南芥、水稻和杨树中的Mlo基因家族有深入的研究[6]。电子克隆法是近年来基于表达序列标签(ExpressedSequenceTag,EST)和基因组数据库发展起来的基因克隆新型技术[7],具有效率高、成本低、对实验条件要求低等特点。因此可以快速获得一些新基因,从而使新基因的应用成为可能。挖掘玉米中未知的抗病基因对玉米的抗病育种有很大帮助。本研究以玉米为材料,对其中的一个Mlo基因进行电子克隆,并对其进行部分生物信息学方面分析,为玉米Mlo基因的应用及玉米的抗病育种提供理论依据。1材料与方法1.1试验材料来自NationalCenterforBiotechnologyInformation(NCBI)的蛋白及核酸数据库。1.2玉米Mlo基因的电子克隆根据GenBank上公布的水稻Mlo基因序列(Os01g54784.1),通过NCBI的tblastn得到玉米的EST序列(GenBank登录号分别为EE177882.2,DV523805.1,EB163548.1,EB163379.1),经序列拼接后利用NCBI的ORFFinder得到玉米Mlo基因的cDNA序列。1.3玉米Mlo基因的生物信息学分析利用来自生物信息学数据库和互联网上的软件进行分析[8,9]。用Protparam分析蛋白的一级结构及其等电点、分子量和半衰期;用TMHMM2.0Server进行跨膜结构域分析;用Predictprotein和SOPMA预测其二级结构和疏水性;用TargetP进行导肽分析;用SignalP3.0Server进行信号肽分析;用Protfun2.0Server分析蛋白质功能;用CPHmodels-3.0Server预测其三级结构。2结果与分析2.1玉米Mlo基因的电子克隆及蛋白翻译玉米EST序列经序列拼接后得到Mlo基因的全长及翻译蛋白如下:Mlo基因的cDNA为:ATGGGCCGCTACGGGCCCTTCCCTGCCGCCGCCGGTGATGGCGGGGGCTGCCTGCCCCTGCCGATTGTAGCGGCTGAAGGCGCGCTGGCTGTCCTGGACGGCGCCATTGCGACCGCGGCCTTCGTGCAGTTAGCAAGGATTCATAGGCACAACCAGCTACAAGGATGGACTCGGCAAAAGATATTCCATTTTATGATTGGTCTATCAAACATAGTATTCCTAGTATATTTCGTGTCTACCATCATTGCTACTTGTCAGAGATGGATTTGCTGGGTACATGGATGTGGATTTGTTCTCATGGCTAGTCCACAGATATTGCTTCTTGCTTCTTTCCTCTTGCTACTGTCATTCTGGGTTGACCTGTGTCATCAGACAAATGATGAAGACGAAGAAGATGGAAGGAGTCAGAGTCACCATGAAGCTTTACTAGACAGAACAAAAGCGAAACCTGGCATTCATCCTGTTAATATCCGTCAGAGGTGTTGCCCAGGAATACAGCTTGGAAGCCGGCAAAAATTTGTGATTTTGGTGCTTCTACTGTCATTTGTTGTTATGCTTGCCTTTGCCATCCTCATATGGGTTGGTAGAGGAGACAATCCTATCGATTCTTCTCTACTGAAAAGGGTTTATTTGGATGTATTTTCAGTAGTAGTTATTGTACTTGGTGGTGCTCTGGCATGTTACGGTGCAGTGTTATTCTCGAAGATGAGCAAAGTTCGTTCTGAAACTGTATCAACTGAGAAGTGGAAGGTTGCCAGTTTAGCTGCTGTCTCGCTGATCTGTTTCTCGTCTTCTGCTATACTTGCACTTGTGACTAATGTTCCAGTGCTTTTGTATTGGTACTCAACAGATGTGGACATCATCAACAATGCTGTTATTTTGTTTATATATTACTTCATAGGCTCGTCAGTGCCATCAGGATTTGTTCTATGGATCATGAGAGAGATGCCTCATCGGCAGGTAGTTGAAAGATCCGTAGAATCGAGGGTGGTTACTTTGTTCAGGGAAAGACCATCAACTACGCAGGATCCACAGTGGAGGACAGCTGTCACATCCTCAAACAAGGCCCTCAAGTCAAGCCCAATTTAA翻译蛋白为:MGRYGPFPAAAGDGGGCLPLPIVAAEGALAVLDGAIATAAFVQLARIHRHNQLQGWTRQKIFHFMIGLSNIVFLVYFVSTIIATCQRWICWVHGCGFVLMASPQILLLASFLLLLSFWVDLCHQTNDEDEEDGRSQSHHEALLDRTKAKPGIHPVNIRQRCCPGIQLGSRQKFVILVLLLSFVVMLAFAILIWVGRGDNPIDSSLLKRVYLDVFSVVVIVLGGALACYGAVLFSKMSKVRSETVSTEKWKVASLAAVSLICFSSSAILALVTNVPVLLYWYSTDVDIINNAVILFIYYFIGSSVPSGFVLWIMREMPHRQVVERSVESRVVTLFRERPSTTQDPQWRTAVTSSNKALKSSPI由此可知,玉米Mlo基因cDNA全长为1089bp,编码的蛋白具有362个氨基酸残基。2.2蛋白一级结构及理化性质预测利用Protparam得知,该蛋白的分子量为40025.9Da,等电点(pI)为8.97,带正电残基(Arg+Lys)总数为31,负电残基(Asp+Glu)为24。总的亲水性平均系数为0.480,预测该蛋白属于疏水性蛋白。理论推导半衰期为30h,不稳定参数是46.29,属于不稳定蛋白。这可能是其功能不明的原因之一。其氨基酸组成见表1。由表1可知,该基因含Leu(L)最多,占11.6%;其次为Val(V),占10.8%;不含Pyl(O)、See(U)、Asx(B)、Glx(Z)和Xaa(X)氨基酸。2.3跨膜分析跨膜结构域是膜中蛋白与膜脂结合的主要部位,一般由20个左右的疏水氨基酸残基组成,形成α螺旋,与膜脂相结合。预测和分析跨膜结构域对认识蛋白质的结构、功能、分类以及在细胞中的作用部位均有一定的意义。用HMTOP和TMHMM预测跨膜结构分析均表明(图1),此蛋白有7次跨膜的结构域,分别在17-41、62-84、97-119、173-194、209-233、254-278、291-312个氨基酸处形成跨膜的结构域。提示此蛋白具有多次跨膜的结构域,可能具有与G蛋白偶联受体相类似的功能。2.4保守结构域分析利用NCBI链接的CDD分析表明,玉米Mlo基因编码的蛋白属于DUF1084超家族的一类膜结合蛋白(图2),此家族的蛋白从植物到人类均非常保守(拟南芥、水稻、线虫、斑马鱼),但其功能尚未知。用ProtFun2.2Server预测此蛋白的功能,此蛋白为非酶的膜结合转运蛋白。2.5信号肽及导肽预测和分析分泌蛋白及细胞膜蛋白均以前体物质多肽的形式合成[10],其N末端含有作为通过膜时信号的氨基酸序列,这种氨基酸序列称信号肽或信号序列,由15~25个氨基酸所组成。而导肽是一段引导新合成的肽链进入细胞器的识别序列。用SignalP3.0Server及TargetP1.1Server分析表明,此蛋白为叶绿体转运蛋白(分值为0.044)和线粒体定位蛋白(分值为0.037)的可能性均较小,不是信号肽。结合跨膜结构分析的结果,推测其可能在生物膜上作为一种接收信号的膜结合蛋白而参与到信号传递过程中。2.6玉米Mlo基因氨基酸序列疏水性/亲水性的预测和分析氨基酸是蛋白质的构件分子,其亲水性/疏水性在形成和保持蛋白质的三级结构上起作用。通过了解肽链中不同肽段的疏水性,还可以对蛋白的跨膜结构域进行预测。因此,疏水性/亲水性的预测和分析,为蛋白质次级结构的预测及功能分析提供理论参考。采用ProtScale分析此蛋白的疏水性/亲水性结果表明(图3),亲水性最强分值为-3.267,疏水性最强分值为3.478,总体来看,氨基酸分值分布比较均匀,氨基酸序列没有明显的疏水性或亲水性区域或亲水/疏水区域分布较为均匀。结合一级结构分析结果认为,此蛋白总体表现为疏水性,但疏水性不强。2.7二级结构的预测和分析多肽链借助氢键排列成沿一维方向而呈现有规则的重复构象的二级结构,是氨基酸顺序与三维构象之间的桥梁。二级结构借助范德华力、氢键、静电和疏水等相互作用形成蛋白质的三级结构,从而发挥正常的生物学功能。用SOPMA对此蛋白的二级结构预测表明(图4),此蛋白α螺旋占44.08%,无规则卷曲占34.21%,β转角和延伸占21.71%。2.8三级结构分析利用Expasy的在线CPHmodels3.0Server工具预测玉米Mlo蛋白的三级结构,利用SweetMollyGrace视图软件得到如下三维结构图(图5)。从图5可以看出,玉米Mloo蛋白的三维结构属于典型的Mlo家族,并在其N端可能还存在一个特殊的结构域用来结合膜外的信号。2.9与水稻Mlo基因的比较利用Clustalx软件对玉米和水稻的Mlo蛋白序列进行比对结果表明,玉米与水稻的相似性为83.47%,结果如下:比对结果表明,Mlo基因在进化中有很大的保守性,而这也是G蛋白偶联受体的最重要特征。3结论利用从NCBI得到的玉米ESTs序列,经拼接后得到玉米Mlo基因的cDNA全长。利用生物信息学方法对其编码氨基酸序列从结构组成、基本理化性质、疏水性/亲水性、导肽和信号肽、蛋白质二级及三级结构以及功能域等方面进行了预测和分析。结果表明,从玉米中克隆得到的Mlo基因全长1089bp,编码362个氨基酸,不含Asx(B)和Glx(Z)氨基酸,是一种不稳定蛋白,这也可能是其功能尚不明确的原因。二级结构显示此蛋白没有明显的疏水或亲水性区域。信号肽预测、跨膜结构域分析及保守结构域分析表明此蛋白为导肽的可能性很小,既非叶绿体转运蛋白,也非线粒体定位蛋白。三级结构预测其有类似G蛋白偶联受体的结构,推测其可能在生物膜上作为一种接收信号的非酶的膜结合蛋白而参与到信号传递过程中,且Mlo基因在进化上体现出较大的保守性。具体的功能还有待进行进一步的实验研究。参考文献:[1]韩德俊,李振岐,曹莉,等.大麦抗白粉病基因Mlo的研究进展[J].西北植物学报,2003,23(3):496-502.[2]秦余香,赵双宜,支大英,等.根癌农杆菌介导大麦Mlo反义基因转化小麦[J].山东大学学报(理学版),2004,39(5):102-
本文标题:生物信息学论文
链接地址:https://www.777doc.com/doc-2199617 .html