您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学论文完结版
生物信息学论文学院:生命科学技术学院专业:生物科学班级:2013级老师:高亚梅学生:蔡欣月学号:20134083003黑龙江八一农垦大学-1-链孢霉GH5-1及GH6-3基因生物信息学分析蔡欣月(黑龙江八一农垦大学,生命科学技术学院,2013级生物科学专业,黑龙江省,大庆市)【摘要】目的:分析和预测链孢霉菌GH5-1和GH6-3基因及其编码蛋白质的结构和特征。方法:利用NCBI、CBS和ExPASy网站中的各种信息分析工具,并结合VectorNTIsuite8.0生物信息分析软件包,分析预测链孢霉菌GH5-1和GH6-3基因并预测该基因编码蛋白结构的特征和功能。结果:GH5-1基因全长2006bp,编码区具有390个氨基酸,在GenBank同源序列中,其与endoglucanase3[NeurosporacrassaOR74A]基因氨基酸序列一致性达到100%,且有GH5-1保守域。GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14。预测GH5-1编码蛋白α螺旋(H)、β折叠(E)、无规则卷(L)的比例分别是16.92%、33.85%、49.23%,2个GTPase结构域。GH5-1蛋白为亲水蛋白,无跨膜区,有信号肽。GH6-3基因全长1914bp,编码区具有419个氨基酸,在GenBank同源序列中,其与exoglucanase3[NeurosporacrassaOR74A]基因氨基酸序列一致性达到100%,且有GH6-3保守域。GH6-3蛋白相对分子量预测为44839.3,理论等电点为6.51。预测GH6-3编码蛋白α螺旋(H)、β折叠(E)、无规则卷(L)的比例分别是29.59%、16.71%、53.75%,1个GTPase结构域。GH6-3蛋白为亲水蛋白,有跨膜区,无信号肽。结论:成功预测GH5-1和GH6-3基因及其编码蛋白生化及其结构特征,为下一步对其进行克隆和表达奠定基础。【关键词】链孢霉菌;糖基水解酶家族5(GH5-1);糖基水解酶家族6(GH6-3)生物信息学链孢霉菌又称脉孢菌、串珠菌、红色面包菌,俗称红霉菌,是食用菌生产中重要的竞争性杂菌之一。其广泛分布在自然界土壤中和和禾本科植物上,尤其在玉米芯上极易发生[1]。通过空气、土壤、腐烂植物、谷物等进行传播、在食用菌生产中,链孢菌和绿菌是生产中最常见的病原菌。链孢霉在高温高湿条件下最易发生,是夏季食用菌生产中危害严重的病原菌,该病原菌生活力强、生长迅速、繁殖快、分生孢子多、易传播,几乎会感染所有熟料栽培的食用菌,并且一旦感染很难彻底消灭,给生产造成较大的经济损失,严重危害所有食用菌的母种、原种、栽培种,以及香菇、木耳、银耳、银耳、灵芝等熟料菌简[2]。目前链孢霉菌的全基因组序列已经获得,但有关其蛋白和基因的各类研究仍为数较少,本文通过对链孢霉GH5-1和GH6-3基因及编码蛋白质进行生物信息学分析,分析其基本生化及结构特征,为下一步对其进行克隆表达和应用奠定基础。一、材料与方法1.1材料通过ExPASy数据库的UniProtKB()获得链孢霉菌的GH5-1与GH6-3基因序列。GH5-1基因编号为NCU00762,NCBI的登录号为XM_959066.2,其他物种的GH5-1的氨基酸序列均来自Genbank,登录号见表1。GH6-3基因编号为NCU09680,NCBI的登录号为XM_952322.2,其他物种的GH6-3的氨基酸序列均来自Genbank,登录号见表2。1.2方法利用美国国家生物技术信息中心(NCBI,)的基本局部比对搜索工具(BLAST,),运用Blastx完成基因同源性分析。应用ORFfinder()寻找其开放读码框,并推导出可编码蛋白序列。利用保守结构域()分析预测其保守域。通过瑞士生物信息学研究所的蛋白分析专家系统(ExPASy,)所提供的蛋白组学和分析工具:Protparam、Proscale程序分析GH5-1及GH6-3蛋白氨基酸组成、相对分子质量、等电点等基本理化性质;TMHMM程序预测GH5-1及GH6-3的跨膜区;SignalP程序预测GH5-1及GH6-3蛋白的信号肽,黑龙江八一农垦大学-2-GOR超链接分析GH5-1及GH6-3的二级结构,SWISS-MODEL通过二级结构比对和折叠,模拟蛋白质的空间构象。利用SMART()分析预测其结构域。二、结果2.1GH5-1及GH6-3基因序列的分析BLASTx分析结果表明,GH5-1与多个物种的GH5基因同源,其中与endoglucanase3[NeurosporacrassaOR74A]的同源性最高,一致性达100%,相似度达58%(图1)。ORFFinder获得其开放阅读框编码氨基酸序列,该基因全长2006bp,编码区为678̴—1850bp,编码390个氨基酸,起始密码子ATG,终止密码子TAA(图2)。CCD分析发现有GH5-1保守域。图1GH5-1基因BLASTx同源性分析图2GH5-1基因开放阅读框分析BLASTx分析结果表明,GH6-3与多个物种的GH6基因同源,其中与exoglucanase3[NeurosporacrassaOR74A]的同源性最高,一致性达100%,相似性达65%(图3)。ORFFinder获得其开放阅读框编码氨基酸序列,该基因全长1914bp,编码区为22—1281bp,编码419个氨基酸,起始密码子ATG,终止密码子TAA(图4)。CCD分析发现有GH6-3保守域。图3GH6-3基因BLASTx同源性分析黑龙江八一农垦大学-3-图4GH6-3基因开放阅读框分析2.2GH5-1及GH6-3编码蛋白的特征分析2.2.1蛋白质的基本参数GH5-1蛋白相对分子量预测为41907.4,理论等电点为5.14,脂肪系数为65.90。在溶液中的不稳定系数是19.02,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物(图5),原子组成(图6)。带负电荷的残基总数28,带正电荷的残基总数22。当蛋白浓度为1g/L,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS)为2.653,在水中280nm摩尔消光指数为111185;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS)则为2.644,在水溶液中280nm摩尔消光指数为110810。总的亲水性平均疏水性指数(grandaverageofhydropathieity)为-0.192,预测为亲水蛋白。图5GH5-1基因的氨基酸组成图6GH5-1基因原子组成黑龙江八一农垦大学-4-GH6-3蛋白相对分子量预测为44839.3,理论等电点为6.51,脂肪系数为80.19。在溶液中的不稳定系数是34.75,为稳定蛋白。当蛋氨酸在N端时,可预测其在哺乳动物网织红细胞(体外)中,半衰期均30小时,在酵母(体内)中,半衰期大于20小时,在大肠杆菌(体内)中,大于10小时。氨基酸的组合物(图7),原子组成(图8)。带负电荷的残基总数40,带正电荷的残基总数38。当蛋白浓度为1g/L,所有的半胱氨酸残基形成半胱氨酸时,吸光指数(ABS)为1.485,在水中280nm摩尔消光指数为66600;所有的半胱氨酸残基不形成半胱氨酸时,吸光指数(ABS)则为1.480,在水溶液中280nm摩尔消光指数为66350。总的亲水性平均疏水性指数(grandaverageofhydropathieity)为-0.207,预测为亲水蛋白。2.2.2疏水性分析、跨膜区分析、信号肽分析TMHMM预测GH5-1蛋白,提示并无跨膜区,位于膜外(图9)。Proscale分析疏水性,结果也提示GH5-1为亲水蛋白(图10)。SignalP分析提示GH5-1有信号肽(图11)。图9GH5-1蛋白跨膜区分析图7GH6-3基因氨基酸组成图8GH6-3基因原子组成图10GH5-1蛋白亲水性分析图11GH5-1蛋白信号肽分析黑龙江八一农垦大学-5-TMHMM预测GH6-3蛋白,提示有跨膜区,位于膜内(图12)。Proscale分析疏水性,结果也提示GH5-1为亲水蛋白(图13)。SignalP分析提示GH6-3无信号肽(图14)。图12GH6-3蛋白跨膜区分析2.2.3二三级结构与结构域SMART预测GH5-1蛋白可能存在2个小GTPase结构域(图15),GOR预测GH5-1编码蛋白二级结构中螺旋(H)、折叠(E)、无规则卷(L)的比例分别为16.92%、33.85%、49.23%,以无规则卷为主(图16)。SWISS-MODEL模拟GH5-1三维结构,应用vectorNTIsuite软件包Dmoleculeviewer显示蛋白质三维结构(图17)。图15GH5-1蛋白结构域图16GH5-1编码蛋白二级结构图13GH6-3蛋白亲水性分析图14GH6-3蛋白信号肽分析黑龙江八一农垦大学-6-图17GH5-1蛋白三维结构预测SMART预测可能存在1个小GTPase结构域(图18),GOR预测GH6-3编码蛋白二级结构中螺旋(H)、折叠(E)、无规则卷(L)的比例分别为29.59%、16.71%、53.75%,以无规则卷为主(图19)。SWISS-MODEL模拟GH6-3三维结构,应用vectorNTIsuite软件包Dmoleculeviewer显示蛋白质三维结构(图20)。图18GH6-3蛋白结构域图19GH6-3编码蛋白二级结构图20GH6-3蛋白三维结构预测三、讨论木质纤维素是地球上资源最丰富,对环境友好,潜力巨大的可再生资源,通过生物方法对纤维素进行降解转化是纤维素利用的一种绿色环保的方法。但在纤维素的生物转化过程中,纤维素酶的使用占成本的比例较高,也是木质纤维素大规模利用的主要瓶颈之一,因此需要快速、高效地筛选纤维素酶特别是来自极端环境生物的纤维素酶,以寻求酶活高,热稳定性好,能适应极端pH环境的纤维素酶。纤维素酶是多组分酶,包黑龙江八一农垦大学-7-括内切葡聚糖酶,外切葡聚糖酶和β-葡萄糖苷酶,纤维素的水解是这三个组分协同作用的结果。其中内切葡聚糖酶作用于纤维素降解的第一步而尤为关键[3]。内切葡聚糖酶最早发现于赐牛的消化液中,之后对来源于真菌和细菌的内切葡聚糖酶进行了深入的研究,且发现内切葡聚糖酶多数来源于细菌。内切葡聚糖酶(EC3.2.1.4)又称为接甲基纤维素酶、Q酶等,分子量大小在23-146kDa之间。内切葡聚糖酶主要作用于纤维素的非结晶区,随机水解卩-1,4-糖苷键,将长链的纤维素截短,对纤维素的整体降解起到了重要作用[4].所以利用基因工程的方法,通过内切葡聚糖酶与外切葡聚糖酶或葡聚糖苷酶的复配协同作用,可以有效地降解结晶纤维素[4]在纤维素酶系中,内切葡聚糖酶作为首先作用于纤维素的第一个酶而尤为重要。内切葡聚糖酶作为纤维素酶的组分之一,也是典型的模块化酶。纤维素结合域(CBM)通过增加纤维素酶在底物表面的浓度,进而提高酶的活性[5]。自发现纤维素酶以来,纤维素酶得到了广泛的认识和挖掘,也受到很多行业的关注。纤维素酶的用途非常广泛,在食品发酵、动物饲料、造纸业、洗涤工业、制药业和污染处理等各个领域均有应用。此外,内切葡聚糖酶在增加果汁产量,啤酒过滤,石油幵采,洗漆剂工业,改善烘焙产品和动物词料的营养质量方面,扮演着十分重要的角色[6]。根据纤维素酶的作用效果,其应用可以分为两类:一,降解植物细胞壁中的纤维素,释放细胞内的糖、蛋白质或其他功能性物质;二,水解纤维
本文标题:生物信息学论文完结版
链接地址:https://www.777doc.com/doc-2199619 .html