您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 基于生物信息学的日本血吸虫酶分子的筛选和识别
本课题得到国家自然科学基金(NO.30271165)和教育部博士基金[(2005)216号]的资助。-1-基于生物信息学的日本血吸虫酶分子的筛选和识别1胡斐1,刘稳升2,吕志跃1,郑焕钦1,余新炳1,吴忠道11.中山大学基础医学院寄生虫学教研室,广州(510080)2.中山大学基础医学院生物医学工程系,广州(510080)E-mail:wuzhd@mail.sysu.edu.cn摘要:目的从已公布的日本血吸虫蛋白序列中找出与人类蛋白在序列上差异较大的日本血吸虫特异性酶蛋白序列。方法从NCBI上下载人类和日本血吸虫相关蛋白序列数据,分别建立本地化的酶蛋白质序列数据库,采用BLAST程序,并以E-10为阈值进行序列的同源性分析。结果获得了459个日本血吸虫酶蛋白质序列,并按生物学功能分成了45个类别。结论获得了一批与人类酶分子有着较大差异的日本血吸虫酶蛋白质序列,为寻找血吸虫病疫苗候选分子和药物靶标提供新的的信息。关键词:生物信息学,基因组,日本血吸虫,酶中国图书馆分类号:R38我国是日本血吸虫病流行严重的国家之一。经过50多年的努力,防治工作已取得了举世瞩目的成就。但近年来,随着生态环境的变化等因素的影响,血吸虫病疫情又有回升的趋势,病人数居高不下,急性血吸虫病时有出现,全国感染人数仍有70多万,大部分流行区的人畜血吸虫感染率在3%~5%,局部地区高达60%以上,重疫区有新发晚期血吸虫病病例出现[1]。人群化疗是当前血防对策中的主要措施之一,但吡喹酮大规模反复使用可能产生耐药性的问题已经引起了各方的关注。因此,开展日本血吸虫病疫苗研究和新药开发对于我国血吸虫病防治可持续开展具有重要的意义。已有研究表明,酶是生物体生命活动重要基础之一,利用酶作为靶标已成为国内外疾病疫苗开发的热点,如目前正在研究的血吸虫谷胱甘肽S转移酶(GST)就是一个公认的疫苗候选发分子[2]。随着日本血吸虫基因组计划的开展[3],也为我们充分利用日本血吸虫基因组的数据信息和生物信息学技术,搭建了大规模筛日本血吸虫酶基因或蛋白质序列提供了可能。为此,本课题组为建立反向疫苗研发体系,开展了基于生物信息学的日本血吸虫酶分子的筛选,获得了459条与人类同源性低的日本血吸虫酶类蛋白序列,为血吸虫病疫苗和新药的研究提供新的有价值的信息。1.材料与方法1.1数据收集分别以Schistosomajaponicum(日本血吸虫)和Homosapiens(人类)为关键词,对公共数据库NCBI()进行查找并下载数据,分别建立本地化的日本血吸虫蛋白序列数据库和人类蛋白质序列数据。由于数据需求的不同,血吸虫蛋白序列以genpept存储以方便对序列进行分析和查找,而人类则以FASTA格式保存以进行比对。1.2研究方法1.2.1日本血吸虫酶蛋白序列数据库的建立按以下标准对本地化的日本血吸虫蛋白质序列数据库进行检索,筛选出可能为酶的蛋白质序列,并且以FASTA格式保存。检索标准为:①已经在定义(definition)中定义为某种酶或者酶的亚基的序列;②该序列含有某种酶或其亚基的保守结构域(conserveddomains);③该序列已有的注释(note)中表明可能为某种酶分子。本步骤语言编写程序完成。程序执行具体功能是按照上述标准对日本血吸虫蛋白质序列库进行扫描,如发现可能为酶的序列,则将该序列以genpept格式挑选出来重新存储到一个新的文件中。所有可能为酶的蛋白序最后都以FASTA格式重新形成一个新的蛋白数据库。1.2.2日本血吸虫酶蛋白质序列的同源性分析利用BLAST工具(在NCBI上下载得到,网址:),将已筛选出的可能的日本血吸虫酶蛋白序列与本地化的人类蛋白序列库进行同源性检索,挑选出比对结果E值大于E-10的序列。1.2.3日本血吸虫特异性酶的蛋白分类对得获得的日本血吸虫可能的特异酶类先按酶的生物活性分类,然后再按照国际生物化学学会酶学委员会提出的“酶的国际系统分类法”作进一步的分类。2.结果2.1同源性分析结果通过查找共获得9937条日本血吸虫蛋白质序列,其中可能属酶类的蛋白质序列有2100多条。通过与311812条人类蛋白序列进行比对,共获得459个与人类同源性较低的日本血吸虫酶序列,其BLAST结果的E值都大于E-10。这类序列可能是日本血吸虫特异性酶类蛋白,包括解旋酶、转录酶和激酶等。表1仅为日本血吸虫与人类蛋白比对的结果中差异最大的(即E值最大)结果。表1日本血吸虫酶蛋白质序列与人类蛋白质序列的比对结果Table1blastresultsofthesequencesfromSchistosomajaponicumenzymesandhomosapiensproteinsClassification分类名称Sj_giNumber日本血吸虫蛋白gi登陆号Homo_giNumber人类蛋白gi登陆号Identity一致率EvalueE值lenth序列长Mismatch非匹配数Score得分Gaps空位Helicase螺旋酶761534971240825444.441.8362030.40Transcriptase转录酶761555442880207631.317.1995128.54Kinase激酶606003195566164538.719.4311928.10Transferase转移酶60700085222873135.715.4563428.92Dehydratase脱水酶60698337Hydratase水合酶567571951401785525.427.55943321Oxidase氧化酶60687536ATPase三磷酸腺苷酶76157687转座酶76154539Hydrolase水解酶60603128Lactamase内酰氨酶567575043718254027.614.00E-0613486523Ligase连接酶56757842244190416032.725821Synthase合酶76155422Endonuclease核酸内切酶567577091403590642.319.00E-06523048.10RNase核糖核酸酶56756442430967628.925.98353302Cyclase环化酶60690961212581239.564.00E-10914962.41Amylase淀粉酶76154340Reductase还原酶76162940492973534.150.007412738.50Nucleases核酸酶5675829030360735.84.00E-06814750.82Nucleotidase核苷酸酶761576643352007226.673.00E-0715010053.55Methylase甲基化酶596342553332979740.357.00E-06573348.51Peptidase肽酶56753947Permeases76163029中,Classification是将所挑选出来的酶分子进行分类的类别;sj_ginumber指的是比对的日本血吸虫蛋白序列在genebank中的唯一纪录号;homo_ginumber指的是人类蛋白序列在genebank中唯一的纪录号;identity是两条比对序列完全相同的氨基酸残基数量在整条序列中所占的比例;期望值E是一个统计显著性指标,是假定所提交的序列和库中的全部序列都是随机序列,所期望的符合数目。只有搜索到比期望值小的符合序列,才作为结果返回。该值具有统计上的意义,而在生物学上并不完全一致。这里所有E值都大于E--10;length是指BLAST结果中符合项序列的长度;mismatch是比对中不匹配的氨基酸残基个数;score报告的为HSP的计算分数。gaps是指由程序产生的间隔数量。表中无比对结果显示的表示该序列BLAST结果E值超出10。(如上所述,由于最终的结果比较大,具体的BLAST中间比对结果并未列出,如对本结果感兴趣的研究工作者可以进一步与我教研室联系。)2.2日本血吸虫酶蛋白的分类将所获得的日本血吸虫特异性酶类分为氧化-还原酶,转移酶,水解酶,异构酶,裂解酶和合成酶等6类,但有6个酶蛋白分子定义不明确。在图1中详细给出了每一大类所包含的酶蛋白数,并且清楚显示了按国际化酶分类标准分类后每类酶再细分的直观情况。(c)oxido-reductases氧化还原酶类(b)transferases转移酶类(d)hydrolases水解酶类(e)isomerases异构酶类(a)classifyingenzymebyinternationalstandard酶的国际化标准分类每种酶的后面所跟的数字是属于这种酶的蛋白数量,a图显示的是按国际分类法分类的概况,b-g则显示的是6大分类的详细情况。3.讨论寄生虫酶蛋白在维持虫体在宿主体内生存具有重要的作用[4],此外寄生虫对宿主和器官的选择需要诉诸独特信号激活的酶的相互作用。研究表明,曼氏血吸虫童虫在移行至肝-门脉血管系统后其体壁的碱性磷酸酶活力显著增强,10天后其肠上皮细胞和食道腺对显示磷酸酶活力的反应日益增强,19~21天后其生殖器官也可见磷酸酶活性[5]。血吸虫寄生于宿主门静脉系统,以摄取宿主红细胞作为主要营养来源。血吸虫通过自身的血红蛋白酶将宿主红细胞中的血红蛋白降解加以利用,起
本文标题:基于生物信息学的日本血吸虫酶分子的筛选和识别
链接地址:https://www.777doc.com/doc-285707 .html