您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 薪酬管理 > KEGG数据库中文教程
博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:这篇教程介绍了什么?2.KEGG数据库里面有什么?3.我如何查询某一特定的代谢途径(pathway)的信息,例如Glycolysis/Gluconeogenesis?4.我如何查询某一化合物的信息,例如Pyruvate?5.我如何查询Pyruvate涉及了哪些生化反应?6.我如何查询某一基因的信息,例如gltA?7.我如何知道Bacillussubtilis是否有gltA?8.我如何查询gltA在其他物种中的同源基因?9.我如何列出某一代谢途径中涉及的所有的酶?例如cytratecyclepathway(TCA循环)10.我如何知道人类的cytratecycle中pyruvatecarboxylase这种酶有多少化合物与其发生相互作用?11.我如何查询人类由Citrate生成Acetyl-CoA的可能步骤?12.我有一条未知的序列,如何查询KEGG数据库中是否有基因或酶与其对应?博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:一.简介代谢(Metabolism)是指细胞内发生的各种化学反应的总称。一个代谢途径(Metabolicpathway)包括一系列互相联系的反应(reaction),反应中的酶(enzyme)以及反应中的前体或者产物(substrate)。随着现代生物信息学的进展,我们可以通过计算机来展示,以至预测细胞内的代谢途径。现在常用的查询代谢途径的数据库主要包括:KEGG(),GenMAPP(),BioRag()等。本教程主要介绍KEGG数据库的使用方法。KEGG(KyotoEncyclopediaofGenesandGenomes)是由日本京都大学和东京大学联合开发的数据库,可以用来查询代谢途径,酶(或编码酶的基因),产物等,也可以通过BLAST比对查询未知序列的代谢途径信息。KEGG主要通过Web界面进行访问,同样也可以通过本地运行的Perl或java程序进行访问,使用很方便。本教程将结合实例来介绍KEGG数据库的使用方法,希望能您能通过本教程了解KEGG数据库的基本使用方法。二.使用方法1.首页打开KEGG的首页,我们可以看到KEGG提供的四个主要的数据库(图1箭头所示)。PATHWAY(代谢途径数据库),可以查询各种代谢途径。BRITE(代谢通路及同源基因数据库),这个数据与PATHWAY数据库不同的是,可以查询酶和底物之间的关系,也可以查询某种酶的同源基因。GENES(基因数据库),可以查询不同的基因或基因组的信息。LIGAND(配体数据库),可以查询反应中各种化合物的信息。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:——KEGGTableofContents这个链接,则会出现一个类似于网站地图的页面,在这个页面上,我们可以查询各数据库的更新信息,也可快速访问KEGG提供的各个数据库。点击KEGGOrganisms会列出KEGG对各物种的代码。KEGG使用三个英文小写字母来代表各个物种,例如人类Homosapiens,代码是hsa。再如小鼠MusMusculus则是mmu。2.PATHWAY数据库的使用在首页上点击PATHWAY的链接(或者先选择KEGG2,再在出现的表格中Database选项下选择KEGGPATHWAY)。您就会看到KEGG收录的所有代谢途径信息(图2)。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:这个代谢途径(图2)。1)从首页,或者KEGG2的表格界面中进入PATHWAY数据库2)点击CarbohydrateMetabolism中的Glycolysis/Gluconeogenesis新页面即显示出此途径的信息(图3A)。方框中表示的是反应中的酶,例如2.7.1.41,这是酶的ECnumber,国际酶学委员会的编号。小圆圈代表的是反应中的化合物,例如α-D-Glucose-1P。箭头代表的是反应的方向。虚线表示此反应可以通过中间产物与其他途径发生联系。或者您也可以通过SearchPATHWAYfor这个选项直接搜索Glycolysis/Gluconeogenesis的信息。搜索的结果中会显示出满足条件的所有物种的pathway。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:(A)(B)图3.代谢途径图片信息A:Glycolysis/Gluconeogenesis途径的全面信息B:人类中Glycolysis/Gluconeogenesis途径的信息如果想要知道人类的Glycolysis/Gluconeogenesis途径的具体信息。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:)点击此界面左上角的下拉菜单。选择人类HomoSapiens(human)2)点击Go即可见图3B的画面。绿色的方框代表人类含有这种酶,例3.1.3.9。你也可以通过下拉菜单旁的Select按钮自行设置下拉菜单中显示的物种名称。点击标有3.1.3.9的绿色方框,即可显示人类中此酶的信息(图4)。Entry是KEGG中此酶的ID。Genename是酶的简化名。Definition包括酶的通用名称和ECnumber。KO是在KEGG数据中这种酶的同源序列号。Pathway中列出了这种酶涉及的代谢途径。此外,还有一些其他的信息,例如编码这种酶的基因在基因组中的位置(Position),编码酶的基因序列(NTseq)和蛋白序列(AAseq)等。图4.酶3.1.3.9的信息3.LIGAND数据库的使用LIGAND数据库中,可以查询到化合物,反应或者参与反应的酶。可以在上面的搜索框中进行名称查询,也可以在下面的LigandRelationalDatabase里进行配体或反应关系的查询。例如想要查询数据库中Pyruvate(丙酮酸盐)的信息(图5A)。1)在SearchCOMPAND的下拉菜单中选择Name2)输入Pyruvae3)点击Go就会出现图5B的画面。在给出的结果中可见它的entrynumber(C00022),分子结构,化学式等属性,也可以点击Entrynumber后进入另一个界面查看它更多的信息。博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:(A)(B)图5.LIGAND数据库界面及SearchCompound的使用再例如,我们需要查询Pyruvate(丙酮酸盐)所涉及的化学反应的信息(图6A)。1)在SearchREACTION的下拉菜单选择ReactantEntry博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:)输入Pyruvate的entrynumber,C000223)点击Go就会出现Pyruvate所涉及的反应(图6B)。(A)(B)图6.SearchREACTION的使用博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:.GENES数据库的使用GENES数据库可以用来查询基因及基因组的信息。例如想要查询gltA(柠檬酸盐合成酶)这种基因的具体信息(图7A)。1)在Search的下拉菜单选择Genes(默认,可不选)2)输入gltA3)点击Go在出现的结果中即可查得所有编码这种酶的基因(图7B)。像是第一个结果eco:b0720,eco是物种名(EscherichiacoliK-12MG1655),b0720是entryname。gltA是基因名,之后还有基因的全称,以及编码的酶的ECnumber等。物种名可以通过首页上的KEGGOrganisms来查询。再例如我们想要查询Bacillussubtilis中是否有gltA这种基因(图7C)。1)在首页的KEGGOrganisms中找到Bacillussubtilis的缩写为bsu2)SearchOrganism中输入bsu3)再输入gltA4)点击Go即可查得相应信息(A)博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:(B)(C)图7.GENES数据库界面及搜索功能的使用博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:数据库可以用来查询某一基因的同源基因。例如如果想要查询gltA的同源基因(图8)1)从KEGG首页进入BRITE数据库2)点击进入KO-Pathway-basedclassificationoforthologs(图8A)3)在出现的页面上选择Textsearch(图8B)4)输入gltA或者citratesynthase,按回车键(图8C)这样就会显示出gltA的KO分类(KOgroups)了(图8D)。需要注意的是基因的KOgroups是按照不同的代谢途径来列出的,所以一个KOgroup可能被列出很多次。点击KO序号,即可查看此类同源基因(图8E)。(A)(B)博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:(C)(D)(E)图8.KO数据库的使用博奥生物有限公司生物芯片北京国家工程研究中心北京市昌平区生命科学园路18号邮编:102206电话:86-10-80726868传真:86-10-80726898网址:http:
本文标题:KEGG数据库中文教程
链接地址:https://www.777doc.com/doc-2171190 .html