您好,欢迎访问三七文档
当前位置:首页 > 学术论文 > 其它学术论文 > 基因组规模代谢网络的重构进展及其在中医药研究中的应用前景展望
基因组规模代谢网络的重构进展及其在中医药研究中的应用前景展望郑媛嘉1,郭文峰2摘要:系统生物学是从一个整体水平入手研究生物系统的一门新兴科学,其方法较多的是利用建立网络的方法来诠释生命系统各组分的关系,而另一方面,随着全基因组测序技术的迅速发展和基因注释工作的完成,生命科学研究迎来后基因时代,所以,从基因注释出发建立的基因组尺度代谢网络因其跨学科地综合了生化和生物信息技术,又具备了稳定性及其可运算性,使其成为当前研究最广泛而深入的研究项目,并且在代谢疾病研究、基因预测研究、生物工程等方面得到了广泛应用。而当前中医药也处于继承与发展的关键时代,中医辨证思维和个性化医疗的传承和探究是中医药继承者一项大课题,基因组代谢网络恰好为中医药现代化提供了研究新思路和技术平台,其前景广阔而影响深远。如何结合现代生物信息技术,剖析中医本质内涵,是现代中医研究的大课题。基因组代谢网络以其整体性和网络可联系性,与中医辨证观和整体观相通,这为用生物信息语言解读中医中药提供可能。本文将概述基因组规模代谢网络进展,并对其在中医药方面可能的应用进行分析展望。关键词:基因组尺度,代谢网络,中医药证候研究,中药复方研究从20世纪70年代系统理论开始发展以来,系统生物学研究越来越成为后基因时代生命科学研究的研究热点,其研究不同于以往仅针对基因、蛋白等生物分子,而是在于研究所有的基因、所有的蛋白质、组分间的相互关系,即高强度的整合物种内的所有生物信息,而它的实现方式和目标就是建立一个尽可能接近真正生物系统的理论模型。网络模型构建过程渗透于系统生物学研究的每一阶段,故也越来越成为生物学研究热点,基因组代谢网络(Genome-ScaleMetabolicNetwork,简称GSMN)就是这种理论模型体系中的一个分支。当前基因测序技术、高通量实验技术、生物工程理论基础的发展和完善也促进了模型重构的发展,本文将概述GSMN进展,并对其在中医药方面可能的应用进行分析展望。1.基因组代谢网络概念GSMN指从基因组序列出发,结合各种代谢数据库和实验数据,将生物体中与代谢活动相关的基因、酶和代谢物进行鉴别、分类,并研究各个组分之间的相互关系,然后把生物体体内大量的代谢生化反应,以代谢物为节点,结合形成网络拓扑结构,成为解读生物体代谢过程的入门图谱。如今,很多学者在此网络的基础上对其蛋白调控、代谢调控、各蛋白组相互作用等方面进行更深入的分析研究,在对蛋白质合成、定位、功能及其表型进行准确的预测后,其也被广泛应用于可以用于菌种改进、发现药物靶点、代谢工程操作靶点识别、生长表型预测等多方面用途。[1][2]作者简介:1郑媛嘉,女,硕士研究生,研究方向:基因组代谢网络模型的研究与应用。2郭文峰,男,硕士生导师,副教授。工作单位:广州中医药大学脾胃研究所通讯地址:广东省广州市机场路12号广州中医药大学实验楼脾胃研究所。邮政编码:510000联系电话:020-36585080电子邮箱:330483077@qq.com2.技术及其应用进展2.1技术方法如今GSMN的研究已较为深入,其构建方法也日趋完善,简单来说该工作可分为四个部分:代谢相关数据收集、关系模型建立、数据整理修正和转化为数学模型[3],Palsson团队又将其细化成:体内代谢生化反应草图的构建、代谢物数据的补充修正、转化为计量模型、验证模型四大部分共96个步骤[4]。数据收集方面,目前已有多个数据库可免费获得各种生物信息(如BiGG、KEGG、pathwaytool等)。在各数据库中需要收集提取的是目标物种特异的基因、蛋白质、反应和代谢物信息等数据。由于每一个代谢反应都有特定的蛋白酶催化介导,而这些特定的蛋白信息有相应的基因编码,代谢物之间通过代谢反应也形成一定的关系,利用这些联系,可把代谢物关联在一起而初步形成网络。完成了这个初步网络只是重建工作的一小部分,GSMN重建工作关键在于对生物信息的校正校对,校正工作的必要性和繁重性主要表现在以下几个方面:(1)不同数据库的生物信息可能存在如酶号信息,基因编号信息不同,需要反复校验,查阅资料等以确保信息正确;(2)对于拟研究的特定生物体,有些特定代谢反应是不存在的,但数据库里的信息不能完全自动识别,必须由人工发现并剔除;(3)代谢反应的方向,辅酶的确定,电荷配平,反应量等信息也是数据库没有完全提供的,需要人工通过各种方法进行完善;(4)在提取的生物信息中会发现某些代谢物没有生成来源,或者没有代谢下去的路径,我们称这些网络断口为终末代谢物(deadends)。这种情况有可能属于“隐匿反应”(sinkreaction),即它的代谢过程不在生物体中,但它的物质却是整个代谢网络所必须的,比如该代谢物是通过异化扩散,胞吞胞吐等方式进入细胞并参与代谢反应。所以通常在验证整个网络时,需要添加这些必须底物,以保证代谢网络的正常运作。也有另一种可能,那就是该生物信息确实存在,但仍然未被研究探知或是研究不足,需要拓展查找途径以获得相关数据,或者进行实际生物代谢实验获得数据,确实无法获得相关信息的,可暂时通过添加“需求反应”(demandreaction)来解决。完成数据整理完善后,需要把形成网络的数据转化成数学模型,其核心在于转化为计量系数矩阵(图1),转化完成后才能用合适的模拟算法进行运算,其模型的运算工作可利用各种模拟运算工具如COBRAToolbox、COBRApy等完成[4,5]。目前较常用运算技术是基于约束的优化模拟方法(Constraints-basedgenome-scalemetabolicsimulation),在现实的代谢体系中,由于反应比代谢物多,代谢也有很多未知的可变因素,所以整个系统通量分布情况可能空间是无限的。所以该算法是将研究系统设定在拟稳态的条件下进行并分析,通过添加一定的约束条件,再根据我们需要分析的对象设定目标函数,从而研究预测到生物该状态下的通量情况,得到所需要的代谢最优化方案(图2)。将这个模拟运算出来的结果再与实验结果进行对比,找出差异,以此发现网络模型某些数据的错漏,进行数据修正完善,然后再模拟运算,再对比,如此往复不断提高准确率直至构建出完善的代谢网络[1]。图1计量系数矩阵在矩阵S中每一行对应一个代谢物,每一列对应一个反应[1]图2基于约束的模型分析算法基本原理示意图[6]2.2模型的应用评价一个基因组规模代谢网络模型成功与否的标准是该模型能否在给培养条件下真实预测细胞生长,它建立的基础在于经过大量人力的搜集和整合后,发现生物信息库中所没包含的“隐藏信息”,如调控信息,生物通量信息等等,发现这些隐藏的生物信息后就其生物信息就可有广泛的应用,如模拟微生物在不同调控环境下或遗传条件下的基因表现,对未知基因功能的预测,发现药物靶点等[7]。其中目前应用最为广泛的包括代谢相关疾病研究、基因敲除及生物工程三方面。2.2.1代谢相关疾病的研究[8]现代社会人类内分泌及代谢性疾病越来越常见,比如甲亢、糖尿病、肥胖症等,而物质代谢本质渗透各种人体机能调节以及疾病的发生,故欲了解这些疾病发生的机理和过程离不开对物质代谢本质的研究,基因组规模代谢网络恰好是一个良好的代谢物代谢集成系统。如在肥胖症的研究中,VanEunen等人通过建立线粒体代谢模型并将其设定在脂肪过量的生物环境,以测试脂肪酸降解的差异[9]。KhazaeiT等人又通过集成网络(多种网络的集成,如代谢网络与转录网络的集成)洞悉和预测了药物对肿瘤细胞的潜在靶点,并且由此计算出对比只抑制单一酶,抑制转醛醇酶(TALA)和甘氨酸羟甲基转移酶(GHMT2r)能降低三倍的肿瘤生长率,这对于肿瘤药物研发具有重要意义。[10]更系统地,Lee等人以代谢网络中的酶为突破点,与OMIM(OnlineMendelianInheritanceinMan持续更新的关于人类基因和遗传紊乱的数据库)中遗传病的致病基因(基因-酶)联系,建立起代谢疾病网络(metabolicdiseasenetwork),以代谢网络为基础,从宏观的角度促进疾病与疾病之间联系研究[11]。2.2.2基因敲除在对生物的分析预测工程中,代谢网络是强大的工具,最广泛运用的是在网络的基础上用基因敲除的方法检测基因是否是必需基因,基因敲除检测必需基因,简单来说即在已转换的数学模型中,目标函数设定为最大化的生物量,将所要敲除的基因对应的反应通量设定成0进行检测。当然也可用基因敲除方法对微生物特殊生理的预测,或基因敲除后验证模拟结果以发现网络错漏,促进网络的重建完善。随着技术的成熟和计算方法的完善,这种模拟预测也成为网络重建后必进行的应用。ImanFamili2003年建立酿酒酵母菌代谢网络并进行实验了实验验证,其模拟准确率达80%[12]。基因敲除可谓代谢网络分析的基础运用。2.2.3生物工程的运用通过代谢网络,运用各种通量技术,如流平衡分析方法(FluxBalanceAnalysis,FBA)、动态流平衡方法(DynamicFluxBalanceAnalysis,DFBA)、代谢调节最小化分析(MinimizationOfMetabolicAdjustment,MOMA)、调节的开关最小化(Regulatoryon-offminimization,ROOM)等,可以分析生物代谢的调控机制相关。但仅仅分析代谢调控来预测蛋白功能、生物体的代谢物产量等等还是不完善且不准确,网络分析要多维结合,所以真正的代谢网络模拟是结合了代谢流分析,基因调控信息分析等方面全面调控,即当外界环境出现变化,生物体自身要通过怎样的基因转变来保持代谢和产量,这些都是代谢网络模型建立和模拟的重要目的。它可以指导微生物菌体产量的改进,促进优良工程菌的构建等。ChemlerJA等人利用代谢模型验证通过基因敲除提高NADPH有效性可改造大肠杆菌的生物合成[13],BroC等人利用酿酒酵母菌代谢网络模型获得了数个在无氧条件下降低甘油提高乙醇产量的氧化还原代谢的代谢工程策略[14],RobertsSB等人建立热纤梭菌的代谢网络模型:iSR432,并用此网络分析细胞内氧化反应和乙醇分泌的关系,预测了能提高乙醇产量的基因敲除方法和环境条件[15],这些均是该技术方法在生物工程中应用的典型实例。2.3目前不足及进展虽然目前基因注释,生物信息来源广泛,获取方便,且数据管理整合工具、计算工具等都随着代谢网络重建工程的逐步深入而不断的更新升级,但是目前还是有许多关键技术问题没有办法解决,比如数据校正修补,获取的数据怎样甄别错漏等工作还是无法批量或快速的用工具检测,仍然需要人力研究构建,所以目前构建起来的网络局限于菌体或简单的生物体,对于复杂的生物体代谢网络的重建还是一个巨大的挑战。而且,对于已构建起代谢网络的生物,又缺少标准的格式、编号、收录方式等,不利于已构建代谢网络的应用和整理。而对于代谢网络重建后的分析研究,上文提到最常用的是基于约束的优化模拟方法,其主要可分为静态分析和动态分析,静态分析主要是基于网络拓扑结构的分析,主要有流平衡分析方法(fluxbalanceanalysis)、基于凸分析的基元模式方法(elementaryfluxmodeanalysis)、基于凸分析的极端途径方法(extremepathwayanalysis),以及图论方法(graphtheory)。动态分析方法主要基于动力学信息的分析,主要有控制论模拟方法(cyberneticmodeling)、代谢控制分析(metaboliccontrolanalysis)[16]。目前的分析方法较多的是静态分析,但值得注意的是生物代谢过程是个实时动态的过程,有很多突变,环境改变,代谢浓度等无法掌握的扰动因素,而目前生物信息对代谢动力学和热力学等信息仍不完善,目前的分析技术虽然发展很迅速,但还需要拓展更多有效的动态研究分析方法。不仅如此,单一网络的构建分析还远远不够用于系统生物学研究,还需要促进网络的多维分析:代谢网络、蛋白网络、转录调控网络,信号传导网络的集成,这还是一条很长的路,所以当前网络的构建和模拟分析(尤其是国内)还处于初步阶段。3
本文标题:基因组规模代谢网络的重构进展及其在中医药研究中的应用前景展望
链接地址:https://www.777doc.com/doc-8693559 .html