您好,欢迎访问三七文档
当前位置:首页 > 电子/通信 > 综合/其它 > 第十四章-药物生物信息学
生物信息学第十四章药物生物信息学哈尔滨医科大学徐良德生物信息学学习提纲重点药物靶标的识别和验证药物靶标结构预测与软件使用药物基因组生物标志物的发现与验证药物基因组在新药开发的应用难点药物靶标结构预测与软件使用药物靶标相关数据库熟悉第一节引言Section1Introduction人体内核酸,蛋白质等大分子、小分子等内源性物质的稳定浓度和代谢速度存在很大差异。这些差异一定程度上决定了个体对疾病的易感性和机体对外源性刺激和药物的反应效果。阐明疾病易感性和药物反应与机体各分子种类和数量关系具有重大意义。药物生物信息学就是在高通量大分子物质大量的定性和定量研究、小分子化合物作用效果探索基础上,借助信息学手段实现药物靶标识别、新的生物和化学药物开发、药物作用效果预测、药理机制阐明、个性化给药分析与应用的新兴领域。第二节药物靶标的信息学识别Section2BioinformaticsTechnologiesofDrugTargetsDiscovery一、药物靶标概述药物靶标(drugtargets)是生理状态下物质代谢或信号通路的关键组成部分,也是直接参与细胞内外特定大分子、小分子活性作用或病原微生物入侵的功能分子。有效靶标特征①对影响疾病病理过程的物质代谢或信号通路有控制作用;②尽可能在诱发疾病的病理过程中位于生成该物质的最终环节,或处于与疾病密切相关的信号通路下游关键环节;③尽可能不参与与疾病无关的组织或细胞生命活动所必需的代谢过程或信号传递过程;④尽可能避开多个代谢或信号通路的交叉点。人体内源性产生及病原体入侵后产生的蛋白质是药物靶标筛选的最重要的对象。随着人类和大量微生物基因组测序的完成,人类蛋白质识别、鉴定、结构分析技术的不断完善,以及药物分子和药物靶标知识的积累,用生物信息技术发掘药物靶标是新药发现的基础。生物信息学药物新靶标发现技术主要有两类一类是以实验识别的疾病相关基因或蛋白质为研究对象,从作用功能的角度推断其作为候选药物新靶标的可能性。另一类结合已知的药物作用方式和靶标序列特征,分析基因组、蛋白质组序列或结构,通过模式匹配,判断候选基因或蛋白质作为潜在药物靶标的可能性。二、药物靶标数据资源(一)药物靶标信息资源DrugBank数据库()最权威的药物和化学信息资源DrugBank检索界面示意治疗靶标数据库TDD(TherapeuticTargetDatabase)一个以收集药物治疗靶点数据为主的公共数据库资源。KEGGDRUG数据库KEGG数据库的子库,存储日、美、欧批准的药物信息。(二)药物副作用靶标信息资源药物副作用靶标数据库DART(DrugAdverseReactionTargets)提供了已知药物副作用靶标、功能和性质、文献链接等数据信息。治疗相关多信号通路数据库TRMPD(TherapeuticallyRelevantMultiplePathwaysDatabase)包含来自文献的药物作用信号通路及靶标交叉信息,也提供对应的文献来源、疾病相关情况、针对通路中靶标的配体药物等信息。(三)药物-蛋白互作数据资源生物分子互作动力学数据库KDBI(kineticdataofbio-molecularinteraction)收集了来自文献实验测定的蛋白质之间、蛋白质-RNA之间、蛋白质-DNA之间、蛋白质-小分子配体之间、RNA-配体之间、DNA-配体之间的结合反应数据。蛋白质-配体相互作用数据库PLID(protein-ligandinteractiondatabase)是基于网络的免费数据库,其收集了6295配体同从蛋白质结构数据库中提取的蛋白质的复合物结构,还提供配体物理化学性质、量子力学特征描述和蛋白质活性位点接触残基等信息。生物学相互作用通用库BioGRID(biologicalgeneralrepositoryforinteractiondatasets)收集来自常见模式生物的蛋白质及基因间的相互作用信息。此数据库可用于预测同类蛋白质的功能。(四)其他重要的药物信息数据库1.药物蛋白质数据库NRDB2.药物关联蛋白数据库ADME3.转运蛋白数据库TransportDB4.药物遗传效应数据库PharmGED5.候选小分子药物资源SymyxACD三、药物靶标识别的信息学技术(一)基因组和基因型数据分析识别药物靶标随着人们对生命体基因组的认识和积累越来越多,通过基因组分析进行新药物靶标的识别技术也越来越重要。基因组数据的直接分析常用于抗微生物药物靶标的发现。相对于微生物基因组,人类基因组过于庞大,通过直接的基因组数据分析发掘候选药物靶标的难度很大,需要在一定的线索提示下缩小分析范围。基于基因或基因组范围的关联研究是寻找潜在的候选靶标的有效技术。基于同源性的功能基因组分析也是新的药物靶标发现的常用方法。从直系同源的角度分析基因功能,人面解析某一基因是否属于目前常用的药物靶标蛋白家族,以此来判断其作为药物靶标的可能性。(二)表达谱结合蛋白质组学分析识别药物靶标基因的表达能够反映生理或病理状态下的细胞活动情况,发掘基因表达谱中随着疾病进程表达显著变化的基因,是寻找潜在药物靶标的常用策略。比较疾病与健康个体表达谱,寻找编码常见药物靶标蛋白质的基因表达差异与疾病发生的关联,是快速发现潜在药物靶点的有效技术。在表达分析基础上,对表达标签和蛋白质组学数据的比较分析,尤其和药物蛋白质组学技术联合应用,能快速获得有价值的信息。将未知靶标但作用效果明确的天然物质作用于疾病动物或细胞模型,分析药物作用下发生改变的蛋白质,将可能发现潜在的作用靶标,并有利于研究此物质的药理机制。甲硫氨酸氨肽酶和Bengamide衍生物的复合物(三)蛋白质序列数据分析识别药物靶标通过序列分析,判断对应蛋白质是否为潜在药物靶标的识别技术集中分析已知药物靶点的序列特征。利用机器学习方法从中发掘规律并形成判断方法是一类典型的生物信息学策略识别药靶的方法。各种模式识别的方法都可用于发掘靶点的序列特征,建立对应的判断方法。(四)反向对接分析配体作用位点识别新靶标基于分子对接寻找候选配体的方法,可用已知体内和体外活性配体,从已知蛋白质晶体结构的数据库中搜索对应的潜在靶蛋白,这是一种新的靶标识别技术。这种技术对发掘有明确药理活性天然产物的作用靶标具有重要价值。此技术目前已有对应的在线免费服务器和程序可用()(五)识别与证实靶标的实验设计技术采用生物信息学方法预测的候选大分子靶标还需进行实验验证。通常要确认一个药物靶标的有效性,可用针对该靶点的已有工具药物或临床药物进行验证,但对用生物信息学预测发现的候选新靶标通常缺少这类工具配体,只能进行多角度的交叉验证进行判断。验证候选大分子靶标的有效性一般需要确认其具有如下特征:①候选靶标的功能与动物模型中疾病发生的病理学过程存在必然联系;②细胞模型中表达的靶标功能与疾病发生的细胞病理学过程存在必然联系;③疾病动物模型中,配体达到有效浓度时能与靶标发生明确的相互作用;④靶标和药物间的体外互作数据可预测动物模型体内的配体与靶标互作;⑤体内靶点含量或活性与病理学过程有明确联系。四、药物靶标的结构预测和分子模拟技术(一)小分子药物概述广义的小分子药物指分子量小于800Da且在人体内能发挥明确药理学作用的化合物。狭义的小分子药物是指广义小分子药物中除多肽和寡核苷酸之外的药物。根据候选药物结构特征预测成药性,是利用生物信息学技术高效识别具有药用价值候选小分子新药的重要应用。(二)小分子化合物的结构特征和性质描述利用生物信息学技术分析小分子药物的作用规律需识别其结构特征、性质与其药理学、毒理学特征间的联系;对配体(ligand)类药物进行虚拟筛选,也需描述分子结构特征;用先导配体(leadligand)通过反向对接搜索潜在药物靶标也需要描述小分子化合物的结构特点。因此,描述小分子化学物的结构特征和性质是药物生物信息学的必要基础。1.小分子化合物的结构描述和模型化连接表(connectiontable)是目前用计算机表示、记录和检索化合物结构最常用的信息化手段,其可包含分子结构的二维和三维信息。连接表不考虑不同分子的唯一性问题,原子的序号也不影响分子结构。但连接表在应用中有多种文件格式,不同分子结构模型可视化软件有自己的特殊格式,SMD、MOL和MOL2等是通用性的结构文件格式。甲醇的结构模型(A)和其连接表(B)、用MOL格式记录的结构文件(C)有多种小分子化合物模型可视化系统可用鼠标描绘分子结构模型,其中不少是免费的,如ISIS-Draw和ACD等。通常小分子化合物的结构模型可视化系统大多可对小分子三维构象进行初步真空优化,这是建立三维定量构效关系模型的基础。2.小分子化合物的疏水性疏水相互作用(hydrophobicinteraction)描述物质或基团与水分子相互作用的热力学性质。小分子化合物的疏水性(hydrophobicity)对其成药性有重要影响。在药物研究中常通过测定小分子药物的疏水性参数(hydrophobicparameter)定量表征小分子的疏水性。目前常用脂水分配系数(partitioncoefficient,P)作为疏水性的定量参数,即待测化合物在脂相和水相之间分配达到平衡时的脂相浓度与水相浓度的比值。测定脂水分配系数最常用的是正辛醇-水体系。化合物在正辛醇-水体系的脂水分配系数同其结构具有明显联系。同系物间脂水分配系数对取代基有累加效应,故依据间接测定小分子化合物中常见基团的脂水分配系数,可用于预测同系物中预期结构化合物的脂水分配系数。将分子结构分解成各种碎片,并测定常见类型碎片的脂水分配系数(fi),再用碎片脂水分配系数从头计算目标化合物的脂水分配系数。其中系数ai和bi代表来自不同的主要结构体系相同碎片的数量,fi为对应碎片的脂水分配系数。3.分子的电荷分布特征和电性参数电性参数(electronicparameters)主要描述分子中电荷的不对称分布等带来的对应性质差异(1)hammett-电性参数(σ)(2)共轭效应及诱导效应(3)解离常数(pKa)(4)分子立体结构特征和参数常用的分子立体结构特征描述符及其参数化:①Taft立体参数(Es)②摩尔折射率(ME)③范德华体积(Vw)④多维立体参数⑤分子形状描述符⑥分子连接性指数此外,还有3D自相关性质、基于电子衍射编码的分子结构、径向分布函数编码等较为复杂的分子3D信息描述符号,是作为建立与靶点三维结构相关的定量关系模型的重要参数。(三)小分子配体类药物与靶蛋白的对接及虚拟筛选分子对接的前提是需要获取靶蛋白和候选小分子配体的三维结构。靶蛋白结构数据可从PDB数据库下载,候选小分子配体的.mol2格式数据可从ZINC、剑桥晶体数据库或NCBI下载,这些数据需要利用分子结构编辑软件进行统一规划以满足不同分析软件读入分子结构信息的要求。1.通过对接评价配体亲和力的方法(1)基于打分函数的评价策略目前大部分对接算法中使用的打分函数主要分为三种类型:基于配体与靶蛋白结合物理化学相互作用的打分函数、基于经验的打分函数和基于知识的打分函数。(2)机器学习方法用已知的数据集进行训练,机器学习法能够建立起预测化合物某种性质的模型,其中包含自组织神经网络法、决策树、K最邻近算法等计算策略。2.常用软件简介(1)DOCK用于模拟小分子与生物大分子结合的三维结构及强度,是目前应用最广泛的分子对接软件之一。构象搜索采用两种方法:•第一种是锚定搜索(anchor-firstsearch)•第二种方法是同时搜索(simultaneoussearch)从数据库获得靶蛋白结构和小分子候选配体的结构;可按DOCK教程进行分子对接,此过程主要包括如下几步:靶蛋白处理,对接配基处理↓dms处理受体蛋白,得到球面↓运行sphgen.
本文标题:第十四章-药物生物信息学
链接地址:https://www.777doc.com/doc-4521331 .html