您好,欢迎访问三七文档
CheminformaticTools——Lessexperiments,betterresults,isthattrue?Cheminformatics•化学信息学是近年来出现的将化学和信息科学融合成为最新研究前沿的交叉学科,涵盖了理论计算、新算法发展、新知识和新化学实体的发现以及化学虚拟现实等领域。可以广义的被定义为利用化学信息揭示化学性质与结构之间的关系,从药物发现的角度,化学信息学的一些准则可以应用在早期的研究步骤(例如构效关系的研究与毒性的预测)CheminformaticsTools•化学信息学工具通过数据挖掘和分析,以及结构表征和优化,帮助研究者在现代研究方法中(如组合化学与HTS)提取大量有用信息,促进药物研发进程。——CheminformaticJournals•TheJournalofCheminformatics•TheJournalofComputer-AidedMolecularDesign•MolecularBioinformatics•QSARandCombinatorialScience•TheJournalofChemicalInformationandModeling已有15000篇化学信息学的研究论文在最近五年发表雅培科学家常用的化学信息学工具模块•PipelinePilot•理化性质与配体效率•PropertyCalculationpage•理化性质•Leadhopper2D/3D•相似检索•RocsOverlay3D•分子叠合•DrugGuru•寻找生物电子等排•RcosDock•基于分子结构的3D对•PyMol作图使分子可视化Accelrys•Accelrys是一流的药物研发解决方案提供者,为药物化学家提供强大的研究工具。涵盖了基因组学、蛋白质组学研究到药物靶点确认和结构解析,基于靶点的先导化合物发现,基于活性化合物结构的先导化合物优化,先导物ADME/T性质预测等领域。能够帮助科学家显著提高的效率。PipelinePilot•Accelrys的PipelinePilot是业界领先的基于流程化(Protocals)的计算模拟及信息管理平台,已在国际上众多学术机构及超过300家的企业得到了广泛应用。它集成了大量的功能组件,能够实现工作流程的构建和共享,完成复杂应用环境下的高效率资源整合,用于计算分子的大部分理化性质与配体效率。•PipelinePilot不仅能让研究人员用更方便和更有效的方式来整合并应用那些复杂难学的计算模拟和信息管理工具,而且能让实验科学家用更简洁和更友好的方式了解、掌握并应用理论与模拟计算的最新成果。PropertyCalculationpage•这是一类网络工具,用于计算理化性质,并有着子结构检索与类比功能。•DataforGeneral,Organic,andPhysicalChemistry•/i.F&MCollege;ii.ColbyCollege•DataSearchforSpeciesbyChemicalFormula/NIST•DielectricConstants/ASIInstrumentsInc.•ChemicalandPhysicalPropertiesWebliography/LSU•Propertiesof200linearmacromoleculesandsmallmolecules/ATHASLeadHopper•combines2D(ECFP6)and3D(ROCS)methodsforcompoundsimilaritysearches。•基于形状相似性的虚拟筛选工具RocsOverlay&RocsDock1ROCSisapowerfulvirtualscreeningtoolwhichcanrapidlyidentifypotentiallyactivecompoundswithasimilarshapetoaknownleadcompound.(ROCS是一款基于结构相似性的虚拟筛选工具)2ROCSisafastshapecomparisonapplication,ItusesaGaussianfunctiontorepresentthemolecularvolume(利用高斯函数计算呈现分子体积)3ROCSalignmentshaveanumberofapplications:3DQSAR,SARanalysis,understandingofscaffolddiversity.(ROCS有许多应用模块,包括3D-QSAR,SARanalysis,添加分子柔性)4provides3Doverlaysofmultipleinputquerymolecules(提供3D分子比对和对接)Rocs运行图例PyMol•Pymol是一个开源的结构显示和分析程序.使分子可视化,它是用python编写的所以叫Pythonmolecular。Pymol用处最多的是做图。认识论的四个界限•随后,作者将化学信息学中重要的要素和概念模仿军队条例与法律界范文分为四个部分来阐述。这篇文献全面剖析了我们在化学信息学中已知的还有未知的要素,分别是以下四类:TheKnownKnowns,theKnownUnknowns,theUnknownKnowns,andtheUnknownUnknowns.•“Thereareknownknowns;therearethingsweknowthatweknow.Thereareknownunknowns;thatistosay,therearethingsthatwenowknowwedon’tknow.Buttherearealsounknownunknowns;therearethingswedonotknowwedon’tknow.”•—DonaldRumsfeldknownknownsknownknowns:molecularweight,ligandbindingefficiency,andsubstructuresearching……1分子量与原子数目•MolecularWeightandAtomCounts.:thelinkbetweenMWandoralAbsorption•“Lipinski’slandmarkpublicationcorrelatingincreasedMWandatomcountswithincreasedriskofclinicalfailure,primarilyduetoloworalabsorption.”•“hardceiling”of500Da•Exception:protein-proteininteractionsandpeptidergic,naturalproducts•分子量大的化合物,功能基团多,增加了与受体结合的机会和强度,但是分子量大不利于药物的透膜与吸收(当化合物的分子量接近磷脂分子量时,穿越细胞膜的磷脂双脂层在能量上市不利的,以至降低了吸收性和过模型)•分子量大的化合物可能含有易被代谢的基团和毒性结构,不适宜作为先导物1分子量与原子数目1分子量与原子数目•有的时候人们在筛选中并没有注重MW小于500和“ruleof5”,因为上市很多药物并不符合,但是AstraZeneca的科学家通过对4家主要制药公司的专利药物的理化性质和研究中的进展比较中得出结论专利中很大一部分没有遵循“MWFilter”和“ruleof5”的“drug-like分子”在临床研究中有极大的风险.•——Leeson,P.D.;Springthorpe,B.Theinfluenceofdrug-likeconceptsondecision-makinginmedicinalchemistry.Nat.Rev.DrugDiscovery2007,6(11),881–890;1分子量与原子数目•同样的一组化合物经HTS后(活性构象,结构类比,通道选择,限制性HT-ADME),约90%的化合物能够有潜在活性,并按照从高到低排序。如果用500D规则,也许其中只有50%的化合物能够符合,但是容易得到“bonafideleads”(友善的先导化合物)2LigandEfficiency•配体效率是将化合物的活性在分子大小的尺度上加以表征,是优化过程中监测化合物的活性、物化性质和成药性程度的一个指标。thebindingenergyΔG由以下几部分决定:ΔG=-RT.lnKd=1.37pKdΔG除以非氢原子数,得出每个原子的自由能贡献即配体效率,用下式表示LE=ΔG/N非氢原子•配体效率是衡量苗头物或先导物以及优化的化合物的质量的参数,表征化合物的活性效率。•LE指配体(苗头、先导物、优化物等)中每个原子对结合能的贡献,在选取先导物和优化过程中是个有用的指标。2LigandEfficiency•这个参数常常和HTS与基于片段的先导化合物设计结合,是打分的重要组成部分。作者之所以把LE放在KnownKnown的类别里是由于理化数据是可以测得的,尽管理化数据与生物活性的关联并不清楚,并不妨碍人们应用这个KnownKnows准则。3SubstructureSearching(子结构检索)•子结构检索可以帮助得到一系列含有相同骨架的结构,将共有结构提取出来,进行子结构检索,来获得更多的相似结构。这些结构以及它们的活性数据对于建立QSAR模型十分有用。•子结构检索致力于解决两方面问题之一:其一,还有哪些分子含有相同子结构(从已知SAR找出有潜在活性的分子)其二,哪些分子不含有任何子结构(排除含有“问题子结构”的分子)。•由于是子结构检索,查到的机会多,结果准确性差因此还可以对子结构进一步的定义提高查准率。3substructuresearch在虚拟高通量筛选中,以以上化合物蓝色部分为子结构,在雅培公司的数据库进行子结构检索中得到209个检索结果,用Daylightfingerprints检索得到94,而用ECFP6fingerprints得到27。且检索结果的分子结构也少有交集。KnownUnknowns•情况或者结果已知是可能的,但是是否能实现还是个未知数。从化学信息学的角度,就是有些内容我们知道如何计算,但是这些内容的效用尚不可知,迄今为止,这些KnownUnknowns内容是化学信息学各方法中最多的组成部分。1PolarSurfaceArea•分子极性表面积(PSA)指分子中极性原子表面的总和,通过计算极性原子O,N,OH和NH的范德华表面积得到的。是一个描述与分子被动传输通过膜相关的概念,它可以预测人体肠吸收、Caco-2单层渗透性和血-脑屏障渗透。•PSA越大,极性越大,难于过膜;对上千个口服非CNS药物的PSA最高阈120Å2,超过该值难以吸收;•透血脑屏障,PSA60-70Å22TPSA•为了简化极性表面的计算,人们提出了拓扑极性表面积(TPSA)的概念(JMedChem.2000Oct5,43(20):3714-7)。它的基本假设是分子中每种相同原子或基团类型对极性表面积的贡献都是相似的,整个分子的TPSA就是所有原子或基团贡献的加和。TPSA的基本思想和脂水分配系数以及水溶性计算中的加和法基本相似。原理:TPSA是基于规则的专家系统,计算的参数是基于已有极性片段数据库的。这些片段的贡献是通过对来自于世界药品库34810个药物单个构象3D-PAS的最小二乘法拟合来确定的。3ChemicalSimilarity3ChemicalSimilarity•Tanimotocoefficient(谷本系数)一种度量两个集合之间的相似程度的方法,相似系数介于0到1之间。3DCompoundOverlays•传统的二维相似性算法的缺陷在于,许多化合物虽然有着不同的原子和价键的topo结构,但是却有相似的整体形状和电荷分布。ROCS,和SURFLEX等3D相似度运算程序着重于发掘分子形状的相似性。•Surflex-Dock由加州大学旧金山分校AjayN.Jain教授开发,这种对接方法精确、快速
本文标题:药学信息学
链接地址:https://www.777doc.com/doc-3408634 .html