您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 复旦《药物设计学》课件05药物发现的虚拟筛选方法
1第5章药物发现的虚拟筛选方法Virtualscreeningindrugdiscovery2匹配计算命中结构Hits第一节概述搜寻标准(提问结构)搜寻的基本要素搜寻标准化合物库计算方法3根据搜寻标准和计算方法,分为二类基本方法:直接法=基于靶点结构=基于分子对接(docking-based)间接法=基于配体相似性(ligandsimilarity-based)=基于药效团(pharmacophore-based)4化合物数据库合成化合物库天然化合物库组合化合物库药物分子库类药性化合物库生物大分子数据库核酸分子库蛋白质分子库5化学信息和生物信息计算机系统——利用计算机信息处理系统对分子(小分子及生物大分子)(2D及3D)及相关信息(性质、来源、用途)进行分析、储存、检索和传递等处理小分子化合物生物大分子命中结构化学信息学生物信息学匹配计算6化学信息学Chemoinformatics,chemicalinformatics,Cheminformatics,chemi-informatics利用计算机信息处理技术对化学分子结构和相关信息进行管理的一种综合性技术和学科应用化学信息学可促进化学信息的获取、转化与共享第二节化学信息处理ProcediaEngineering,2012,1264–12757化学信息学的应用化合物合成路线设计活性化合物片段分析识别配体活性构象识别活性化合物的药效团预测化合物ADME/T性质从生物分子中产生先导物(全新药物设计)验证配体-受体相互作用(对接,虚拟筛选)与生物信息学交互应用8化学分子结构的层次•1D:CH3CHO•2D:•3D:H3CCOH一、2D和3D分子结构的计算机处理方法9(一)以一维形式表示对2D结构进行编码——储存和交换化学结构式数据的命名法•SMILES(SimplifiedMolecularInputLineEntrySystem,简化分子线性输入系统)•SLN(Sybyllinearnotation,Sybyl线性标记法)10SMILES•按化合价模型,每个原子被氢原子饱和;双键用=表示;三键用#表示;环化分子用闭合原子标号表示;芳香环中不饱和原子用小写字母表示甲烷CH4C乙醇C2H5OHCCO氰化氢HCNC#N环已烷C6H12C1CCCCC1吡啶C5H5Nn1ccccc111•分子中分支用()表示;用/和\表示双键顺反异构;对映异构:手性原子用[]表示,@表示反时针,@@表示顺时针异丁酸(CH3)2CHCO2HCC(C)C(=O)O反式二溴乙烯Br/C=C/Br或Br\C=C\Br顺式二溴乙烯Br\C=C/Br或Br/C=C\BrL-丙氨酸N[C@@H](C)C(=O)OD-丙氨酸N[C@H](C)C(=O)O12(二)以二维形式表示•用图表示CCCCCCCCCNHHOHO13•用矩阵和连接表表示141、直接坐标法•用笛卡尔坐标(Cartesiancoordinates)直接存储每个原子的三维坐标(x,y,z)(三)以三维形式表示152、内坐标法•每个原子位置以与其他原子间的3个相对位置关系表示——距离、夹角、二面角r1和r2为键长,α为键角,为扭转角1,2-二氯乙烷16化学结构的一些表示方法17(四)分子存储格式及其相互转换每一软件系统都有自己的分子存储格式•MDL公司的MOL格式(MACSS格式)•Tripos公司的MOL2格式•剑桥晶体数据库CSD的FDAT和CIF格式•蛋白质数据库PDB的PDB格式(ENT格式)18基本存储:分子的元素组成、原子坐标、原子连接关系还能存储:•分子子结构信息,能适用于生物大分子•原子电荷信息,调用时不必再计算•确定特定原子化学环境的原子类型信息19二、化合物数据库的生成和管理输入搜寻和检索管理输出20ISIS(IntegratedScientificInformationManagementSystem)——MDL的综合性结构和反应管理软件•由三个主要分软件组成:(1)ISIS/DRAW——用于输入结构式和搜寻询问条件(2)ISIS/BASE——用于生成局部数据库及处理信息(3)ISIS/HOST——主服务器应用程序,进行通讯连接,集中数据库数据并作处理212D结构输入:——计算机绘制化学结构式•首先输入原子和键的骨架结构,原子数、电荷会自动变为上下标•软件的模板中收集大量分子片段•可智能分析结构式,处理结构式的编码和变换•还可有附加功能,如自动命名、化学计算、光谱分析等三维结构的转化:•软件将2D化学结构迅速地转为3D模型•3D结晶结构参数转入3D数据库22NHHNCH3OCH3O计算2323三、分子相似性和多样性分析数据库的化学多样性(chemicaldiversity)数量巨大的、结构不同的贮藏和检索系统——适用于先导化合物发现数据库的化学相似性(chemicalsimilarity)——适用于先导化合物优化采用一定的理论计算方法,提出设计可合成的所代表的多样性空间,保证足够的化合物多样性24•组合化学数据库(combinatorialchemistrylibraries)化合物组合库(combinatorialcompoundlibraries)组合库(combinatoriallibrary)25四、化学信息学资源26•FCD(FineChemicalsDirectory)——MDL维护。收载约90000个化合物和20000种化合物数据,包括化学系统名、俗称、分子式、分子量、供应商、价格、CAS登录号、纯度等。可通过结构式或其它任何数据检索•ACD(AvailableChemicalsDirectory)——MDL维护。FCD数据库加上可大批量供货的化学品信息。目前有25万个化合物•CSD(CambridgeStructureDatabase)——20多万个结晶的3D结构实验数据及相关数据常用化合物数据库27商品可供化合物数据库28第三节生物信息处理生物信息学(bioinformatics)•基于数学、生命科学、化学和计算机科学的交叉学科•利用计算机信息处理技术对大量生物大分子作信息获取、加工、储存、分类、检索与统计分析,揭示生物大分子的分子结构、功能、同源性和进化关系•推动生命科学的发展,为创新药物的研究和开发奠定基础29生物信息学的内容•建立可贮存和管理大量生物信息学数据集的数据库•处理大量数据的算法和统计方法•分析和解释不同类型的生物数据,如RNA、DNA和蛋白质序列、蛋白质结构、基因表达以及生化途径30序列分析结构预测(同源模建)PowerEdge6400分子相互作用可视化,数据处理GenomesTCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACAT...ProteinsSRVSVMTVKTSDTCSSRRRSQLVCKRMPGADKPVRARQRV...蛋白质作用网络分子动力学模拟生物信息学的应用31一、核酸和蛋白质的序列分析sequenceanalysis(一)单个序列分析根据单个氨基酸的物化性质推测整个蛋白质的性质,也可预测二级结构出现的可能性20种氨基酸的疏水参数氨基酸疏水值氨基酸疏水值氨基酸疏水值Ala(A)1.8Gly(G)-0.4Pro(P)-1.6Arg(R)-4.5His(H)-3.2Ser(S)-0.8Asn(N)-3.5Ile(I)4.5Thr(T)-0.7Asp(D)-3.5Leu(L)3.8Trp(W)-0.9Cys(C)2.5Lys(K)-3.9Tyr(Y)-1.3Gln(Q)-3.5Met(M)1.9Val(V)4.2Glu(E)-3.5Phe(F)2.8特别是蛋白质的序列分析,可预测一些结构和功能特性。32根据统计值:Glu经常出现在α-螺旋中;Val常在β-折叠中发现;Pro通常不出现于α-螺旋中和β-折叠中,而倾向于在回折中……氨基酸螺旋(α)偏好链(β)偏好Glu1.590.52Val0.901.87Pro0.340.31Ala1.410.72Leu1.341.22Lys1.230.69………………(数值=1代表偏好处于平均;>1代表偏好大于平均;<1代表偏好小于平均)33(二)双重序列比较——序列比对sequencealignment基于进化理论的序列比对,如果两个序列间具有足够的相似性(similarity),可预测二者可能具有共同的祖先,称为是同源的(homologous)。进化中经序列内残基的替换、残基或序列片段的缺失、以及序列重组等遗传变异过程演化得到。相同字母同时出现在两条序列中,称为一致序列,说明在进化中是保守的(conseved);字母不同,说明发生了变异;因残基的插入和删除,同源序列的长度可能不相同,可用“-”号表示与该残基位的字母配对34序列对比可以用各种矩阵表达并作相似性打分相似性打分值:比较矩阵和空位罚分打分值越高则两个残基越相似人锌指转录因子(humanzincfingertranscriptionfactor)序列的自相似性35序列相似性(similarity)——序列比对过程中对序列和目标序列按打分值比较相同序列所占比例的大小。序列的一致性(identity)——完全相同的序列段。当两条序列同源时,它们的氨基酸或核苷酸序列通常有显著的一致性。如果两条序列有一个共同的进化祖先,则它们是同源的(homology)。两序列要么是同源的,要么就不是同源的;而相似性是量化指标。一般认为序列之间的相似性超过30%,它们就很可能是同源的。36(三)多重序列比对multiplesequencealignment•多重序列比对可以从更多细节上揭示保守模式和结构信息•可采用多种统计算法进行多重序列比对二、蛋白质三维结构预测37基因蛋白质一级结构蛋白质三维结构决定折叠预测FKKIKVLGSGAFGTVYKGLWIPEGEKVKIPVAIKELREATSPKANKEILDEAYVMASVDNPHVCRLLGICLTSTVQLITQLMPFGCLLDYVREHKDNIGSQYLLNWCVQIAKGMNYLEDRRLVHRDLAARNVLVKTPQHVKITDFGLAKLLGAEEKEYHAEGGKVPIKWMALESILHRIYTHQSDVWSYGVTVWELMTFGSKPYDGIPASEISSILEKGERLPQPPICTIDVYMIMVKCWMIDADSRPKFRELIIEFSKMARD38主要预测方法蛋白三维结构预测从头预测法abinitio线引法threading同源模建法homologymodeling基于知识的预测方法knowledge-basedprediction基于理论的预测方法theory-basedprediction391、从头预测法(abinitioprediction)•采用理论计算(分子力学、分子动力学、量子化学)方法,直接从分子和原子参数计算出蛋白质分子的稳定构象•理论上昀理想的方法,但计算量极大,对于实际分子的计算超过能力范围402、同源蛋白模建法homologousmodelbuilding比较分子模拟法comparativemolecularmodeling同源模建homologymodeling同源蛋白法proteinhomology•根据已知的蛋白质三维结构来预测可能的三维结构——基于知识的预测•同源蛋白有着相似的来源、相似的结构和生物功能。通过比较蛋白序列的相似性,按同源蛋白的三维结构为模板,构建未知蛋白的结构•一般要求相似性在30%以上,可能是同源的,特别是在结合区域相似性要好41(1)根据未知蛋白质的序列,寻找同源蛋白(2)二重或多重序列对比(3)找出共同的二级结构区域(4)构建骨架,对初始模型作能量优化步骤:(3)(1)(2)(4)423、穿针引线法,线串法,线程法,折叠识别(threading,foldrecognition)•可应用于进化非常疏远的结构预测•未知蛋白序列与已知结构的蛋白序列作匹配计算,将序列吻合的三维结构模块串连起来,得到整个蛋白三维结构E1E2thre
本文标题:复旦《药物设计学》课件05药物发现的虚拟筛选方法
链接地址:https://www.777doc.com/doc-10671364 .html