您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 6,概率搜索和能量引导用于蛋白质结构从头预测中的偏向诱导采样
1ProbabilisticSearchandEnergyGuidanceforBiasedDecoySamplinginAb-initioProteinStructurePrediction概率搜索和能量引导用于蛋白质结构从头预测中的偏向诱导采样KevinMolloy,SamehSaleh,andAmardaShehu,Member,IEEEAbstract—Adequatesamplingoftheconformationalspaceisacentralchallengeinab-initioproteinstructureprediction.Intheabsenceofatemplatestructure,aconformationalsearchprocedureguidedbyanenergyfunctionexplorestheconformationalspace,gatheringanensembleoflow-energydecoyconformations.Ifthesamplingisinadequate,thenativestructuremaybemissedaltogether.Evenifreproduced,asubsequentstagethatselectsasubsetofdecoysforfurtherstructuraldetailandenergeticrefinementmaydiscardnear-nativedecoysiftheyarehigh-energyorinsufficientlyrepresentedintheensemble.Samplingshouldproduceadecoyensemblethatfacilitatesthesubsequentselectionofnear-nativedecoys.Inthispaper,weinvestigatearobotics-inspiredframeworkthatallowsdirectlymeasuringtheroleofenergyinguidingsampling.Testingdemonstratesthatasoftenergybiassteerssamplingtowardsadiversedecoyensemblelesspronetoexploitingenergeticartifactsandthusmorelikelytofacilitateretainmentofnear-nativeconformationsbyselectiontechniques.Weemploytwodifferentenergyfunctions,theAssociativeMemoryHamiltonianwithWater(AMW)andRosetta.Resultsshowthatenhancedsamplingprovidesarigoroustestingofenergyfunctionsandexposesdifferentdeficienciesinthem,thuspromisingtoguidedevelopmentofmoreaccuraterepresentationsandenergyfunctions.IndexTerms—Proteinstructureprediction,probabilisticconformationalsearch,near-nativeconformations,energybias.摘要:在蛋白质结构从头预测中,足够的构象空间采样是一个核心的挑战。构象搜索程序在没有结构模板的情况下,由一个能量函数来引导其搜索构象空间,找到一个低能量的诱导构象集合。如果采样不足,天然态的结构就有可能全部丢失。即使重现,在后续阶段选择诱导构象的子集来进一步的对结构细节和能量进行优化,也可能由于它们是高能量或者不足以代表整个构象集合而丢失近天然态的诱导构象。采样应该产生一个诱导集合来促使后续的近天然态的诱导构象的选择。在这篇文章中,我们研究一个机器人启发式的框架,这个框架可以用来直接测试能量在引导采样的过程中所起的作用。测试表明:一个软能量偏向引导采样走向多样化的诱导集合,而不是倾向于开发高能量的人工产物,这样就更有可能通过选择的技术来保留近天然态的构象。我们采用了两个不同的能量函数,AssociativeMemoryHamiltonianwithWater(AMW)和Rosetta。Rosetta表明加强的采样提供了一个对于能量函数的严格测试,并且揭示了它们的不同的缺点,因此有希望用于引导产生更为精确的模型表示和能量函数。索引词:蛋白质结构预测、概率构象空间搜索、近天然态构象、能量偏向21INTRODUCTION1介绍AB-initioproteinstructurepredictionortemplate-freemodelingisbynowrecognizedasoneofthemostdifficultproblemsincomputationalstructuralbiology[23],[49].Ab-initioprotocolsareinprinciplemorebroadlyapplicableforproteinstructurepredictionthanhomology-basedmethodsthatrelyontheavailabilityofhomologsofknownstructuretoreconstructatemplatestructure.Intheabsenceofatemplatestructure,ab-initioprotocolsrelyonaconformationalsearchprocedureguidedbysomeenergyfunctiontoobtainanensembleoflow-energy(decoy)conformations.Inathermodynamicstreatment[1],[27],thesoughtnativestructureofthetargetsequenceisexpectedtobepresentamongthelowest-energydecoys.Therearemanyreasonswhythistreatmentoftenfailstoleadtothenativestructure[23].目前,蛋白质结构从头预测或非模板模型方法被认为是计算结构生物学中最难的问题之一。大体而言,从头预测的方法比依赖于用已知同源结构来重建模板结构的同源建模方法有更广泛的应用。在没有结构模板的情况下,构象搜索程序由一个能量函数来引导其搜索构象空间,找到一个低能量的诱导构象集合。在热力学方法上,我们希望所找到的目标序列的天然结构出现在低能诱导构象中,但是有很多原因会导致这个方法在引导得到天然态结构时失败。Despitethechallenges,overthelastyearsconsiderableadvancementshavebeenmade,mostnotablyrecentlybythewell-knownQuark[46]andRosettaprotocols[20].Keytotheseadvancementshasbeentheemploymentofthemolecularfragmentreplacementtechnique[5],[7],[11].Thetechniqueallowsobtainingrealisticdecoyconformationsbyessentiallyassemblingthemwithshortstructuralblocksknownasfragmentconfigurations.Theseareextractedfromknownnativestructuresofnon-redundantsequencesandarestoredasφ,ψ,andωbackbonetorsionanglesinalibraryoffragmentconfigurations[14].TheassemblyisimplementedinthecontextofaMetropolisMonteCarlo(MMC)trajectory,whereanMCmovereplacestheconfigurationofafragmentselectedatrandomoverthecurrently-assembleddecoyconformationwithaconfigurationselectedforthatfragmentfromthelibrary.ThereplacementisacceptedifitsatisfiestheMetropoliscriterion,resultingovertimeinlow-energydecoys.尽管这是个很大的挑战,在过去的几年中,也取得了一些相当大的进步。最值得一提的就是最近很知名的Quark和Rosetta方法。这些进步的关键在于应用了分子片段置换技术。这项技术的应用使得我们可以通过用一些称作片段结构的短的结构块来进行组装,以获得现实的诱导构象。这些片段结构是由以φ,ψ,ω3三个骨干二面角保存在片段结构库中的已知的非冗余序列的天然态结构获得的。这个组装实施在MetropolisMonteCarlo(MMC)轨迹中,每实施一次MC扰动,用库中选择的一个片段结构来替换现有的诱导构象中随机选择的一个片段结构。如果这个替换符合MC准则,它将会被接受,并且随时间推移将得到低能诱导构象。Thepredominantab-initioprotocolconsistsofgenerationofalargenumberofdecoyconformationsatlowresolutionthroughthemolecularfragmentreplacementtechniquefollowedbyenergeticrefinementofselecteddecoysathigherresolution[23].Typically,decoysareendpointsofMMCtrajectoriesinitiatedfromextendedorrandomconformations.ManyglobalandlocalsearchstrategiesareproposedtoenhancethesamplingcapabilityofthecoreMMCexplorationinthelow-resolutionstage.Typicalprotocolsemploysimulatedannealingorreplicaexchangetoenhancesampling[7],[11],[4],[38],[35],[39],[24].Workin[36]employsadifferentstrategythatdirectlyenforcesconformationaldiversitythroughdiscretizationlayersofthesearchspace.从头预测方法主要是,通过分子片段置换技术,在高分辨率下对选择的诱导构象进行能量优化,从而在低分辨率生成大量的诱导构象。通常,诱导构象是由扩展的或者随机的构象开始的MMC轨迹的末端点。很多全局和局部的搜索策略提出了在低分辨率下提高核心MMC搜索的采样能力。通常的方法采用模拟退火或者副本交换的方法来加强采样。在文献[36]的工作中,采用了一种不同的策略,它通过对搜索空间的层进行离散化来直接加强构象的多样性。Themolecularfragmentreplacementtechniqueisdirectlyrelatedt
本文标题:6,概率搜索和能量引导用于蛋白质结构从头预测中的偏向诱导采样
链接地址:https://www.777doc.com/doc-2930401 .html