您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第11讲-蛋白质高级结构预测
第十一讲蛋白质高级结构预测Left:themodelwasgeneratedbyROSETTARight:themodelwasgeneratedbyI-TASSER蛋白质高级结构三维结构功能作用机制分子间互作功能注释指导实验验证功能确认功能位点设计和改造蛋白药物靶标设计同源建模法(Homologymodeling)线索化法/折叠识别法/串线法(Threading/Foldrecognition)从头预测法(Abinitio/Denovomethods)蛋白质三级结构预测方法依据:a、一个蛋白质的结构由其氨基酸序列唯一的决定。由一级结构,在理论上,足以获取其二级、三级结构。b、三级结构的保守型远远大于一级结构的保守型。主要思想:对于一个未知结构的蛋白质,找到一个已知结构的同源蛋白质,以该蛋白质的结构为模板,为未知结构的蛋白质建立结构模型。1.蛋白质结构预测之同源建模同源建模的过程2.将模板结构的坐标拷贝到目标U,仅拷贝匹配残基的坐标PDB数据库1.PDB数据库、BLAST(或PSI-BLAST)3、模型优化,主链生成、环区建模、加氢4.合理性检测同源建模方法特点绕过了二级结构预测目前蛋白质结构预测方法中最成功、最准确、使用最多局限是:仅仅是一种技术手段,而非理论应用范围收已有同源结构的限制Loop区域准确率差同源建模在线服务器和软件Swiss-modelHOMCOS1.0ESyPred3DNameMethodDescription3D-JIGSAWFragmentassemblyAutomatedwebserverRaptorXremotehomologydetection,protein3Dmodeling,bindingsitepredictionAutomatedwebserverandDownloadableprogramBiskitwrapsexternalprogramsintoautomatedworkflowBLASTsearch,T-Coffeealignment,andMODELLERconstructionCABSReducedmodelingtoolDownloadableprogramCPHModelFragmentassemblyAutomatedwebserverEasyModellerGUItoMODELLERStandalonewindowsexecutableESyPred3DTemplatedetection,alignment,3DmodelingAutomatedwebserverGeneSilicoConsensustemplatesearch/fragmentassemblyWebserverGeno3DSatisfactionofspatialrestraintsAutomatedwebserverHHpredTemplatedetection,alignment,3DmodelingInteractivewebserverwithhelpfacilityLIBRAILIghtBalanceforRemoteAnalogousproteins,ver.IWebserverLOMETSLocalMetathreadingserverMeta-servercombining9differentprogramsMODELLERSatisfactionofspatialrestraintsStandaloneprogrammainlyinFortranandPythonProtinfoCMComparativemodellingofproteinstructureusingminimumperturbationandloopbuildingWebserverBHAGEERATH-HCombinationofabinitiofoldingandhomologymethodsProteintertiarystructurepredictionsSTRUCTUROPEDIAWebInterfacetoMODELLERHomologymodelingofproteinsinmonomericormultimericformsaloneandincomplexwithpeptidesandDNAaswellasintroductionofmutationsandpost-translationalmodifications(PTMs)intoproteinstructuresSWISS-MODELLocalsimilarity/fragmentassemblyAutomatedwebserver(basedonProModII)TIP-STRUCTFASTAutomatedComparativeModelingWebserverandknowledgebaseWHATIFPositionspecificrotamersStandaloneprogramandwebinterfaceYasaraDetectionoftemplates,alignment,modelingincl.ligandsandoligomers,hybridizationofmodelfragmentsGraphicalinterfaceortextmode(clusters)SWISS-MODELSWISS-MODEL:网址非专业人士应用最为广泛的一个在线建模服务器。特点:简单、自动化、对学术团队免费。SWISS-MODEL:Automatedmode:自动模式,可以称为是最傻瓜的方式提交自己的氨基酸序列+邮箱即可适用:一致性较高时邮箱模型命名氨基酸序列PDB登录号PDB模板AlignmentmodeAlignmentmode:比对模式提交目标蛋白与模板蛋白的序列比对结果(FASTA,MSF,ClustalW等格式)适用:a、较高的相似性b、利用Auto模式未必能找到最合适模板的情况c、使用者有目的的使用特定的模板蛋白(比如具有更为相似的活性位点结果,而不是更为相似的整体结构)邮箱模型命名比对后的序列比对文件ProjectmodeProjectmode:项目模式:难以直接通过序列比对获得模板,需要人工插入调节(借助蛋白结构编辑软件deepview),可以将前两种模式模建出的蛋白进行人为调整适用:相似性不高HOMCOS1.0HOMCOS1.0:同源二聚体建模异源二聚体建模识别可能的互作蛋白ESyPred3DESyPred3D:评价:自动建模预测服务程序,ESyPred3D在目标-模板比对这一步做出的结果较好,且在预测序列与模板序列相似度差时有较好的模型预测效果。Modeller该软件由Salilab开发,目前最新的版本是9.11,可在win下和linux运行,需要对应版本的python(3.0)。完全免费。主要功能包括:多聚体建模,二硫键建模,杂原子建模等(配体、辅酶等)。自带一套模建结构后的优化、分析。But!该软件完全是命令行模式,操作相对复杂,可控制的地方多。Easymodeller对于习惯于GUI的我们来说,modeller操作不太方便。于是。。。印度Hyderabad大学的KuntalKumarBhusan为其编写了一个GUI界面,即为EasyModeller。EasyModeller,目前最新版本为4.0。之后,又有SWIFTMODELLER,UCSFChimerainterface2.蛋白质三级结构预测之线索化方法Threading/foldrecognition线索化方法又称蛋白质折叠类型识别依据:蛋白质折叠模式的有限性:一些序列(小于25%,远程同源)/功能不同的蛋白质采用类似的结构,蛋白质折叠模式的种类是有限的。序列中的残基的结构信息比残基本身更加保守。Physicalforcesfavorcertainstructures.Structureisbetterconservedthansequence蛋白质结构分类数据库SCOP(StructuralClassificationofProteins)CATH(Class,Architecture,Topology,Homology)Numberoffoldsislimited.Currently~700,Total:1,000~10,000CATH的结构层次有限的蛋白质折叠类型258种类型165种类型141种类型334种类型50种类型90%ofnewstructuressubmittedtoPDBinthepastthreeyearshavesimilarstructuralfoldsinPDB目标序列与数据库核心折叠比对取最佳核心折叠结构模型主要思想:利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定的结构环境中。建立序列到结构的线索的过程称为线索化,线索技术又称折叠识别技术。具体做法是将结构转换为含有这三个结构的字符串,然后对这些字符串进行比较(sequence-structurealignment)。线索技术的首要任务是建立核心折叠数据库在预测蛋白质空间结构时将一个待预测结构的蛋白质序列与数据库中核心折叠进行比对,找出比对结果最好的核心折叠,作为构造待预测蛋白质结构模型的根据。evaluationwithcompatibilityfunctionsthestructuremostcompatiblewiththesequenceConceptofThreadingThread(alignorplace)aqueryproteinsequenceontoatemplatestructurein“optimal”wayGoodalignmentgivesapproximatebackboneQuerysequence:MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTETemplatesetThreadingproblemThreading:Givenasequence,andafold(template),computetheoptimalalignmentscorebetweenthesequenceandthefold.Ifwecansolvetheaboveproblem,then•Givenasequence,wecantryeachknownfold,andfindthebestfoldthatfitsthissequence.•Becausethereareonlyafewthousandsfolds,wecanfindthecorrectfoldforthegivensequence.ThreadingisNP-hard.ProteinThreading–structuredatabaseBuildatemplatedatabaseProteinThreading–energyfunctionhowwellaresiduefitsastructuralenvironment:E_showpreferabletoputtwoparticularresiduesnearby:E_palignmentgappenalty:E_gtotalenergy:E_p+E_s+E_gfindasequence-structurealignmenttominimize
本文标题:第11讲-蛋白质高级结构预测
链接地址:https://www.777doc.com/doc-5481259 .html