您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 山西师大郜刚生物信息学-18-2-蛋白质结构三级预测
郜刚生物信息学讲义蛋白质三级结构预测蛋白质三级结构预测•蛋白质三维结构的预测方法•通常包括:•同源性建模和从头开始的预测方法。•对数据库中已知结构的序列的比对是预测未知序列三级结构的主要方法,也即同源建模的方法。•通常对于同源建模的方法过程并非统一,但基本思路是一致的,基本包括如下几个步骤:1.使用未知序列作为查询来搜索已知蛋白质结构。2.产生未知序列和模版序列最可能的完整比对。3.以模版结构骨架作为模型,建立蛋白质骨架模型。4.在靶序列有空位区域,使用环建模过程代替合适长度的片段。5.给骨架模型加上侧链。6.优化侧链的位置。7.使用能量最小和已知的优化知识来优化结构SWISS-MODEL是一个自动化的蛋白质比较建模服务器•可以通过ExPASy服务器的web界面免费访问。•该服务器提供用户三种模式可选择:Firstapproachmode(简捷模式),Alignmentmode(联配模式,Projectmode(项目模式),以Firstapproachmode(简捷模式)为例,你只需要提交你的蛋白质序列,Email,name,任务名称即可(还有其他可选项,不确定时保持默认),SWISS-MODEL服务器•以Firstapproachmode(简捷模式)为例,•只需要提交你的蛋白质序列,Email,name,任务名称即可•(还有其他可选项,不确定时保持默认)Swiss-model的结果出来的快•服务器会给任务生成一个id号,并给您发送邮件结果,•一般为四封•(Swiss-model新闻,欢迎词,任务纪录,结果),•最终结果将是一个PDB文件,用Swiss-PdbViewer打开。SWISS-MODEL还可以通过程序SwissPdb-Viewer访问哦SWISS-MODEL同源建模法预测蛋白质三级结构•一般由5步完成:1.从待测蛋白质序列出发,搜索蛋白质结构数据库得到许多相似序列(同源序列),选定其中一个作为待测蛋白质序列的模板;2.待测蛋白质序列与选定的模板进行再次比对,插入各种可能的空位使两者的保守位置尽量对齐;3.建模:调整待测蛋白序列中主链各个原子的位置,产生与模板相同或相似的空间结构——待测蛋白质空间结构模型;4.利用能量最小化原理,使待测蛋白质侧链基团处于能量最小的位置。5.最后提供给用户三级结构。但是其模板数量似乎更新的比较慢•所有结果都将通过邮件的形式反馈用户,反馈结果的形式由用户自己选择,如图所示:spdbv模式普通模式简短模式有人建议使用SWISS-MODEL默认的spdbv模式,这种模式可以用Swiss-PDBViewer程序打开,可以根据需要对结果进行多种操作结果举例:•以如下序列为例:•NIDRPKGLAFTDVDVDSIKIAWESPQGQVSRYRVTYSSPEDGIHELFPAPDGEEDTAELQGLRPGSEYTVSVVALHDDMESQPLIGTQSTAIPA•域值选择:0.0000000001•结果选项:Swiss-PdbViewermode•根据前面选项不同,可能会收到多封邮件。••SWISS-MODEL反馈的第1封邮件(WelcometoSwissModel)•SWISS-MODEL反馈的第2封邮件(SwissModel-Fold-Recognition)•SWISS-MODEL反馈的第3封邮件(SwissModel-SecondaryStructureP...)•SWISS-MODEL反馈的第4封邮件(SwissModel_TraceLog_AAAa06ZdK)•SWISS-MODEL反馈的第5封邮件(SwissModel-Model-AAAa06ZdK)中附有可用大分子结构展示软件另一个牛A的服务器CPHmodels另一个牛A的服务器CPHmodels•CPHmodels是采用同源建模来预测蛋白质三级结构的一个网络服务器,同时也采用了以预测距离为基础的串线(threading)算法。同源建模是先在蛋白结构数据库中搜索目标蛋白的同源蛋白作为模板,将目标蛋白与模板进行比对,再运用一定的运算方法,以模板结构为基础构建模型,进行模型优化,将构建的模型作为预测的结果。串线算法是利用折叠识别预测蛋白质结构的方法,首先从蛋白质结构数据库中挑选蛋白质结构建立折叠子数据库,以折叠子数据库中的折叠结构作为模板,将目标序列与这些模板一一匹配,通过计算打分函数的值判断匹配程度,根据打分值给模板结构排序,其中打分最高的被认为是目标序列最可能采取的折叠结构。同时该服务器运用了神经网络算法和序表(profile)-序表比对,提高了结果的准确度。神经网络算法等同于能预测两个残基相互关系的若干窗口,用来预测独立的测试蛋白中的距离是否大于或小于给定的距离标准;序表是某一序列对数据库搜索后产生的序表是一个新的比对计分矩阵,该矩阵可以被粗略的看作是一个新序列,新序列含有了更多蛋白家族的信息,用新序列进行的搜索将更加有效,更有针对性地找到家族内的匹配序列。另一个牛A的服务器CPHmodels•建模来预测•同时采用了以预测距离为基础的串线(threading)算法。•串线算法是利用折叠识别预测蛋白质结构的方法,•首先从蛋白质结构数据库中挑选蛋白质结构建立折叠子数据库,•以折叠子数据库中的折叠结构作为模板,将目标序列与这些模板一一进行匹配,•通过计算打分函数的值判断匹配程度,根据打分值给模板结构排序,其中打分最高的被认为是目标序列最可能采取的折叠结构。结果•Filewithcoordinatesformodelinpdbformat:model.pdbCoordinatesarefreeforacademic,governmentandothernon-profitinstitutions.CommercialentitiesmustobtainpermissiontousetheprogramsencadandsegmodfromtheGeneMinepackage().Sorry•YouneedaJava-capablebrowsertorunPDB3D•PDB3Disahighspeed3DmoleculerenderingappletwrittenbyScottLegrandatUCLA.•Controls:•LeftMouseButton:Rotatemolecule•RightMouseButton:Scalemolecule(left&right)详细打分注解CPHmodels-2.0Server-predictionresultsTechnicalUniversityofDenmark--------------------------------------------------------------------------------Querysequence:SequenceMEMFGKIACFVLLCMVVVAPHAEALSCGQVTSGLAPCLPYLQGSGPLGGCCGGVKGLLGAAKTPEDRKTACTCLKSAANSIKGIDTGKAAGLPGVCGVNIPYKISPSTDCSKVQSearchingfortemplate...Round0.Allhits:entry:1T12chain:Ascore:118E:1e-27entry:1AFHchain:_score:89E:1e-18entry:1FK0chain:Ascore:89E:1e-18entry:1CZ2chain:Ascore:80E:5e-16entry:1CZ2chain:Ascore:80E:5e-16entry:1GH1chain:Ascore:80E:5e-16Retrievingtemplate...Entry:1t12Chain:Agunzip:stdout:BrokenpipeMakingprofile-profilealignment...Score:188.0bitsIdentity:74.7%Query:1ALSCGQVTSGLAPCLPYLQGSGPLGGCCGGVKGLLGAAKTPEDRKTACTCLKSAANSIKG60A++CGQVTSLAPCLYL++GPLGCCGGVKL++A+TEDR+ACTCLKSAA+IGTempl:1AITCGQVTSNLAPCLAYLRNTGPLGRCCGGVKALVNSARTTEDRQIACTCLKSAAGAISG60Query:61IDTGKAAGLPGVCGVNIPYKISPSTDCSKVQ91I+GKAAGLPCGVNIPYKISPSTDCSKVQTempl:61INLGKAAGLPSTCGVNIPYKISPSTDCSKVQ91Modeling...ModBase•ModBase由大名鼎鼎的Sali实验室创建和维护。•以PSI-BLASTandMODELLER为工作基础。•ModBase还包括有可能的配体结合位点,SNP注释,以及蛋白质相互作用等MODELIRANJEModellerlicensekey申请、注册、获得密码就可开始预测了2008ggniche2008在排队里边你可以看到当前有哪些人在申请工作,但是你的结果只有你能够看到,也就是只有点击前面的ID号,然后通过密码输入才能看见结果。这里的服务速度实在是太慢了,3D-JIGSAW•Thankyoufortryingthisversionof3D-JIGSAWYourjobhasbeenputintoaqueue.Wewille-mailyoutheresultsassoonaspossibleIfyoudon'treceivethem,probablythee-mailaddresswaswrong:-(Yourjob-refis38dc54a0Commentsareappreciated.Emailgaogang20002000@126.com•Proteinnamepotato_a7SequenceMEMFGKIACFVLLCMVVVAPHAEALSCGQV...•Modeautomatic3D-JIGSAW,界面友好,服务快捷ESyPred3D的使用流程•ESyPred3D-ESyPred3Disanewautomatedhomologymodelingprogram.•Themethodgetsusingneuralnetworks.•bycombining,weightingandscreeningtheresultsofseveralmultiplealignmentprograms.•ThefinalthreedimensionalstructureisbuiltusingthemodelingpackageMODELLERESyPred3D的原理•1.模板选择2.目标和模板比对步骤3.对没有或与模板有显著不同的区域进行建模。4.对侧链进行建模SCRATCH蛋白质三级结构预测•SCRATCHservers•SCRATCHservers,由美国加州大学开发的基于PSI-BLAST搜索程序和神经网络算法为用户提供蛋白质空间结构预测的服务器。•预测内容包括:•二级结构特性预测(包括二级结构分类预测、相对亲水性预测、残基间接触数预测)、肽链拓扑学特性预测(包括残基接触图预测、二级结构单元接触图预测)。SCRATCH蛋白质三级结构预测•SCRATCHservers••资源网址:•pdbformatfile•Howtolook?•AnotherPPT…•别人的一些工作结果•Figure2.(a)ThecomparisonofB-factorsofmolecularsurfacesc
本文标题:山西师大郜刚生物信息学-18-2-蛋白质结构三级预测
链接地址:https://www.777doc.com/doc-3283365 .html