您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 92同源建模详细讲解-整理版
西大—Song2013.5.3报告内容1、同源建模的基础--结构生物学2、蛋白质结构预测之同源建模3、同源建模的基本步骤4、同源建模常用软件介绍--在线服务器5、同源建模常用软件介绍--Modeller6、模型质量检测1、结构生物学结构生物学是以生物大分子特定空间结构、结构的特定运动与生物学功能的关系为基础,来阐明生命现象及其应用的科学。以生物大分子三级结构的确定作为手段,研究生物大分子的结构与功能关系,探讨生物大分子的作用机制和原理作为研究目的。三维结构折叠进化关系晶体或高浓度溶液中蛋白质的四级结构突变、单核苷酸及保守残基的分布蛋白质配体复合物不同基团的相关性形态和静电属性表面残基暴露与分子构成推测相互作用界面晶胞堆积抗原位点及表面修饰缝隙(酶活性位点)催化簇/结构功能motif—催化机制配体和功能位点生物多聚态总结来说三维结构功能作用机制分子间互作功能注释指导实验验证功能确认功能位点设计和改造蛋白药物靶标设计X-射线晶体衍射(X-ray)多维核磁共振(NMR)冷冻电子显微镜结构生物学主要研究方法高浓度水溶液精确度≤X-ray晶体,准确度最高细胞和细胞器PDB数据库•蛋白质数据库(ProteinDataBank,PDB)是一个生物大分子(如蛋白质和核酸)数据库,内容包括由全世界生物学家和生物化学家上传的蛋白质或核酸的X光晶体衍射或者NMR核磁共振结构数据。•截止2013.4.28,PDB数据库已测结构的蛋白质87368,而该库中包含的一级序列有2200W。•通过实验测定的蛋白质结构远远不能满足研究需要,于是蛋白质结构预测就成为研究结构生物学的一个有效手段。蛋白质结构预测之同源建模•蛋白质结构预测方法:•同源建模,折叠识别和从头计算。•同源建模基本原理:1、一个蛋白质的结构由其氨基酸序列唯一的决定。由一级结构,在理论上,足以获取其二级、三级结构。2、三级结构的保守型远远大于一级结构的保守型。•应用限制:模板蛋白和目标蛋白的序列一致性需要大于30%同源建模的基本步骤•1、模板蛋白搜索PDB数据库、BLAST(或PSI-BLAST)、获取模板(一个或多个)•2、比对结果的校正•3、主链生成•4、环区建模•5、模型优化•6、合理性检测同源建模在线服务器Swiss-modelI-TASSERHOMCOS1.0ESyPred3D同源建模软件图形化软件PymolPDB-viewerJmolRasmolSWISS-MODEL•SWISS-MODEL:网址•非专业人士应用最为广泛的一个在线建模服务器。•特点:简单、自动化、对学术团队免费。Automatedmode•Automatedmode:自动模式,可以称为是最傻瓜的方式•提交自己的氨基酸序列+邮箱即可•适用:一致性较高时邮箱模型命名氨基酸序列Swiss-port/TrEMBL登录号Alignmentmode•Alignmentmode:比对模式•提交目标蛋白与模板蛋白的序列比对结果(FASTA,MSF,ClustalW等格式)•适用:1、较高的相似性2、利用Auto模式未必能找到最合适模板的情况3、使用者有目的的使用特定的模板蛋白(比如具有更为相似的活性位点结果,而不是更为相似的整体结构)邮箱模型命名比对后的序列比对文件Projectmode•Projectmode:项目模式难以直接通过序列比对获得模板需要人工插入调节(借助蛋白结构编辑软件deepview)可以将前两种模式模建出的蛋白进行人为调整•适用:相似性不高I-TASSAR•I-TASSAR:•*也可以下载本地安装包•评价:根据结果质量检验,该服务器应该是自动建模的软件里是结果最详细的,二级结构、top10模型、配体结合位点等等。•缺点:计算结果时间比较长结果需要进一步优化HOMCOS1.0HOMCOS1.0:同源二聚体建模异源二聚体建模识别可能的互作蛋白ESyPred3D•ESyPred3D:•评价:自动建模预测服务程序,ESyPred3D在目标-模板比对这一步做出的结果较好,且在预测序列与模板序列相似度差时有较好的模型预测效果。Modeller•该软件由Salilab开发,目前最新的版本是9.11,可在win下和linux运行,需要对应版本的python(3.0)。完全免费。•主要功能包括:多聚体建模,二硫键建模,杂原子建模等(配体、辅酶等)。自带一套模建结构后的优化、分析。•But!该软件完全是命令行模式,操作相对复杂,可控制的地方多。Easymodeller•对于习惯于GUI的我们来说,modeller操作不太方便。•于是。。。•印度Hyderabad大学的一位牛人KuntalKumarBhusan为其编写了一个GUI界面,即为EasyModeller。EasyModeller,目前最新版本为4.0。•之后,又有SWIFTMODELLER,UCSFChimerainterface•*注:图形用户界面(GraphicalUserInterface,GUI)1、指定工作目录2、输入氨基酸序列3、加载模板信息(可指定加载某条链,可加载多模板)4、多重序列比对(可编辑比对结果)5、生成模型(自动Loop建模,手工Loop建模)6、优化模型Easymodeller2.0氨基酸序列提交模板序列工作目录多重序列比对模型优化命令信息显示窗口模型生成同源模建结果评价与改进策略•同源模建结果的评价•PROCHECK、WHATCHECK、ERRAT、Verify_3D、PROVE•UCLA-DOE的SAVES服务器包括了这五种常用的检测其网址为:除SAVES外,Molprobity也是一个常用的在线模型分析工具,其网址为:•PROCHECK:以PDB中高分辨的晶体结构参数为参考,给出提交模型的一系列立体化学参数(主链)。其输出的结果包括:拉氏图,主链的键长与键角,二级结构图,平面侧链与水平面之间的背离程度等。•WHATCHECK:包含大量的检测项,可以针对提交的蛋白结构与正常结构之间的差异,产生一个非常长而且详细的报告。•ERRAT:计算0.35nm范围之内,不同原子类型对之间形成的非键相互作用的数目(侧链)。原子按照C、N、O/S进行分类,所以有六种不同的相互作用类型:CC、CN、CO、NN、NO、OO。得分>85比较好。•Verify_3D:比较模型和氨基酸一级结构的关系,获得PASS评价即可。•PROVE:与预先计算好的一系列标准体积之间的差别。用Z-score来表示。Z-score作为一个统计学值,可以显示模板蛋白质和待测蛋白之间的匹配程度,当Z-score较低时,就意味着没有匹配搜索的结构实例•以我研究的APSkinase的模型进行实例讲解:BLAST-PPDB数据库寻找最合适模板3UIE和4FXP(53%)EsayModeller多模板建模SAVES检测模型质量Chiron模型优化SAVES再次检验模型模型名称贴入序列加载模板(PDB文件)模板对齐多重序列比对生成模型模型优化自动Loop建模手动Loop建模模型名称ManualLoopmodelingLoop优化的起始碱基加载一个需要优化的PDB模型Loop优化的结束碱基手动Loop建模后模型的文件AdvancedOptimizationOptions加载优化的模型自动优化模型生成分子动力学轨迹(用VMD或CHIMERA打开查看)绘制模型的能量图DOPE(DiscreteOptimizedProteinEnergy)Energy模型质量检验•模型提交SAVES服务器(StructuralAnalysisandVerificationServer)进行检验PROCHECK•PROCHECK:本部分主要需要的是拉氏图(RamachandranPlot),可下载ps格式、PDF格式以及JPG格式。落在核心区+允许区+最大允许区的碱基百分比大于95%的模型质量很好。Verify_3D•78.74%oftheresidueshadanaveraged3D-1Dscore0.2ERRAT•Overallqualityfactor值越高越好,一般高解析度的晶体结构该值可以达到95,而对于解析度一般的来说该值只能到91左右。本例中的ERRAT值为68.280,还需要继续优化改进。Chiron进行优化•我们考虑采用计算量较少的Chiron服务器对模建结构的clash进行处理。•Chiron服务器修正前修正后模型质量再检测•用SAVES服务器对于经过处理的蛋白结构进行评价优化前优化后77.41968.280优化前优化后后续优化•结构方面:利用MD对整个结构进行进一步的松弛,以去除不合适的clash。•能量方面:利用Gromacs对蛋白结构进行能量最小化。
本文标题:92同源建模详细讲解-整理版
链接地址:https://www.777doc.com/doc-4234462 .html