您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学第六章蛋白质结构预测及分子设计
生物信息学第六章蛋白质结构预测及分子设计生物科学与技术学院引子单个蛋白涉及的问题结构预测(2D,3D)物理化学性质功能空间位置研究方法提取纯化制作晶体,决定结构理解机制,功能多个蛋白涉及的问题表达过程(DNARNA蛋白,调控网络)相互作用(yeasttwo-hybrid,亲和层析)蛋白家族(family)检测(2D-PAGE,质谱仪,蛋白质芯片)研究方法基因组测序蛋白预言计算机分析结构理解机制,功能▪一级结构(primary):氨基酸序列▪二级结构(secondary):α螺旋、β片层、...▪三级(维)结构(tertiary):亚基,结构域▪四级结构(quaternary):亚基之间特定的空间关系蛋白质的结构一些单氨基酸(aa)突变可引起蛋白结构的重大变化CFTR的ΔF508突变改变螺旋结构,从而改变其功能另一些变化则不明显一些蛋白引起的疾病囊肿性纤维化(cysticfibrosis):CFTR镰刀性贫血:血红蛋白疯牛病:朊蛋白阿尔兹海默氏征:淀粉样前体蛋白蛋白结构与人类疾病(重要性)蛋白结构的主要仓库–PDB▪始建于1971▪32000个结构数据(其中约3万是蛋白)读取PDB文件的门户网站Swiss-Prot,NCBI,EMBLPDBCATH,Dali,SCOP,FSSP解释PDB文件的数据库用”PubMed”搜蛋白结构(NCBI)1、进入”PubMed”2、选择”Structure”3、输入要找的蛋白名称或ID号等(如RecBCD,E.coliDNArepair)4、点击”Go”5、点击感兴趣的结果(1W36,进入MMDB)结果列表中包含相关蛋白(poweredbyBLAST)、文献、结构域(domain)、配体(ligand)、3D缩略图、三维查看器在MMDB看搜到蛋白的结构(NCBI)▪MMDB(MolecularModelingDatabase):NCBI的大分子三维结构数据库,数据来自PDB▪打开的单个蛋白的页面中包括▪文献、简单描述、入库日期、物种(taxonomy)▪该蛋白的PDB,VAST链接(entirechain/View3DAlignment)▪三维查看器(Cn3D)▪分子成分(图):chain,3Ddomain,classification/family,ligand点击其中的PDB(RCSB)链接,显示▪三维结构实验数据▪蛋白分类SCOP链接:结构域(家族,超家族)CATH链接:域,Class,Architecture,Topology,HomologyGO链接:功能,过程,细胞组成▪更多信息生化性质,配体,SNP(SequenceDetails)图形显示各域的分布,类别,DSSP二级结构,PDP域更多外部链接(对于RecBCD多达26个)更多有用的链接▪PDB的外部链接中ComputepIMw点击ChainB(可计算各链分子量)▪在打开的ComputepI/Mw页面中点击EX5B_ECOLI(ExPASy,大量信息,链接)▪在打开的UniProtKB/Swiss-Prot页面中点击EcoCyc:EG10824-MONOMER(biocyc,参与的反应/路径图)蛋白质结构分析蛋白质一级结构蛋白质基本理化性质分析蛋白质亲疏水性分析蛋白质跨膜区结构预测蛋白质二级结构蛋白质二级结构预测(α螺旋,β折叠等)蛋白质超二级结构蛋白质结构域分析蛋白质三级结构蛋白质三维结构模拟蛋白质结构预测及分析的主要内容蛋白质结构预测过程ORF翻译实验数据蛋白质序列蛋白质理化性质和一级结构数据库搜索结构域匹配已知结构的同源蛋白?三维结构模型可用的折叠模型?同源建模有二级结构预测无串线法有从头预测无蛋白质的基本性质蛋白质的基本性质:相对分子质量氨基酸组成等电点(pI)消光系数半衰期不稳定系数总平均亲水性…….工具网站备注AACompldent利用未知蛋白质的氨基酸组成确认具有相同组成的已知蛋白ComputepI/Mw计算蛋白质序列的等电点和分子量ProtParam对氨基酸序列多个物理和化学参数(分子量、等电点、吸光系数等)进行计算PeptideMass计算相应肽段的pI和分子量SAPS利用蛋白质序列统计分析方法给出待测蛋白的物理化学信息蛋白质理化性质分析工具ProtParam工具简介基于蛋白质序列的组分分析氨基酸亲疏水性等分析为高级结构预测提供参考Expasy开发的针对蛋白质基本理化性质的分析:▪ProtParam工具计算以下物理化学性质:•相对分子质量•氨基酸组成•等电点(pI)•消光系数•半衰期•不稳定系数•总平均亲水性……▪如果分析Swiss-Prot和TrEMBL数据库中序列▪直接填写Swiss-Prot/TrEMBLAC号(accessionnumber)▪如果分析新序列:▪直接在搜索框中粘贴氨基酸序列输入Swiss-Prot/TrEMBLAC号将protein.txt蛋白质序列粘贴在文本框中返回结果氨基酸数目相对分子质量氨基酸组成正/负电荷残基数消光系数半衰期原子组成分子式总原子数E(Prot)=Num(Tyr)*Ext(Tyr)+Num(Trp)*Ext(Trp)+Num(Cystine)*Ext(Cystine)proteinsinwatermeasuredat280nm:Ext(Tyr)=1490,Ext(Trp)=5500,Ext(Cystine)=125Absorb(Prot)=E(Prot)/Molecular_weight不稳定系数脂肪系数总平均亲水性40stable40unstable注意:ProtParam没有考虑蛋白质翻译后修饰、蛋白质多聚体等情况,故用户在预测和分析此类特定蛋白质的基本理化性质时需要仔细审视反馈结果。蛋白质结构预测跨膜区预测:膜蛋白是一类结构独特的蛋白质,在各种细胞中普遍存在,同时发挥着重要的生理功能。一、跨膜区分析(a)-TypeImembraneprotein(b)-TypeIImembraneprotein(c)-Multipasstransmembraneproteins(d)-Lipidchain-anchoredmembraneproteins(e)-GPI-anchoredmembraneproteins蛋白质跨膜区特性▪典型的跨膜螺旋区主要是由20~30个疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)组成;▪亲水残基往往出现在疏水残基之间,对功能有重要的作用;▪基于亲/疏水量和蛋白质跨膜区每个氨基酸的统计学分布偏好性。跨膜蛋白序列“边界”原则▪胞外末端:Asp(天冬氨酸)、Ser(丝氨酸)和Pro(脯氨酸)▪胞外-内分界区:Trp(色氨酸)▪跨膜区:Leu(亮氨酸)、Ile(异亮氨酸)、Val(缬氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸)▪胞内-外分界区:Tyr(络氨酸)、Trp(色氨酸)和Phe(苯丙氨酸)▪胞内末端:Lys(赖氨酸)和Arg(精氨酸)常用蛋白质跨膜区域分析工具工具网站备注DAS~miklos/DAS/用DenseAlignmentSurface(DAS)算法来预测无同源家族的蛋白跨膜区HMMTOP由Enzymology研究所开发的蛋白质跨膜区和拓扑结构预测程序SOSUI由Nagoya大学开发一个具有图形显示跨膜区的程序TMAP基于多序列比对来预测跨膜区的程序TMHMM基于HMM方法的蛋白质跨膜区预测工具TMpred基于对TMbase数据库的统计分析来预测蛋白质跨膜区和跨膜方向TopPred是一个位于法国的蛋白质拓扑结构预测程序TMpred工具简介▪▪依靠跨膜蛋白数据库TMbase▪预测跨膜区和跨膜方向主要参数/选项序列在线提交形式:•直接贴入蛋白序列•填写SwissProt/TrEMBL/EMBL/EST的ID或AC输出格式最短和最长的跨膜螺旋疏水区长度输入序列名(可选)选择序列的格式贴入protein.txt蛋白质序列输出结果•可能的跨膜螺旋区•相关性列表可能的跨膜螺旋区位置分值片段中点位置相关性列表26建议的跨膜拓扑模型最优拓扑结构每一位置计算分值二、信号肽分析信号肽:指分泌蛋白表达时氨基端(N-,有时不在N端)的20余个氨基酸,将引导该蛋白质最终分泌到细胞外,但这段信号肽会被信号肽酶切掉,所以成熟的分泌蛋白是不含这段信号肽的。信号肽可以指导蛋白质的跨膜转移。信号肽预测工具:SignalPserver()三、蛋白质二级结构分析(α螺旋、β折叠)蛋白质二级结构及类型二级结构取决于氨基酸侧链结构,由氢键形成1、α螺旋(helix):4-40aa2、β折叠(sheet):5-10aa,平行或反平行(C,N端方向一致或相反)3、转角(turn)4、无规则卷曲(randomcoil)工具网站备注BCMSearchLauncher包括了常见的蛋白质结构分析程序入口,一般分析可以以此服务器作为起点Prof~phi基于多重序列比对预测工具PSIpred提供跨膜蛋白拓扑结构预测和蛋白profile折叠结构识别工具nnPredict~nomi/nnpredict.html预测蛋白质序列中潜在的亮氨酸拉链结构和卷曲螺旋PredictProtein提供多项蛋白质性质分析,并有较好准确性PREDATOR预测时考虑了氨基酸残基间的氢键蛋白质二级结构分析工具PredictProtein()▪可以获得功能预测、二级结构、基序、二硫键结构、结构域等许多蛋白质序列的结构信息。▪该方法的平均准确率超过72%,最佳残基预测准确率达90%以上。因此,被视为蛋白质二级结构预测的标准。▪用户需要注册ID、验证E-mail后,才能使用PredictProtein工具。如何使用PredictProtein工具将protein.
本文标题:生物信息学第六章蛋白质结构预测及分子设计
链接地址:https://www.777doc.com/doc-2199605 .html