您好,欢迎访问三七文档
当前位置:首页 > 办公文档 > 总结/报告 > 遗产税开征的可行性分析
2009年计算机辅助药物设计和大分子模拟技术暑期培训班DiscoveryStudioTutorials-1-蛋白质结构预测技术简介蛋白质结构预测技术简介蛋白质结构预测技术简介蛋白质结构预测技术简介简介简介简介简介蛋白质结构的解析对其功能的理解至关重要。然而,由于技术手段的限制,利用实验方法(主要为X-ray,NMR)解析蛋白质结构投入大、周期长、风险大。对于某些膜蛋白,只利用现有技术条件,其结构甚至无法解析。另一方面,随着分子生物学技术的成熟及高通量测序技术的发展,越来越多的基因序列可以轻松被找到。这造成了现代蛋白质科学中一个奇怪的现象:蛋白质序列数据的累积量及积累速度远远超过蛋白质结构。这种序列与结构间不平衡的现象极大地限制了我们对蛋白质功能及其相关作用机理的理解。所以我们需要一种能够简单、快速且相对准确的技术来确定蛋白质的空间结构。蛋白质建模技术可以很好的解决上面的问题。该方法利用信息技术的手段,可以直接从蛋白的一级结构(氨基酸序列)预测蛋白质的高级结构(主要为三级结构)。根据最新一届国际建模大赛(CASP)的分类,目前主要的蛋白质建模方法包括两种:基于模板的建模(Template-basedModeling)和自由建模(FreeModeling)。前者又包括两种方法:同源建模法(HomologyModeling)和“穿线法”(Threading)。后者主要以从头计算法(abinitio)为主。所有的建模方法中,以同源建模法(HomologyModeling)使用最为广泛,预测结果的准确性最大。同源建模的理论基础为蛋白质三级结构的保守性远远超过一级序列的保守性。因此,人们可以通过使用一个或多个已知结构的蛋白(模板蛋白,template)来构建未知结构蛋白(目标蛋白,target)的空间结构。其主要的步骤包括:1.搜索用于建模的template(s)2.将target与templates进行比较3.将步骤(2)中的比较信息用于建模DiscoveryStudio为用户提供了一整套利用HomologyModeling方法自动预测蛋白质空间结构的工具。用户只需要提供蛋白质的氨基酸序列就可以轻松完成模型构建及模型可信度评估的工作。DS的HomologyModeling主要基于MODELER程序。目前MODELER已成为使用最为广泛,预测最为准确的同源建模工具之一。其主要的建模步骤包括:1.使用序列相似性工具BLAST或PSI-BLAST搜寻目标序列的模板2.使用结构比对方法将模板进行比对,叠合3.使用序列比对方法将目标序列与模板结构的序列进行比对4.使用MODELLER产生目标序列的模型5.模型的评估本教程中以一个胞外淀粉酶的模型构建过程为例子,展示如何使用DS为该淀粉酶自动构建空间结构,并对所构建的模型进行评估,帮助大家获得HomologyModeling最直观的结果。2009年计算机辅助药物设计和大分子模拟技术暑期培训班DiscoveryStudioTutorials-2-1识别模板识别模板识别模板识别模板,,,,比对模板比对模板比对模板比对模板本教程使用BLAST来搜索templates。进行BLAST搜索时,数据库可以使用ProteinDataBank(PDB)数据库也可以用PDB_nr95(PDB非冗余结构数据库)。为缩短搜索时间,本文使用PDB_nr95数据库来寻找模板。1.1载入序列载入序列载入序列载入序列从从从从FilesExplorer,打开打开打开打开Samples|Tutorials|ProteinModeling|P41131.fasta.1.2BALSTPDB_nr95数据库数据库数据库数据库,,,,寻找模板寻找模板寻找模板寻找模板1.2.1选择选择选择选择target在在在在ProtocolsExplorer,展开展开展开展开SequenceAnalysis文件夹文件夹文件夹文件夹,,,,双击双击双击双击BLASTSearch(DSServer).在在在在theParametersExplorer,点击点击点击点击theInputSequenceparameter,,,,选择选择选择选择P41131:P41131InputSequence中的文件名为sequencewindow的名字(P41131)与该窗口中的序列名称(P41131)的名字组合。1.2.2选择选择选择选择BLAST数据库数据库数据库数据库InputDatabase选择选择选择选择PDB_nr95注意注意注意注意:PDB_nr95序列数据库已经安装在DSserver上。如果需要BAST其它数据库,用户需要另外安装相应的数据库。注意注意注意注意:如果改动默认参数或使用不同的(或升级版)的PDB_nr95数据库,BLAST结果可能与本教程的结果不一致。2009年计算机辅助药物设计和大分子模拟技术暑期培训班DiscoveryStudioTutorials-3-1.2.3运行运行运行运行Protocol在在在在Protocolstoolbar,点击点击点击点击运行运行运行运行,,,,等待计算完成等待计算完成等待计算完成等待计算完成.计算完成后,会显示一个“JobCompleted”的对话框。点击OK。1.2.4查看计算结果查看计算结果查看计算结果查看计算结果在在在在JobsExplorer中中中中,双击双击双击双击job栏中完成的计算栏中完成的计算栏中完成的计算栏中完成的计算————————“BlastSearchDSServer”这将打开一个Html的窗口,里面包含Reprot.htm文件(该文件为比对结果报告)Html窗口中窗口中窗口中窗口中,OutputFiles部分部分部分部分,点击点击点击点击theViewResults.这将打开BLAST搜索找到的序列注意注意注意注意:由于没有设置结果的保存路径,BLAST的结果保存于默认文件夹MyDocuments\DiscoveryStudioClient\Results\BLASTSearchDSServer_timestampID在在在在P41131-Blast窗口窗口窗口窗口,点击该窗口下的点击该窗口下的点击该窗口下的点击该窗口下的TableViewtab。。。。TableView显示了命中的序列。每行表示一条命中的氨基酸序列。在DS中,灰色的cell不能被编辑。注意注意注意注意:命中的序列按照E值(序列比对的可行度)进行降序排序。E值最低的序列,结果最可靠,排在第一行。2009年计算机辅助药物设计和大分子模拟技术暑期培训班DiscoveryStudioTutorials-4-点击点击点击点击MapViewtab.MapView将命中结果都显示在一张图中,每条线表示一条序列。每根横条根据打分不同而配以不同的颜色(分数超过400为红色,最佳的命中结果)。本例中的targetP41131放在窗口的最上方,为一条长度为443个氨基酸的直线。用户可以将鼠标放置在某一个命中序列上,如下信息将会显示(如上图):序列数据库的描述序列的编号目标序列中的起始氨基酸位置数据库中命中序列的起始氨基酸位置命中序列的长度命中序列的分数滑动鼠标的中间键可以滑动鼠标的中间键可以滑动鼠标的中间键可以滑动鼠标的中间键可以放放放放大大大大((((缩小缩小缩小缩小))))MapView中的结果中的结果中的结果中的结果这时用户可以看到窗口顶端target的相应氨基酸。可能需要放大几次才能看见具体的氨基酸类型。注意注意注意注意:Mapview中命中序列的顺寻并没有改变。2将模板进行比对将模板进行比对将模板进行比对将模板进行比对为了构建target的3D结构,我们需要挑选一个或多个合适的同源模板(templates)。一2009年计算机辅助药物设计和大分子模拟技术暑期培训班DiscoveryStudioTutorials-5-个理想的template需要涵盖整个target的长度,具有较高的序列等同性(Sequenceidentity),并且E值要够小(1×10-5)。根据上述原则,我们选用前4个命中序列作为template。一般而言,若有多条模板(模板之间相似度不能太高)与target具有相似的同源性,那么我们将使用多模板来构建同源模型。这些模板在核心区域一般都高度保守,而在一些loop区的构象上则有所不同。Target可以与其中某个模板在某loop区匹配,而与另一个模板在另一loop区匹配。因此,使用多模板可使建模过程中模型的每个部分都能找到最合适的模板。2.1载入模板结构及其与载入模板结构及其与载入模板结构及其与载入模板结构及其与target的比对结果的比对结果的比对结果的比对结果点击点击点击点击P41131-BlastWindow.点击点击点击点击MapViewtab,按住按住按住按住SHIFT键同时点击前四个命中序列键同时点击前四个命中序列键同时点击前四个命中序列键同时点击前四个命中序列1G94_A,3DHP_A,1HX0_A,and1JAE_A,,,,将其选中将其选中将其选中将其选中点击点击点击点击右键右键右键右键,,,,选择选择选择选择“LoadSelectedStructures”DS将打开中一个为新的3D窗口(记为1G94)。该窗口中包含了上述四个模板结构的A链以及结构中的水分子和配体分子。2.2模板结构间的结构比对模板结构间的结构比对模板结构间的结构比对模板结构间的结构比对序列保守性和结构保守性通常来说有所不同,所以序列比对的结果常常与结构比对的结果不同。对于同源建模来说,在模板与target进行比对之前,最好能将模板基于其结构的相似性先进行一次比对。进行基于结构的序列比对之前,需要先调用每个模板的序列。在菜单栏中在菜单栏中在菜单栏中在菜单栏中,,,,点击点击点击点击Sequence|ShowSequenceDS将打开一个名为1G94的新的序列窗口。该窗口中的序列没有经过任何的序列比对。2009年计算机辅助药物设计和大分子模拟技术暑期培训班DiscoveryStudioTutorials-6-在在在在ProtocolsExplorer中中中中,展开展开展开展开ProteinModeling文件夹文件夹文件夹文件夹,,,,双击双击双击双击AlignStructures(MODELER).在参数在参数在参数在参数ParametersExplorer,单击单击单击单击InputSequenceAlignment并选择并选择并选择并选择1G94.展开展开展开展开InputSequenceAlignment((((点击前面的点击前面的点击前面的点击前面的“+”号号号号),),),),可以观察到四个蛋白质结构可以观察到四个蛋白质结构可以观察到四个蛋白质结构可以观察到四个蛋白质结构1G94A,3DHPA,1HX0A,and1JAEA自动填充到自动填充到自动填充到自动填充到InputProteinStructures里面里面里面里面.在在在在Protocolstoolbar中中中中,点击点击点击点击运行运行运行运行,,,,等待计算完成等待计算完成等待计算完成等待计算完成等待结果计算完成之前等待结果计算完成之前等待结果计算完成之前等待结果计算完成之前,,,,可以在菜单栏可以在菜单栏可以在菜单栏可以在菜单栏里里里里选中选中选中选中Windows|CloseAll关闭所有的窗口关闭所有的窗口关闭所有的窗口关闭所有的窗口,,,,若提若提若提若提示示示示是否是否是否是否需要保存结果需要保存结果需要保存结果需要保存结果时时时时,,,,选择否选择否选择否选择否。。。。计算完成后计算完成后计算完成后计算完成后,,,,在在在在JobsExplorer中中中中,双击双击双击双击“AlignStructure(MODELER)”.DS将比对的结果文件显示在一个新的Html窗口里。2009年计算机辅助药物设计和大分子模拟技术暑期培训班DiscoveryStudioTutorials-7-2.4查看结构查看结构查看结构
本文标题:遗产税开征的可行性分析
链接地址:https://www.777doc.com/doc-3542247 .html