您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 结构基因组学中的衍射相位问题
InvitedpaperpublishedinChineseBulletinofLifeSciences15(2003)65-69结构基因组学结构基因组学结构基因组学结构基因组学中的中的中的中的衍射相位问题衍射相位问题衍射相位问题衍射相位问题Thediffraction-phaseprobleminstructuralgenomics范海福中国科学院物理研究所梁栋材中国科学院生物物理研究所摘要摘要摘要摘要本文简要介绍结构基因组学研究中,用于测定蛋白质结构的X-射线分析在解决衍射相位问题方面的最新进展。关键词:结构基因组学,蛋白质结构分析,晶体学中的直接法关键词:结构基因组学,蛋白质结构分析,晶体学中的直接法关键词:结构基因组学,蛋白质结构分析,晶体学中的直接法关键词:结构基因组学,蛋白质结构分析,晶体学中的直接法AbstractNewdevelopmentsarebrieflydescribedonsolvingthephaseproblemofX-raystructureanalysisofproteinsinstructuralgenomics.Keywords:structuregenomics,proteinstructureanalysis,directmethodsincrystallography作者简介:作者简介:作者简介:作者简介:范海福,男,生于1933年8月。1956年毕业于北京大学化学系。现任中国科学院物理研究所研究员。1991年当选中国科学院院士。2000年当选第三世界科学院院士。研究方向:蛋白质晶体结构分析方法;非公度调制结构分析(材料科学);粉晶衍射分析方法;电子显微学中的图像处理;晶体学中的电子计算机软件设计。梁栋材,男,生于1932年5月。1955年毕业于中山大学化学系。现任中国科学院生物物理研究所研究员。1980年当选中国科学院院士。1985年当选第三世界科学院院士。研究方向:蛋白质晶体结构分析,生物大分子三维结构与功能,结构生物学研究以及结构基因组等工作。前言前言前言前言人类基因组测序的基本完成标志着“后基因时代”的开始。其特征之一就是“结构基因组学”研究的兴起。蛋白质是生命活动的关键物质。基因序列只决定蛋白质分子的氨基酸顺序(一维结构)。但是,蛋白质的功能却与其三维空间结构密切相关。要想在原子、分子的层次上去认识生命过程,就需要从基因组序列出发,系统地研究相应的基因表达产物-蛋白质的三维结构与功能。“结构基因组学”研究就是在这一背景下,于1998年由美国的国家科学管理机构NIGMS(NationalInstituteofGeneralMedicalSciences)发起的[1]。它是结构生物学迅猛发展的必然结果,是二十一世纪的一个重大国际性科研计划。世界上许多发达国家乃至发展中国家都参预了这一计划。结构基因组计划需要大规模测定并研究蛋白质的三维结构,特别是测定和研究与已知结构的蛋白质没有序列同源性的,以及属于新结构类型的蛋白质结构。由于要求大规模和高速度地测定蛋白质的三维结构。因而人们称结构基组计划为“高产出”(high-throughput)的结构测定,甚至称之为蛋白质结构工厂(Structuralfactory)。结构基因组计划的研究对象是:在整个人类基因组、各种生物体(病毒、细菌、昆虫、动物的某一组织细胞等)和许多重要疾病基因等等的基因序列基础上,测定其各个基因表达产物−蛋白质的三维结构。结构基因组学的研究对于结构生物学的发展将有深远的影响。另一方面它还有广阔的实用前景。它将为预防、诊断、和治疗人类一些重要疾病指出根本的途径。就其复杂程度而言,如果说基因组测序要解决的是一维的问题,那么结构基因组学面临的则是三维乃至四维的问题。美国在其结构基因组学计划中所提出的第一个目标,是要用十年时间测定出一万个独立的非同源蛋白质三维结构,而人类至今只测定了两千多个独立的非同源蛋白质三维结构。为了实现这第一个目标,提高蛋白质三维结构分析的效率是一大关键。目前NIGMS设置了九个结构基因组学研究基地,其中有八个基地强调要发展高产出(highthroughput)的测定蛋白质三维结构的技术和方法。可以认为,是否在高效测定蛋白质三维结构的方法和技术上有所创新,在某种程度上决定着我国是否有能力参预结构基因组学研究的国际合作和竞争,并作出有分量的贡献。蛋白质的蛋白质的蛋白质的蛋白质的X----射线衍射分析和衍射相位问题射线衍射分析和衍射相位问题射线衍射分析和衍射相位问题射线衍射分析和衍射相位问题测定蛋白质三维结构的主要手段有三种。即单晶体的X-射线衍射分析、多维核磁共振、以及电子晶体学。其中使用最为广泛的是单晶体X-射线衍射分析。迄今为止,百分之八十以上已知的蛋白质三维结构都是由它测定的。这种情况在今后十年内恐怕很难改变。蛋白质晶体结构的X-射线衍射分析包含:试样制备、数据采集、相位推定、模型建立和精修等四个主要部分。每一部分都有急需改进的关键性环节,都关系到整体的效率。每一部分又都与其它部分密切相关。某一个部分取得进展可能减轻另一个部分的负担;某一个部分的“瓶颈”也可以转化为另一个部分的“瓶颈”。所谓“衍射分析”就是要从物体对波的衍射效应推算出物体内部的结构。这是物理学中一个既古老、又不断发展的逆问题。“衍射相位问题”是这个逆问题的关键环节。因为衍射效应包含衍射波的振幅和相位,而目前能够普遍使用的实验方法只能记录到衍射波的振幅。要想推算出物体的结构,就必须先找回“丢失”了的相位。X-射线衍射测定蛋白质晶体结构,用于解决相位问题的主要方法有三种,即分子置换法、多对同晶型置换法(MIR)、以及多波长异常衍射法(MAD)。第一种方法用于测定有已知同源类似物的蛋白质结构。后两种方法用于测定未知的蛋白质结构。在结构基因组学研究中,用于测定蛋白质结构的主流手段,可以归纳为“同步辐射+硒(Se)代+MAD(Multi-wavelengthAnomalousDiffraction)”。同步辐射提供波长连续可调的、高强度的X-射线,用于数据采集;硒代是试样制备的一个环节,是用硒原子取代蛋白质分子中甲硫氨酸的硫原子以产生便于利用的X-射线异常衍射;MAD是在上述基础上推定衍射相位的算法。尽管目前MAD方法被广泛采用,但是它并非万灵的,更不是终极的方法。为了提高测定蛋白质结构的效率,国际上有大量的研究工作致力于探索各种解决衍射相位问题的新途径。下面是比较活跃的几个研究方向。一、多数蛋白质都含硫原子,是否可以不经过硒代,直接利用硫的异常散射效应来测定蛋白质的晶体结构?如果能实现这一目标,就可以大量节省实验工作,简化数据分析过程。但要达到这个目标,需要解决两方面的问题。一方面,由于硫原子的散射能力较弱,需要设法提高数据采集的精度。另一方面,以硫原子作为异常散射原子,不便于使用MAD(多波长异常衍射)方法,而须以SAD(单波长异常衍射)方法代替。但是SAD有“相位双解”问题,即每一个衍射都有两个可能的相位,孰真孰伪难以区分。这就需要发展一套破析SAD相位双解的方法。我国在二十世纪六十年代就提出用晶体学中的直接法破析SAD的相位双解[2]。自二十世纪八十年代至今,这一研究一直是国际“直接法”研究的热点之一。我国在这方面有相当的积累,可望在竞争中取得优势。二、有的蛋白质不含硫,或者虽含硫而不易硒代。要想方便地利用异常衍射效应,就需要设法在蛋白质晶体中引入原子序较大的“重原子”。浸泡法是常用的方法,但是效率不够理想。新近有利用高压将惰性气体原子引入到母体蛋白质晶体的方法。也有利用重原子络合物与蛋白质分子起作用以引入重原子的方法。这些方法所产生的含重原子蛋白质晶体不一定便于使用MAD方法。这时SAD或SIR(单对同晶型置换),或二者的结合将是首选的方法。使用上述新方法制备重原子衍生物,辅以破析SAD或SIR相位双解,是一个很有前途的研究方向[3],[4]。三、在目前的条件下MAD是无可争议的主流方法。如何进一步提高MAD的功效,从同样一套多波长衍射数据获得质量更好的电子密度图,使之便于诠释以获得分子结构模型,这是许多蛋白质晶体学家非常关心的问题。当前有关的研究可分作两类。第一类着眼于过程的前端,设法提高推定衍射相位的精度[5];第二类着眼于过程的末端,设法更合理地利用相位信息以提高所得电子密度图的质量[6]。两者是相辅相成的。四、除了MAD方法以外,MIR(多对同晶型置换)方法也是常用的测定蛋白质晶体结构的方法。和MAD方法一样,如何从一套实验的MIR数据获得质量更好的电子密度图,也是许多蛋白质晶体学家非常关心的问题。上面提到有关改进MAD方法的研究结果,很容易推广到MIR方法。我国已经有成功的试验[7]。五、上述所有方法都基于异常衍射或者同晶置换。能否像测定小分子晶体结构那样,无需异常衍射或者同晶置换,只用一套由母体蛋白质晶体产生的衍射数据来测定其结构呢?这是蛋白质晶体学家梦寐以求的。它是近十年来晶体结构分析方法学研究的一个热点。对于达到“原子分辨率”(分辨极限约为1.2Å)的衍射数据,目前已经可以直接测定含有几千个独立原子的蛋白质晶体结构[8],[9],[10]。由于能满足“原子分辨率”要求的蛋白质晶体为数不多,今后的发展方向是使之适用于更低分辨率的衍射数据。直接法在测定蛋白质晶体结构中的应用直接法在测定蛋白质晶体结构中的应用直接法在测定蛋白质晶体结构中的应用直接法在测定蛋白质晶体结构中的应用上面提到的研究方向都和晶体学中的直接法有密切关系。直接法是要从一组衍射振幅直接推定相应的衍射相位。它创始于1947年。起初,由于直接法本身尚不完善,又由于当时采集衍射数据的精度还不高,直接法从诞生至六十年代初的十几年间,基本上是在纸上谈兵。以H.Hauptman和J.Karle为代表的一批人把二十世纪五十年代用于建立直接法的理论体系。在此基础上,I.L.Karle和J.Karle于1964年在实际应用上取得重大突破。稍后,M.M.Woolfson等人在发展直接法的新算法,并使之标准化和自动化方面,取得了革命性的进展。及至二十世纪八十年代初,直接法终于在小分子的单晶体结构分析中占据了统治地位。直接法使测定小分子晶体结构的周期从几个月缩短为几天;使能够测定的、不含重原子的晶体结构从二、三十个独立原子(不算氢原子)提高到一百多个独立原子。它有力地推动了结构化学的发展,并为基于小分子结构的药物设计提供了必不可少的实验基础。为此,直接法的两位先驱H.Hauptman和J.Karle于1985年获得诺贝尔化学奖。有关直接法截至二十世纪八十年代中期的发展,M.M.Woolfson写过一篇综述[11]。直接法并未因获得诺贝尔奖而止步。从二十世纪八十年代起,直接法迅速开拓新的应用领域。其中成效最为卓著的,当推直接法用于测定蛋白质晶体结构。这方面的工作可以分为两大类。第一类用于达到“原子分辨率”的衍射数据。现在,直接法已经可以从一套极限分辨率约为1.2Å或者更好的母体蛋白质衍射数据解出含几千个独立原子的蛋白质结构。就其“解题能力”而言,比二十世纪八十年代初提高了几十倍。但是,能够提供“原子分辨率”衍射数据的蛋白质晶体只占当前用于晶体结构分析的蛋白质晶体的百分之五左右。因此,这类方法的适用范围很小。第二类方法以“低分辨率”(分辨率极限约为2~3Å)的衍射数据为对象。这类方法是将直接法与传统的蛋白质晶体学方法(如SAD/MAD以及SIR/MIR等)相结合。其适用范围可达当前全部蛋白质晶体结构分析的百分之八十以上,因而具有全面提高蛋白质结构分析效率的巨大潜力。我国在这方面拥有多个国际上最佳的试验结果和应用实例。下面是直接法用于测定蛋白质晶体结构的一些例子。一、从“原子分辨率”衍射数据直接测定蛋白质晶体结构一、从“原子分辨率”衍射数据直接测定蛋白质晶体结构一、从“原子分辨率”衍射数据直接测定蛋白质晶体结构一、从“原子分辨率”衍射数据直接测定蛋白质晶体结构图一示出由ACORN程序[10]测定未知蛋白质metalloproteinasedeuterolysin晶
本文标题:结构基因组学中的衍射相位问题
链接地址:https://www.777doc.com/doc-4699295 .html