您好,欢迎访问三七文档
人类基因组计划HumanGenomeProject,HGP一、背景人类基因组是人类的遗传物质(其化学本质是脱氧核糖核酸,简称DNA)总和,包含所有的基因序列及非基因序列。人类基因位于染色体上,有三类,它们分别编码为蛋白质、转运核糖核酸和核糖体核糖核酸,其中编码为蛋白质的基因大约有10万个(当时估计约10万个,后来证实只有3~3.5万个),它们在表现各种生理作用和生命现象中起决定性作用,是最重要的一类基因。基因指的是具有遗传效应的DNA片段。现在已经知道,人类的生老病死、喜怒哀乐,甚至生态环境和生物进化等都与基因密切相关。所以,著名的诺贝尔生理学与医学奖获得者R·杜尔贝科曾说:“人类的DNA序列是人类的真谛,这个世界上发生的一切事情都与这一序列息息相关,包括癌症在内的人类疾病的发生都与基因直接或间接有关…”人类基因组计划是与曼哈顿原子计划、阿波罗登月计划并称的人类科学史上的重大工程。该计划于1990年首先在美国启动,后有德、日、英、法、中等国的科学家先后正式加入。人类基因组计划曼哈顿原子计划阿波罗登月计划人类科学史上的三大工程美国病毒学家R·杜尔贝科(1914-)1986年3月7日美国《科学》杂志《癌症研究的转折点——人类基因组的全序列分析》他指出:“人类DNA序列是人类的真谛,这个世界上发生的一切事情,都与这一序列息息相关。”该文后来被称为“人类基因组计划”的“标书”。1987年,美国开始筹建“人类基因组计划”实验室。1989年,美国成立“国家人类基因组研究中心”,诺贝尔奖金得主、DNA分子双螺旋结构模型的提出者詹姆斯·沃森担任第一任主任。1990年,美国国会批准美国的“人类基因组计划”在10月1日正式启动。其总体规划是准备在15年内至少投入30亿美元,进行对人类的基因组分析。1993年,美国对这一计划做了修订,主要内容包括:人类基因组的基因图的构建与序列分析;人类基因的鉴定;基因组研究技术的建立;人类基因组研究的模式生物;信息系统的建立。这其中的最重要的任务就是人类基因组的基因图构建与序列分析。最重要的是这样几张图:遗传图、转录图、物理图、序列图,最优先考虑、必须保质保量完成的是DNA序列图。遗传图谱转录图谱0.7cM或kb序列图谱物理图谱100kbSTSmap四张图:物理图转录图遗传图序列图1999年9月中国获准加入人类基因组计划,负责测定人类基因组全部序列的1%,也就是3号染色体上的3000万个碱基对。中国是继美、英、日、德、法之后第六个国际人类基因组计划参与国,也是参与这一计划的唯一发展中国家。塞莱拉遗传公司(Celera)1998年5月,美国PE公司(该公司专门生产基因测序仪)推出了新一代的“毛细管测序义”,使测序的工作提高了许多倍,自动化程序也高级得多。但是这家公司首先将300台机器自己使用,并且投资3亿美元,让克雷格·文特尔组建了赛来拉公司,克雷格·文特尔发明了基因测序的“霰弹法”。号称要在3年内用新的方法完成人类基因组计划的全部序列,与国际人类基因组计划展开竞争。赛来拉公司的出现促进了公共金费资助的国际人类基因组计划的加速进行。二、方法一个人类的基因组约有一米,如果可以把基因组列成一排成批破译,人类基因组计划将是非常容易完成的.然而解链DNA并将其列成一排非常难,因为人类DNA包含相互折叠的46条染色体(chromosomes),22对常染色体和一对XY(男性)或XX(女性)性染色体.广泛应用的是一种替代方法,即用特定的酶(enzymes)把DNA切成片断,逐个分析然后得到全序列.DNA测序反应(Maxim-Gilbert,Sanger,1977),PCR技术(K.Mullis,1983),及荧光自动测序法(Smith,1986)是基因组计划的赖以进行的三种最重要的技术.在“人类基因组计划”中,分为两个阶段:DNA序列图以前的计划和DNA序列图计划。序列图以前的计划包括物理图、转录图、遗传图。人类基因组DNA序列图的绘制工作,可以做这样的比喻:假说人们只穿4种颜色的衣服,红、黄、白、黑,“人类基因组计划”就相当于把世界上30亿人所穿的衣服都搞清楚,而且注明位置顺序,如所在的国家、城市、街道、楼房、房间。人类基因组DNA序列图的绘制,是在上述3张图的基础上,采用了“分而胜之”的“克隆到克隆”的策略。科学家用已在代表人类基因组中不同区域定好位置的标记,即遗传图的“遗传标记”和物理图的“物理标记”,来找到对应的人类基因组“DNA大片段的克隆”。这些克隆都已知道是相互重叠的。再分别用机器测定每一个克隆的DNA顺序,再把它们按照相互重叠的“相邻片段群”装搭起来。为了测定这些大片DNA克隆的序列,要将这些DNA克隆按遗传图与物理图的标记,确定在基因组中,切成1~2000核苷酸长的小片段,再“装”到一种质粒“载体”上,送进细菌中克隆,大规模地培养细菌,再从细菌中提取这些“克隆’的DNA。在我国的“北京中心”,工作人员每天要制备5000~1万个克隆的DNA作为测序“模板”。这些DNA要质量上很纯,数量上准确,还不能相互混杂。模板制备好了,就要进行测序。第一步是“测序反应”。现在使用的方法是“酶终止法”。简单地说,是以要测的DNA为模板,重新合成一条新链,分别用不同颜色的荧光物质标记上。这样,如果一段序列的一个位点上是A,就将代表A的荧光物质标记在A的后面,由此类推。这样就形成了长度相差一个核苷酸的新的DNA链,而结尾一位则可以由荧光的颜色来决定是:或A或T、或C或G。测序反应做好后,第二步是上“自动测序议”分析。现在的机器主要有两类,一类是“凝胶电泳”,另一类为“毛细管电泳”,它们都能将长度仅相差一个碱基的DNA片段一一分开,由于不同的片段尾巴的核苷酸已标有不同颜色的荧光染料,可以很直观地读出A、T、C、G的序列。这些“序列”通过电脑加工、检查质量,再用一些特殊的电脑程序,将相互重叠的序列装搭起来。要确定每一位置的核音酸,至少要测定5~10次。如果中间有“空洞”,还要将这些“空洞”用各种技术“补”起来,最后形成一个大片段克隆的完整序列。这些序列片段再根据“相邻片段群”的信息装搭起来,就组合成了一个染色体区域,一个染色体完整序列。多国合作小组将30亿碱基对切成很多个细菌人工染色体(BAC)片断,然后切成更短的片断以便使用碱基序列分析仪.普通BAC含有约150,000碱基对,这就是说200,000个BAC就可以足够包含全人类基因组.理论上说200,000个BAC足够了,但事实上他们使用了300,000个BAC.因为DNA自动测序仪可一次读取约500碱基.他们随机截取BAC克隆体并读取首端和末端各500个碱基,然后组合得到大于1000碱基的全序列.通过比较重叠的片断,连接然后重建序列.多国合作小组通过分析5800万碱基的重叠读取了230亿碱基对序列,这是人类基因组的八倍.这种方法需要研究人员在早期把较多的时间和精力放到克隆和绘制草图上。Celera的进展略有不同.他没有使用BAC克隆体而是将全基因组随机切成几千万片断(“霰弹法”),读取每一片段的序列然后拼接它们.尽管看上去更直接,由于要比较几千万个序列信息并找到重叠部分,这项工作需要大量的计算机工作.为解决这个问题Celera的合作者们发明了高效的生物信息学(Bioinformatics)运算法则,从而得以短期内赶上多国合作小组的工作.Celera省略了前期的遗传图、物理图的绘制,节省了大量的时间,从而可以在短时间内追赶上公立机构的进度。两个小组都使用了荧光分析仪来读取500-1000个丙烯酰胺硅胶中末端使用了荧光物质的DNA片断,并通过分子量的不同来分离.A,T,G和C.碱基显示指定的不同的颜色,这样就测定了DNA序列.“逐个克隆法”:对连续克隆系中排定的BAC克隆逐个进行亚克隆测序并进行组装(公共领域测序计划)人类基因组计划:大规模测序基本策略“全基因组鸟枪法”:在一定作图信息基础上,绕过大片段连续克隆系的构建而直接将基因组分解成小片段随机测序,利用超级计算机进行组装(美国Celera公司)2003年10月,美国科学家通过研究发现,目前通常用于大片段脱氧核糖核酸(DNA)测序的“霰弹法”存在缺陷。美国的3位科学家对“霰弹法”进行了重新研究,其中两位曾经参与过该方法的开发。他们把利用“霰弹法”绘制的人类基因组草图和“人类基因组计划”公布的最新草图进行了对比,发现“霰弹法”无法测到人类基因组中重复出现的DNA片段,这些片段占到基因组的3%至5%,对于理解遗传性疾病具有重要意义,这个缺陷并不能抹杀“霰弹法”的作用,在进行快速DNA测序时,“霰弹法”仍然不失为一种可取的手段。最佳的DNA测序法是,将两种测序方法相结合:用“霰弹法”进行整体测序,识别出“霰弹法”无法测序的区域,再通过传统方法对这些区域测序。三、结果2000年,人类基因组计划的两个竞争机构分别宣布完成了序列分析工作。2001年初,公共金费资助的科学家在《自然》杂志上公布了该组织完成了人类基因组草图;同期,赛来拉公司在《科学》杂志上也公布了他们所完成的人类基因组草图。根据百慕大宣言,多国合作小组的碱基序列信息可被任何人24小时免费使用.这些网站相互交流且每日更新,每个提供的都是最新信息.但是Celera仅允许大学及研究机构在其网站上免费使用100万碱基的信息.如果需要更多或者进行商业研发,你将需要填一份仅供纯研究目的使用的誓词.也就是说,商业使用需要付费.同时Celera将对大约200个基因申请专利,这些基因被认为是和疾病相关的,尽管绝大部分基因将被公诸于众.尽管草图对于生物学家来说十分有用,但离完美还相距甚远。据估计,草图在富含基因的常染色体上约有1‰的遗漏,整体而言约有30%遗漏(包括基因匮乏的异染色体),忽略或错序的总数约为数十万。不确定基因序列或人造的基因数据对科学家从事大规模基因组分析(如基因进化机制或大范围基因组结构的研究)影响较大。如基因在不断变异的过程中,有些残存基因称之为假遗传基因的功能不能表达,利用错误的基因序列数据对已确定为假遗传基因进行研究时,就会发生张冠李戴的后果。一个基因的克隆,就能形成一个基因的产业,这不是天方夜谭。大多数外国医药公司,都在向基因方面投入巨资,而且规模扩张非常快。比如一个肥胖病的基因转让费就要1.4亿美元。四、工业的前景基因组工业最成型的技术中有转基因技术。比如用牛、羊、猪当作生物反应器,来生产人的红细胞促生素。用鸡生产人的血清白蛋白。这是把人的血清白蛋白基因的结构部分接到鸡的血清蛋白上,使原来鸡蛋的血清蛋白大部分变成人的血清蛋白。这样能生产人的血清蛋白的鸡自然比普通的鸡高出许多。转基因技术还可以把牛变成转基因牛,可以用它来生产出和人奶相同的牛奶,也可以生产出红细胞生长素。目前全世界所用的红细胞生长素只有几公斤,但是一头转基因牛年产就能达到约一公斤。目前转基因的牛羊已经从奶里提取出了几种人的基因产物。转基因技术还可以生产出人的器官。在医学史上,20世纪的突出进展就是器官移植技术。随着外科技术和免疫技术的发展,现在人类可以进行各种各样的器官移植。比如角膜、肾、心脏、肝。备用的人体器官成为紧缺商品,世界上数以万计的人等待着器官移植。在这种情况下,科学家想出了把人的器官转移到另一种动物身上的办法。让它长出人的器官。在植物方面,转基因的各类水果、粮食已经出现,美国已经搞了“食品基因组”,一方面要把动植物的基因组搞清楚;二是在此基础上,寻找出新的种质,也就是说,要找出新的基因资源。人类在20世纪开始的绿色革命,目的是寻找新的物种来生产足够多的粮食养活全人类,现在的食物基因组计划,将使人吃得更好。并解决人口增长、农业资源相对缺乏、生态环境恶化,彻底改变农场的定义。现在不管你是赞成克隆还是反对克隆,将来克隆肯定要影响到人类生活的方方面面。人类基因组计划以后还要带动其他生物基因组计划的发展,比如中国已经开展的水稻基因组计划,由于人和所有动物、植物、微生物都是远亲近成,人类基因组计划在研究人类这一最高级、最巨大、最复杂的生物基因组的一整套策略、技术,都可以用来研究所有其他生物的基
本文标题:人类基因组计划.
链接地址:https://www.777doc.com/doc-4254304 .html