您好,欢迎访问三七文档
在人类以及其他多种生物的基因组中,都潜藏着大量的假基因。假基因是那种貌似正常、却没有功能的“死亡基因”。但是近年来,不断有科学家发现,假基因竟然有活动的迹象!难道假基因并没有死亡,它们有自己的功能,只是人类尚未发现?假若它们真的没有功能,那为什么我们人类在经过长时间的进化后,仍保留数量如此之多的假基因呢?太多的谜团环绕着假基因,科学家能一一破解吗?你知道吗?在我们的基因组中潜藏着不少“骸骨”,这些沉寂已久的基因“骸骨”胡乱地散布在我们的染色体中。它们是古老的基因化石,向人类展示着现代基因的进化历程。科学家把它们叫做假基因(pseudogene)。曾经很多人都认为它们完成了历史使命,已经光荣隐退。但近年来,科学家发现的种种迹象表明,在这些如恐龙般古老的DNA之中,有些也许并非是真的沉寂,而有着活动的迹象!虽然人类基因组计划已经正式完成,但假基因身上的重重谜团才刚刚揭开一角。基因组不是一个静止的信息库,而是一个活跃的生物计算机操作系统。假基因是一些古老密码的残留,不过与古老密码相关的功能早已被时间无情吞噬。但是我们不能忽视假基因,它们不仅记录了密码的生成与变化,而且作为基因组重建与更新过程的产物,它们还可以帮助科学家深入了解这些过程的发生、发展,甚至它们本身就是解开假基因谜团的金钥匙。假基因身世之谜“假”基因(falsegene)貌似正常基因(realgene),但它们没有“真本事”,无法合成出功能蛋白质。上个世纪70年代末,基因学家开始在染色体的特定位点上,寻找能合成出重要功能蛋白质的基因,结果却意外地发现了“假”基因,于是正式把它命名为假基因。例如,血红蛋白(hemoglobin)具有运输血液中氧气的作用,而β-球蛋白(betaglobin)是它的重要组成部分。在寻找β-球蛋白基因的过程中,科学家们发现了一段DNA序列,它与β-球蛋白的基因非常相似,却不能合成蛋白质。原来在这个基因的结构中,具有重要功能的部分发生了突变,使它不能被翻译成有用的蛋白质。自从人类基因组计划完成以来,科学家又接连完成了多种生物的基因组测序。大量的基因数据让基因学家们对基因组有了全面的认识。他们发现,假基因不是偶然存在的,而是普遍存于生物的基因组中。人类的基因组就像一个巨大的仓库,容纳了30多亿个碱基对,然而只有不到2%的基因组DNA可以直接编码蛋白质。在基因中,非编码序列(noncodingsequence,即内含子)大概占了基因全长的三分之一。基因之间的连接序列更是占了DNA的绝大部分,而这部分序列大多是基因组中的暗物质(genomicdarkmatter),它们到底发挥着怎样的功能至今还是一个未解之谜。就是在这些看似无用的广袤空间中,随意地散布着数量惊人的假基因,如同抛弃在荒野中的锈迹斑斑的汽车零件。随着对人类基因组的研究日益深入,我们的研究小组以及欧洲、日本的研究团队发现的假基因数量已经突破了1.9万个!而且假基因发现之旅似乎还远未走到尽头。科学家估计,人类的基因组中,大约只有2.1万个编码蛋白质的基因,所以在某一天,假基因的数量很有可能会赶超我们的功能基因。一个个假基因散发着浓厚的神秘气息:它们是如何形成的?为什么它们的数量如此之多?如果它们真的无用,那它们为什么会在我们的基因组中存在如此长的时间……对于假基因的形成,科学界已经有了明确的答案。少数假基因也曾经是重要的功能基因,只是由于核苷酸序列发生了改变,导致它们丧失了原有的功能。不过,大部分假基因都是功能基因的无效复制品:或者由于在复制的过程中,发生了致命突变,它们一产生就失去了功能;或者由于有害突变的长期积累,它们的功能慢慢消失殆尽。功能基因要发挥功能、履行自己的职责,就必须拥有一个完整的基因结构。外显子(exon)是一段连续的核苷酸序列,负责编码相应蛋白质的氨基酸序列。在两个外显子之间,又隔着一个内含子。每个基因的起始部分含有一段异常重要的序列,叫做启动子(promoter),它就像基因的标志,没有它,细胞机器就无法识别基因。当细胞要表达某一基因时,启动子先得将很多重要的生物分子召集到自己的身边,组成一个团队,因为基因的表达是多个分子相互协作的过程。随后,这些分子就会朝着基因的下游移动,将基因转录成前体RNA(preliminaryRNA)。前体RNA通过拼接加工,切除内含子、连接外显子,从而产生了经过剪切的信使RNA(mRNA)。最后,核糖体(ribosome)负责把mRNA翻译成氨基酸链。经过一系列复杂的蛋白质加工处理过程,氨基酸链形成了具有特定功能的蛋白质,它们共同执行基因的功能。假基因可以通过两种途径产生,每种途径都能产生不同于原始基因的翻版。细胞在分裂之前,会复制整个基因组。在这个过程中,往往会产生多余的基因拷贝,它们可能会在染色体上的其他位置安家落户。另外,在基因表达的过程中,mRNA可能会逆转录成DNA序列,然后重新插入基因组中。这是一种逆转录转座(retrotransposition)现象,并且还可以由一种转座遗传因子(transposablegeneticfactor)——长散在元件(longinterspersednuclearelement,LINE)引起。LINE具有制造自身DNA拷贝并将它插入基因组的能力,而且当LINE活动时,其邻近的mRNA转录产物也能随之一起被逆转座。在进化过程中,复制和逆转座是改变基因组、产生生物新变体的主要力量。通过复制产生的基因拷贝与原来的基因一样,具有正常的功能,它们插入基因组后,基因组就能获得更多的进化机会。但是,假如基因拷贝中含有错误序列,或者缺失了重要DNA片段(如启动子),那么它就会变成假基因。通过基因复制产生的假基因仍然含有内含子和外显子,它是可识别的,因而科学家把它称作复制型假基因。但是由mRNA逆转录得到的假基因不含内含子,所以由此产生的假基因被称为加工型假基因(processedpseudogene)。在人类基因组中,虽然这两种假基因似乎是随机分布的,但是各种功能基因产生假基因的能力却有高有低。基因学家根据功能基因在序列和效用上的相似性,将它们划分为不同的基因家族。在这些家族中,大约只有1/4与假基因有关,不过有些基因家族却非常“善于”制造基因拷贝。例如,编码人类核糖体蛋白的基因家族由80个基因组成,而由此衍生的加工型假基因就高达2,000多个,大约占了整个基因组中已发现的假基因的1/10。还有一个核糖体蛋白基因,叫作RPL21,由这一个基因衍生的假基因超过了140个。造成这种差异的原因可能是不同基因的功能有所不同。某些基因的产物对于细胞的整个生命过程都是必需的(如核糖体蛋白家族的基因),它们会在细胞中持续、大量地表达,因而有更多的机会衍生出加工型假基因。长期以来,假基因就是以这样的方式,不断地在我们的基因组中出现。在漫长的进化过程中,有些基因早已消失,但是它们的仿制品——假基因却保留了下来,尽管已经失去了原有的功能。还有一些基因,经历了几多变迁之后,早已面目全非,但是我们仍然可以在假基因身上看到它们早年的英姿。因此,基因区间(intergenicregion)是一个巨大的分子化石层,无声地记录着我们的进化历程。
本文标题:假基因
链接地址:https://www.777doc.com/doc-4649614 .html