您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 生物学 > 北大基础分子生物学课件11基因组与比较基因组学
第十讲基因组与比较基因组学1940年代第一颗原子弹爆炸,1960年代人类首次登上月球和1990年代提出并已基本完成的人类基因组计划(HGP)是20世纪人类科技发展史上的三大创举。(b)(a)10.1人类基因组计划基因组学这一名词是美国人T.H.Roderick在1986年7月造出来的,与一个新的杂志——Genomics一道问世,它着眼于研究并解析生物体整个基因组的所有遗传信息。基因组是生物体内遗传信息的集合,是某个特定物种细胞内全部DNA分子的总和。人类基因组包括23对染色体,单倍体细胞中约有30亿对核苷酸,编码了5-6万个基因,人类基因组中携带了有关人类个体生长发育、生老病死的全部遗传信息。从整体上看,不同人类个体的基因是相同的,因此,我们说“人类只有一个基因组”,人生来是平等的。当然,不同的人可能拥有不同的等位基因,这一点决定了人与人之间个体上的差异。10.1.1人类基因组计划的科学意义到目前为止,已经完成了酵母、线虫、果蝇、拟南芥、人类、小鼠和水稻等7个真核生物基因组以及大肠杆菌等上百个原核生物基因组。图10-1主要基因组计划到2001年2月为止的进展情况总结人类基因组计划的科学意义在于:(1)确定人类基因组中约3-4万个编码基因的序列及其在基因组中的物理位置,研究基因的产物及其功能。(2)了解转录和剪接调控元件的结构与位置,从整个基因组结构的宏观水平上理解基因转录与转录后调节。(3)从整体上了解染色体结构,了解各种不同序列在形成染色体结构、DNA复制、基因转录及表达调控中的影响与作用。(4)研究空间结构对基因调节的作用。(5)发现与DNA复制、重组等有关的序列。(6)研究DNA突变、重排和染色体断裂等,了解疾病的分子机制,为疾病诊断、预防和治疗提供理论依据。(7)确定人类基因组中转座子、逆转座子和病毒残余序列,研究其周围序列的性质。(8)研究人类个体之间的多态性(SNP)情况,用于基因诊断、个体识别、亲子鉴定、组织配型、发育进化等许多医疗、司法和人类学的研究。人类基因组计划的成果是多方面的,它主要体现在鉴定基因的四张图上。10.1.2遗传图(GeneticMap)又称连锁图(LinkageMap),是指基因或DNA标志在染色体上的相对位置与遗传距离,通常以基因或DNA片段在染色体交换过程中的分离频率厘摩(cM)来表示。cM值越大,两者之间距离越远。产生配子的减数分裂过程中,亲代同“号”的父源或母源染色体既能相互配对也可能发生片段互换,而父母源染色体等位基因互换导致子代出现DNA“重组”的频率与这两个位点之间的距离呈正相关,所以,用两个位点之间的交换或重组频率来表示其“遗传学距离”。图10-2遗传距离图的基本数据来自基因的重组。注:上述4个基因都位于果蝇的X染色体上。标签表现型筛选方法ADE2培养基中需加入腺苷酸只能在加入腺苷酸的培养基上生长CAN1对刀豆氨酸有抗性能在含有刀豆氨酸的培养基上生长CUP1对铜离子有抗性能在含有铜离子的培养基上生长CYH1对环己酰亚胺有抗性能在含有环己酰亚胺的培养基上生长LEU2培养基中需加入亮氨酸只能在加入亮氨酸的培养基上生长SUC2能进行蔗糖发酵能在以蔗糖作为唯一碳源的培养基上生长URA3培养基中需加入尿嘧啶只能在加入尿嘧啶的培养基上生长表10-1酵母遗传分析中昀常用的生物化学标签由于不能对人类进行“选择性”婚配,而且人类子代个体数量有限、世代寿命较长,呈共显多态性的蛋白质数量不多,等位基因的数量不多。DNA技术的建立为人类提供了大量新的遗传标记。第一代DNA遗传标记是RFLP(RestrictionFragmentLengthPolymorphism,限制性片段长度多态性)。DNA序列上的微小变化,甚至1个核苷酸的变化,也能引起限制性内切酶切点的丢失或产生,导致酶切片段长度的变化。图10-3限制性片段长度多态性(RFLP)原理示意图。由于核苷酸序列的改变遍及整个基因组,特别是进化中选择压力不是很大的非编码序列之中,RFLP的出现频率远远超过了经典的蛋白质多态性。而且,只要选择得当,生物体内出现共显性RFLP及RAPD分子标记的频率较高。M:突变型(mutant):引物W:野生型(wildtype)图10-4RFLP分子标记中的显性与共显多态性分子机制。图中第一种类型是昀常见的显性多态性标记,第2,3,4类都是共显性标记。第二代DNA遗传标记利用了存在于人类基因组中的大量重复序列:重复单位长度在15-65个核苷酸左右的小卫星DNA(minisatelliteDNA);重复单位长度在2-6个核苷酸之间的微卫星DNA(microsatelliteDNA),后者又称为简短串联重复(STR、STRP或SSLP,shorttandemrepeatpolymorphism或者simplesequencelengthpolymorphism)。STRP的优点是“多态性”与“高频率”。由于(A)n,(CA)n,(CGG)n等短重复序列在进化上不受选择,在同一位点上可重复单位数量变化很大,配对时又容易产生“错配”,使这样的位点遍布于整个基因组。表10-2人类基因组中的各种主要卫星DNA比较卫星DNA分类特征卫星DNA:串联重复的基本单位首尾相接,在基因组中呈不均匀分布,但主要集中于着丝粒、端粒等特定部位,高度或中等重复,分属三个大家族。α卫星DNA中等重复,基本单位长171bp。小卫星DNA中等重复,基本单位长15~65bp。微卫星DNA中等重复,基本单位长2~8bp已有5264个STRP为主体的遗传标记“连锁图”,平均分辨率已达600kb,其中第17号染色体上平均每495kb有一个标记,第9号染色体上平均每767kb有一个标记,整个基因组中只有三处标记间距大于4Mb。图10-5人类基因组微卫星遗传标记图。占人类基因组约45%的重复序列来源于转座子复制机制。序列分析表明,四类转座子产生了这些重复序列,其中前三类转座子以RNA为中间产物进行转座,昀后一类则直接以DNA的形式转座。图10-6存在于人类基因组重复序列中的四类转座子序列分析。LINEs(longinterspersedelements)可能是人类基因组中昀古老的重复序列,一般长5-6kb,含有RNA聚合酶II启动子序列和两个可读框.SINEs(shortinterspersedelements)是非自主转座子,长约100~400bp,其3’末端与LINEs有同源性,因此能依靠LINEs进行转座。第三代DNA遗传标记,可能也是昀好的遗传标记,是分散于基因组中的单个碱基的差异,即单核苷酸的多态性(SNP),包括单个碱基的缺失、插入和替换。SNP中大多数为转换,即由一种嘧啶碱基替换另一种嘧啶碱基,或由一种嘌呤碱基替换另一种嘌呤碱基,颠换与转换之比为1:2。SNP有可能在密度上达到人类基因组“多态”位点数目的极限。估计人类基因组中可能有300万个SNP位点!SNP与RFLP和STRP标记的主要不同之处在于,它不再以DNA片段的长度变化作为检测手段,而直接以序列变异作为标记。图10-7人类基因组中的SNP作为遗传标记的分子机制。A单核苷酸多态性的产生;BSNP的产生影响了DNA序列间杂交的强度。AB“遗传图”的建立为人类疾病相关基因的分离克隆奠定了基础。拥有5000多个遗传学位点,相当于把整个人类基因组划分为5000多个小区,并分别设置了“标牌”。如果在家系中证实该基因与某个标记不连锁(重组率为50%),表明该基因不在这一标记附近。如果发现该基因与某个标记有一定程度的“连锁”(重组率小于50%但大于0),表明它可能位于这个标记附近。如果该基因与某标记间不发生重组(重组率等于0),我们就推测该标记与所研究的疾病基因可能非常接近。10.1.3物理图(PhysicalMap)人类基因组的物理图是指以已知核苷酸序列的DNA片段(序列标签位点,sequence-taggedsite,STS)为“路标”,以碱基对(bp,kb,mb)作为基本测量单位(图距)的基因组图。物理图的主要内容是建立相互重叠连接的“相连DNA片段群”(contigs)。图10-8酵母第三号染色体遗传图(右)和物理图(左)的比较。10.1.4转录图(ExpressionProfiling)人类的基因转录图(cDNA图),或者基因的cDNA片段图,即表达序列标签图(EST,expressedsequencetag)是人类基因组图的雏型。在成年个体的每一特定组织中,一般只有10%~20%的结构基因(约1~2万个不同类型的mRNA)表达。表10-3不同生物基因组的蛋白质编码能力比较物种基因组总长度蛋白质种数(个)尿殖道支原体Mycoplasmagenitalium580,073bp467肺炎支原体Mycoplasmapneumoniae816,394bp677流感嗜血杆菌Haemophilusinfluenzae1,830,138bp1709枯草芽孢杆菌Bacillussubtilis4,214,814bp4100大肠杆菌Escherichiacoli4,639,221bp4288酿酒酵母Saccharomycescerevisiae13,116,818bp6275线虫Caenorhabditiselegans约97Mp18891拟南芥Arabidopsisthaliana115Mp25,498果蝇Drosophilamelanogaster116Mp14113人类Homosapiens3.2×109bp约5万左右(?)10.1.5人类基因组的序列图(HumanGenomeSequence)人类基因组的核苷酸序列图是分子水平上昀高层次、昀详尽的物理图。测定总长约1米、由30亿个核苷酸组成的全序列是人类基因组计划的昀终目标(图10-10)。tttccggtatttgggctttaaatccttaattatattatcttgtaaaaaaaagctactcttataagtaacgttttgacccaaaataaagtaaagtttcgacattttgcatatacattaagaaactaaataaatatactatgacccccttcgaaaacatgtcattcaaaataaagtacttgtgaaaagataaaactaaataatataaataattacctttaaacagaacaaaatcttctaaaacaacatttatattgaaattaagagtaatacattttagcaataacaaaaaaattcatgtacaagatccatgtacatataaatgcctactgatatgtcactttccccaaacgtcacAttaatatctcttcttctttttttaacatcttaatcttatttatgattcacagagaaagaaaaagagtcaaaatcaaaataacagcttttctccacataaatccacatgtgtgtatactggttactcgactctatatatagtcctaaagctacaatgtttctccatcaaaagtatcaaaagaaagagaaacaacaaaagcaaatcctataattataatcacaaaacgaATGGCGGCCGTTACTTCCTCATGCTCCACCGCGATCTCCGCTTCTTCCAAAACCCTAGCGAAGCCAGTCGCCGCAAGCTTCGCCCCTACTAATCTCTCATTTTCAAAGCTTTCTCCTCAGTCAATCAGGGCTCGTAGATCCATCACCGTCGGCAGCGCACTAGGCGCCACCAAGGTGTCGGCTCCTCCCGCCACACATCCCGTTTCGCTCGATTTTGAGACTTCTGTCTTCAAGAAGGAGAGAGTTAACCTCGCCGGACACGAAGAGGTTCGGGTTTCTTCTAATTTTTCACTCTACTCTCAGAAATTGACTATTACTTTTTATTTTTAAATGAATGATTTTTTTGGTTGATTTGTTGCA
本文标题:北大基础分子生物学课件11基因组与比较基因组学
链接地址:https://www.777doc.com/doc-10661505 .html