您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第三章-基因组和基因-2
第三章基因和基因组主要内容第一节基因的概念、演变与发展第二节基因概念的多样性——重叠基因第三节基因概念的多样性——重复基因第四节基因概念的多样性——间隔基因第五节基因概念的多样性——跳跃基因第六节基因家族小结基因可控制生物的性状基因位于染色体上基因的物质基础是DNA(或RNA)基因是通过指导合成蛋白质或RNA来决定性状的基因有结构基因和调节基因之分重叠基因;重复序列(非、轻、中、高);卫星DNA;不连续基因;外显子;内含子;RNA剪接;GT-AG法则。第五节基因概念的多样性——跳跃基因跳跃基因:JumpingGenes(Transposons)存在于染色体DNA上可自主转移座位的基本单位,可在同一染色体内或不同染色体之间移动Transposonsinmaize40年代初,McClintock研究玉米花斑糊粉层和植株色素产生的遗传基础时发现转座因子第六节基因家族一、概念二、分类三、rRNA基因家族四、5SrRNA基因的重复单元五、tRNA基因家族六、组蛋白基因家族七、珠蛋白基因家族一、概念•真核生物基因组中有许多来源相同、结构相似、功能相关的一系列基因,成串地排列在一起。这样一组基因称为基因家族(genefamily)。二、分类1、简单多基因家族2、复杂多基因家族3、发育调控的复杂多基因家族1、简单多基因家族•家族中只有一个或数个基因以串联方式重复排列,如rRNA基因。2、复杂多基因家族•由几个相关基因家族构成,基因家族之间由间隔序列隔开,并作为独立的转录单位。•海胆和果蝇的组蛋白基因及果蝇tRNA基因。3、发育调控的复杂多基因家族•在不同组织、细胞类型、时间表达的复杂多基因家族。•珠蛋白和免疫球蛋白基因,属于不同时态表达的复杂多基因家族。ζψζψαψαα2α1θεGγAγψβδβ图10-30人类血红蛋白的α和β基因簇三、rRNA基因家族•高等真核生物有4种rRNA,即28S、18S、5.8S和5SrRNA。•前三种为主体rRNA,它们的基因构成重复单元,5SrRNA基因是独立的串联重复基因。rDNAgenefamilyTS:可转录的间隔序列NTS:不转录的间隔序列NTSNTSTS18sTS5.8sTS28sTS图10.29非洲爪蟾rRNA基因的串联重复排列TS:可转录的间隔(spacer)顺序NTS:不可转录的间隔顺序NTSNTS海胆450copies烟草750copies果蝇100copies真核生物rDNA重复单元的结构各种真核生物rDNA重复单元的排列四、5SrRNA基因的重复单元•5SrRNA由保守的120bp组成,单独成为复制单元。每个转录单元由5S基因和非转录区组成。•真核生物中有多拷贝的5SrRNA基因,非洲爪蟾约有2万个5S基因拷贝,人类有2000个拷贝。富AT5S基因120bp假基因101bp富GC区49bp400bp15bp富含AT区(400bp):大多是GAAAGTTTGAGTTTT共15bp的重复序列五、tRNA基因家族•tRNA长70-90bp,拷贝数为10至数百。人类约有1300个tRNA基因族。•几种不同的tRNA基因串联重复,基因之间的间隔区较大。果蝇、非洲爪蟾、大鼠tRNA基因六、组蛋白基因家族•组蛋白有H1、H2A、H2B、H3、H4共5种基因。这5种基因串联在一起形成一个重复单元。•5种基因的排列顺序、转录方向和基因间隔区因生物种类不同而不同。组蛋白基因家族各种生物的组蛋白基因家族的重复单元H1H4H2BH3H2A海胆(R)6000bp海胆(S)6540bp海胆(L)7240bpH1H3H4H2AH2B果蝇4800bpH1H3H2BH2AH4蝾螈9000bp图10-31组蛋白基因簇的重复单位图例:基因;间隔区;转录方向组蛋白基因家族中重复单元数目•组蛋白基因家族中重复单元的数目依生物而异。鸡:10个;哺乳动物:20个;非洲爪蟾:40个;果蝇:100个;海胆:300-600个;人:30-40个,位于7号染色体的长臂区。组蛋白的特点•组蛋白基因缺乏内含子。•间隔序列不是内含子。七、珠蛋白基因家族•血红蛋白分子是珠蛋白的四聚体,由2个α型亚基和2个β型亚基组成,即α2β2。•α型亚基的基因位于第16号染色体上,β型亚基的基因位于第11号染色体上。•α家族包括1个活性的ξ基因、1个ψξ假基因、2个α基因和2个ψα假基因,集中在28kbp的区域内。•β家族包括ε、2个γ、δ和β基因,以及1个ψβ1假基因,分布在50kbp的区域内。人类发育阶段中血红蛋白组成的变化发育阶段血红蛋白组成胚胎期(8周前)ξ2ε2、ξ2γ2、α2ε2胎儿期α2γ2成年期α2δ2(2%)、α2β2(97%)、α2γ2(1%)各亚基表达顺序•α亚基的表达时间顺序是:ξα•β型亚基的表达时间顺序是:εγδβζψζψαψαα2α1θεGγAγψβδβ图10-30人类血红蛋白的α和β基因簇八、假基因(pseudogene)•是基因组中因突变而失活的基因,它和同一家族的活跃基因在结构上和DNA序列上有相似性,但它不具有功能,不能转录或翻译成成熟的mRNA或蛋白质,或产生过早终止的无活性的肽链,或由于错误的阅读框架形成无活性的蛋白质,这种序列称为假基因。举例•最早发现假基因是在非洲爪蟾的5SrRNA基因中。•5SrRNA基因中有活性的编码序列为120bp,有101bp序列与5SrRNA基因相同,但少了19bp,不能转录,成为无活性的基因。•DNA序列分析表明,缺乏正常转录的起始信号。富AT假基因5S基因珠蛋白基因中的假基因•α家族中含有ψξ、ψα1和ψα2•β家族中含有ψβ1假基因的ψβ1结构特点•缺乏内含子剪接加工的5‘共同序列;•polyA的信号由AATAAA突变成AATGAA;•正常的起始密码ATG被GTG所取代;•从第38氨基酸开始有20个核苷酸的缺失,造成一个终止密码,使肽链提前终止。第七节基因组与C值矛盾主要内容第八节原核生物基因组第九节真核生物基因组第十节人类基因组计划第三章基因和基因组第七节基因组与C值矛盾一、基因组(Genome)二、C值三、C值矛盾一、基因组(genome)一个生物物种所有染色体的总和(细胞遗传学)所有核酸分子的总和(分子遗传学)所有基因的总和(经典遗传学)指导一个物种的结构与功能的所有遗传信息的总和(现代分子生物学理论)二、C值(Cvalue)•一个单倍体基因组的DNA含量。•单位为dolton或uug或bp•1uug=1pg=6.1×1011dolton•对每一个物种,C值是恒定的。几种生物的C值河豚、线虫霉菌藻类G+细菌G-细菌显花植物鸟类哺乳类爬行类两栖类硬骨鱼类软骨鱼类赖皮类甲壳类昆虫类软体动物蠕虫类真菌枝原体三、C值矛盾(Cvalueparadox)•随着生物的进化,生物体的结构与功能越复杂,其C值也越大。•但真核生物中DNA含量并不与生物的复杂性相一致,这种反常现象称为C值矛盾。C值矛盾表现在:1、结构、功能相似的同一类生物中,甚至亲缘关系十分接近的物种之间,它们的C值可相差10倍乃至上千倍。如:豌豆的C值为14pg,而蚕豆只有2pg。两栖类C值的变动范围很大,为109-1011bp。被子植物间C值相差1000倍原生动物间C值相差5800倍鱼类间C值相差350倍节肢动物间C值相差250倍2、较低等生物的C值大于较高等生物的C值如:两栖动物(1011bp)>哺乳动物(109bp)不同生物的C值生物DNA(2n)pg数量级两栖动物16.86109-1011bp肺鱼100蝾螈85.3绿蝾螈72.0井蛙20.0金线蛙16.8牛6.43×109bp人6.43、真核生物的C值之大,远远超过其基因编码所需•将内含子算上,哺乳动物的一个基因长约5-8Kb,少数10Kb,则哺乳动物应有40-60万个基因。•目前研究表明,实际基因数估计不会超过这个数值的10%(3-4万)。•有些基因的序列不编码蛋白质,则基因组中只含有1%-2%的DNA序列用于编码蛋白质。•余下那么多DNA序列具何功能?•难道不被表达的DNA序列都是调控基因吗?•目前还无法圆满解释。基因和基因相关序列假基因基因外DNA重复DNA第八节原核生物基因组一、原核生物基因组的特点二、大肠杆菌的基因组三、噬菌体的基因组四、原核生物的重叠基因一、原核生物基因组的特点1、不具备明显的核结构,只有类核,即DNA相对集中的区域。2、基因组小,一般只有一个染色体,大多为双链环状,少数为单链或线型。E.coliDNA长4.2×106bp,含3000-4000个基因;噬菌体DNA分子长48502bp,含46个基因;ΦX174DNA分子长5386bp,含有11个基因;SV40病毒DNA分子量为3×106bp,含5个基因。3、染色体DNA并不与蛋白质固定地结合,不具核小体结构。4、结构简练,重复序列和非编码序列很少,体现经济原则。如:ΦX174中非编码序列占217/5386;T4-DNA中占282/5577,均不到5%。5、功能密切相关的基因构成转录单元,并常转录成含多基因信息的mRNA分子,称为多顺反子mRNA。6、有重叠基因:同一段DNA片段可以编码2—3种蛋白质分子。二、大肠杆菌的基因组大肠杆菌(E.coli,Escherichiacoli)大肠杆菌模式图大肠杆菌基因组的特点•大肠杆菌无明显的核结构,其DNA相对地集中于类核区。对数生长期的细胞具有2-4个类核。•E.coliDNA长度为4.2×106bp,每个基因平均长度为1000bp,整个基因组有3000-4000个基因,目前已经定位的基因有1400多个。E.coli基因组DNA大肠杆菌基因组的特点•功能上相关的基因串联在一起组成操纵子结构,由一个启动子转录调控。•E.coli有260多个基因具有操纵子结构。•E.coli的lac操纵子、Trp操纵子和His操纵子分别有3个、5个和9个相关酶蛋白串联在一起。大肠杆菌基因组的特点•E.coli基因组中,几乎所有的基因都是单拷贝的。•基因组中几乎全都是由结构基因组成,很少有非必需的DNA。三、噬菌体的基因组•噬菌体基因组研究得最好的有ΦX174、λ、T4等。•我们以ΦX174为例。ΦX174的结构特点1、DNA为单链环状,共5386bp。2、共有11个基因,依次为A,A',B,K,C,D,E,J,F,G和H。3、由于ΦX174的DNA数量有限,因而在基因排列上更加体现经济原则A、3个转录启动子PA、PB和PD,分别从基因A、B、D开始转录。基因H和A之间有一强终止子信号,所有的转录都将终止。在基因J和F之间有一弱终止子信号,部分转录终止。B、其DNA分子绝大部分用于编码蛋白质,不翻译部分只占4%(217/5386)。C、有重叠基因和基因内基因。B基因在A基因之中,E基因在D基因之中。λ噬菌体的结构特点•双链DNA噬菌体。•基因组有48502bp,共有46个基因。•整个区域分为5个区域:头部基因、尾部基因、调控区、复制区和晚期调控区。•λ有线状分子和环状分子。•线状分子两端各有12个核苷酸的粘性末端,通过粘性末端配对,线性分子在生活周期的一定阶段可转变为环状分子。λ噬菌体染色体DNA第九节真核生物基因组真核生物基因组的特点1、结构复杂、基因数庞大。低等真核生物107—108bp高等真核生物5×108—1010bp有些植物和两栖类1011bp人109bp真核生物基因组的特点2、有若干个染色体,一般不呈环状,DNA与蛋白质紧密结合形成染色体,具多个复制起始点。真核生物染色体结构的通用模式端粒真核生物基因组的特点3、存在核膜,DNA的转录和翻译存在时空差异。真核生物基因组的特点4、有很多不编码序列(内含子,内元)。5、有大量的重复序列。6、功能上密切相关的基因集中程度不如原核生物高,大多分散在不同的染色体上,但有许多基因家族和假基因存在。7、有细胞器基因,如chlDNA,mitDNA,其密码子有特异性。真核生物基因组的特点Question一、名词解释基因组、基因、C值、C值矛盾、基因簇、基因家族、假基因、卫星DNA、结构基
本文标题:第三章-基因组和基因-2
链接地址:https://www.777doc.com/doc-1817874 .html