您好,欢迎访问三七文档
当前位置:首页 > 医学/心理学 > 药学 > 26-硕士研究课现代分子生物学基因基因组和基因组学-胡忠
Gene,GenomeandGenomics一、基因1.基因的研究简史孟德尔(Mendel)的颗粒因子:一个因子决定一个性状(1865年)。约翰森(Johannsen):首先提出基因一词(1909年)摩尔根(Morgan)的基因论:一个基因控制一个性状(1926年),明确了基因存在于染色体上。Beadle和Tatum:一个基因一个酶学说(1941年)。Avery肺炎双球菌转化实验:证实了遗传物质的本质是DNA(1944年)。Herhey和Chase:噬菌体大肠杆菌感染实验,只有DNA能进入大肠杆菌(1952年)。Benzer:提出一个顺反子,一条多肽链的概念(1955年)。Watson和Crick:提出DNA右手双螺旋理论(1953年)。Crick:提出中心法则(1957年)。Jacob和Monod:提出了操纵子模型(1961年)。Nirenberg:三联密码子学说将DNA结构与生物功能结合起来(1966年)。Mc-Clintock:在玉米中发现了遗传因子可以转移位置(1951年代)(1983年诺贝尔生理学奖)。Sharp等:真核生物基因中的断裂现象(1977年)。Feir等:发现噬菌体中重叠基因(1978年)。2.基因的分子定义DNA分子中含有特定遗传信息的核苷酸序列,是遗传物质的最小功能单位。合成有功能的蛋白质多肽链或RNA所必需的全部核酸序列(通常是DNA序列)。故一个基因应包含不仅是编码蛋白质肽链或RNA的核酸序列,还包括为保证转录所必需的调控序列、5′非翻译序列、内含子以及3′非翻译序列等所有的核酸序列(蛋白质基因和RNA基因)。2.0nm小沟大沟泛指一个有生命体、病毒或细胞器的全部遗传物质;在真核生物,基因组是指一套染色体(单倍体)DNA,即细胞中基因以及非基因的DNA序列的总称。二、基因组(genome)一)概念二)基因组的特点1、病毒基因组的特点1)每种病毒中只有一种核酸,或为DNA,或为RNA。2)病毒核酸大小差别很大。最小的3kb(乙肝病毒),仅编码4种蛋白质,最大的可达300kb以上(痘病毒),有几百个基因。一般DNA病毒较大,RNA病毒较小。3)大部分病毒核酸是单倍体(除反转录)。4)病毒基因组中也具有操纵子结构。如ФX174从PD启动子开始转录生成的mRNA包含D,(E),J,F,G和H结构基因。5.噬菌体基因组中无内含子,但感染真核细胞的病毒基因组中具有内含子(SV40早期基因T和t)6.有基因重叠(同ORF重叠、异ORF重叠和反ORF重叠)。7.大部分DNA用于编码蛋白质,只有一小部分是不翻译的。不翻译区通常是基因表达的调控序列。8.调控序列可以被宿主细胞所识别,其遗传密码和基因组的结构必须与宿主体系相匹配。HBV基因结构2、细菌的基因组及特点1)组成:细菌染色体和质粒2)细菌基因组的特征(1)基因组相对较小(E.coli4.6×106bp,4000个基因),只有一个复制启始位点。(2)具有操纵子结构:功能上相关的几个基因往往在一起组成操纵子结构,即几个结构基因串联在一起,受它们上游的共同调控区控制。当基因开放时,这几个基因转录在一条mRNA链上,然后分别翻译合成各自的蛋白肽链。操纵子的末端具有特殊的终止序列。(3)基因是连续的:结构基因中没有内含子(intron)成分,在转录后不需剪接加工,转录产物的寿命较短。细菌乳糖操纵子LacZ(z):β-半乳糖苷酶LacY(y):半乳糖苷渗透酶LacA(a):半乳糖苷转酰酶LacO(o):操纵基因LacP(p):启动基因(4)大部分DNA是用于编码蛋白质的,只有一小部分是不翻译的。不翻译区中含有间隔区(Spacer)和基因表达的调控序列。(5)基因组中仅有少数基因存在基因重叠现象。(6)结构基因是单拷贝,rRNA基因是多拷贝。3)质粒(plasmid)(1)概念:是细菌染色体以外的遗传物质,是环状闭合的双链DNA。(2)分类A、按复制机理分:严紧控制型质粒,松弛控制型质粒B、按功能分:F质粒、R质粒、Col(colicin)质粒(可产生大肠杆菌素)、Ent质粒(可产生肠毒素)。C、按性状分:结合性质粒,非结合性质粒(3)质粒的一般性质A、多为DNA分子,但酵母杀伤质粒为RNAB、质粒并非细菌生存所必不可少的遗传物质,可以在细菌间转移与丢失。C、质粒的传递(转移)是细菌遗传物质转移的一个重要方式。但分子量107的质粒一般无自我转移能力,而分子量2.5×107的质粒可从供体细胞转移一个副本给受体细胞,如F质粒6.2×107,R质粒2.5×107)D、质粒可自行失去或经人工处理而消失(称为消除)。E、质粒复制依赖宿主细胞的复制机器,但可以独立复制。F、可有几种质粒同时共存在于一个细菌内,但同群质粒有不相容性(同群质粒具有同源性,可以产生相同的阻遏蛋白,故彼此间有相互抑制作用,不能共存于同一细胞)。4)示例:流感嗜血杆菌(Haemophilusinfluenzae)采用鸟枪法(shotgun)策略将基因组DNA打成2kb左右的小片段分别克隆,用了19687个模板,进行了28643个测序反应,组建了140个片段重叠群,仅用了3~4个月的时间完成全部的测序工作,于1995年7月第一个细菌基因组全序列发表,大小为1.8Mb。含1703个基因或开放阅读框架(ORF)。从其DAN全序列中鉴定出76个基因,其中32个(与其它病原菌同源)均表达细胞表面蛋白。这是微生物以至整个生物学领域的一个里程碑(FleischmannR,etal.,Science,1995,269:496).AbstractScience,Vol269,Issue5223,496-512Whole-genomerandomsequencingandassemblyofHaemophilusinfluenzaeRdRDFleischmann,MDAdams,OWhite,RAClayton,EFKirkness,ARKerlavage,CJBult,JFTomb,BADougherty,JMMerrick,andal.etJohnsHopkinsUniversitySchoolofMedicine,Baltimore,MD21205,USA.AnapproachforgenomeanalysisbasedonsequencingandassemblyofunselectedpiecesofDNAfromthewholechromosomehasbeenappliedtoobtainthecompletenucleotidesequence(1,830,137basepairs)ofthegenomefromthebacteriumHaemophilusinfluenzaeRd.Thisapproacheliminatestheneedforinitialmappingeffortsandisthereforeapplicabletothevastarrayofmicrobialspeciesforwhichgenomemapsareunavailable.TheH.influenzaeRdgenomesequence(GenomeSequenceDataBaseaccessionnumberL42023)representstheonlycompletegenomesequencefromafree-livingorganism.●大肠杆菌的基因组●特点●其基因组大小为4.7×106bp,基因数为4100个,它是1997年由Wisconsin大学的Blattner等人完成,目前62%的基因功能已阐明,38%的基因功能尚不清楚。1)遗传信息具有连续性;2)功能相关的结构基因组成操纵子结构;4)基因组的重复序列少而短。3)结构基因的单拷贝及rRNA的多拷贝;3、真核生物基因组的特点1)基因组含有更大的DNA分子,以染色体形式储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的。但应注意:(1)并非生物越高等,基因组越大。即并非进化的复杂程度与DNA含量成正比。如某些植物和两栖类的DNA含量是人的几十乃至上百倍(如小鼠基因组大小为250Mb,猪基因组大小为270Mb,人类基因组为285Mb,而水稻基因组为389Mb)(2)同一类复杂性差不多,形态也相似的生物,理论上其基因组也应比较接近,其实不然。如同是两栖类可相差十倍以上。(3)基因组中DNA的量远大于编码蛋白质所需要的量。2)基因组结构复杂,有多个复制启始位点,但每个复制子的长度较小。3)基因是不连续的。4)转录单位一般是单顺反子的。即一个基因一种mRNA一种蛋白质,但蛋白质的最终产物可因剪接方式的不同而有差异(如Bcl-x:Bcl-x1Bcl-xs)5)存在重复序列(1)高度重复序列(105次)。A、卫星DNA:根据长度可将其分为3类★卫星(satellite)DNA:重复长度几百个bp,其在人群中多态性不强。★小卫星DNA:重复长度15-70bp,其在人群中有高度的特异性。★微卫星DNA(简单串联重复序列):重复长度2-5bp,其在人群中存在个体间的高度变化,是DNA指纹的形成基础。B、倒位(反向)重复序列又称临时复性部分,重复单位约长300bp,两个单位之间有一平均1.6kb的片段相隔,多数散布于基因组中。C、较复杂的重复单位组成的重复顺序灵长类所独有,用HindⅢ消化非洲绿猴DNA,可以得到重复单位为172bp的高度重复顺序,这种顺序大部份由交替变化的嘌呤和嘧啶组成,又称为α卫星DNA。D、高度重复顺序的功能a.参与复制水平的调节。b.参与基因表达的调控c.参与转位作用d.与进化有关e.DNA指纹f.α卫星DNA成簇的分布在染色体着丝粒附近,可能与染色体减数分裂时染色体配对有关(2)中度重复序列(105次)。100-几千bp片段的重复,其产物是细胞大量需要的。★rRNA基因:可重复数百次,可作为一种遗传标志。★tRNA基因★组蛋白基因★Alu家族:有3万个成员,平均每6kb就有一个,长度约300bp,因在170bp处有一AluⅠ位点(AG/CT)而得名。Alu顺序具有种的特异性,功能:目前尚不清楚,可能在hnRNA(heterogeneousnuclearRNA)转录和加工中起作用,也可能与遗传重组及染色体不稳定性有关。★KpnⅠ家族:人类和灵长类DNA经KpnⅠ酶解后,产生4个片段(1.2、1.5、1.8、1.9kb),这些就被命名为KpnⅠ家族。人类基因组中的KpnⅠ序列约在3-6%,也是散在分布的。功能尚不清楚。(3)单一序列(uniquesequence)单拷贝顺序在基因组中占50-80%,如人基因组中,大约有60-65%的顺序属于这一类。6)存在多基因家族和超基因家族(1)多基因家族(multigenefamily):亦称基因家族。是指一组具有类似功能,核苷酸序列又有同源性的基因。★分类:▲按基因的终产物分为两类:一类编码RNA,另一类编码蛋白质。▲按在基因组中的分布分为两类:一类串联排列在一起,形成基因簇,亦称串联重复基因。另一类家族成员则可以分散在不同的部位上。(2)超基因家族(supergenefamily):由多基因家族及单基因组成的更大的基因家族。成员间有不同程度的同源,但它们的功能并不相似,这是与多基因家族的差别所在。如Ig超家族。免疫球蛋白超家族7)基因类型多样(1)假基因(Ψ):在多基因家族中,不产生有功能基因产物的基因。即序列与有功能的基因相似,但或者不能转录,或者转录后生成无功能的基因产物。原因:可能基因在进化过程中,发生突变所致(如缺失、倒位、点突变等)。假基因往往缺少正常基因的内含子,两侧有顺向重复序列。(2)分(断)裂基因(不连续基因):编码序列称外显子(extron),非编码序列称内含子(intron,orinterveningsequence)。(3)非剪接基因(连续基因):原核和真核细胞都有。真核rRNA基因也是非剪接基因。(4)跳动(跃)基因(可转移的DNA成分
本文标题:26-硕士研究课现代分子生物学基因基因组和基因组学-胡忠
链接地址:https://www.777doc.com/doc-2913747 .html