您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 分子生物学 第2章 基因与基因组
第二章原核与真核生物的基因组教学目的和要求1.掌握基因、基因组、断裂基因、基因家族、内含子、外显子等基本概念。2.掌握原核生物与真核生物基因组的结构特点。3.理解基因组复杂度。主要内容第1节基因与基因组第2节病毒基因组第3节原核生物基因组第4节真核生物基因组第1节基因与基因组一、核酸的特性二、基因的概念三、基因的命名四、基因组一、核酸的特性紫外吸收减色效应/增色效应核酸定量DNA纯度热变性复性UVabsorption紫外吸收•芳香族碱基•DNA和RNA的最大吸收峰为260nm•应用:检测,定量,纯度估计减色效应/增色效应减色效应:因碱基在疏水环境中的堆积,使碱基对紫外的吸收能力下降。dsDNAssDNA/RNA,nucleotide(核苷酸)核酸定量消光系数:1mg/mldsDNAhasanA260of20(OD1=50ug/ml)ssDNAandRNA=25(OD1=40ug/ml)DNA(RNA)浓度(ug/ml)=OD260×50ug/ml(40ug/ml)×稀释倍数A260值是所有不同碱基对光吸收的总和。由于减色效应,光吸收值也取决给定分子的二级结构的数量DNA纯度A260/A280:puredsDNA--1.8pureRNA--2.0protein--0.5Tm:变性过程紫外线吸收值增加到中点时的温度称为融解温度。影响因素:G+C含量,pH值,离子强度,尿素,甲酰胺等DNA:Tm=69.3+0.41(G+C)%6.Renaturation复性:退火处理(慢速冷却)使得互补链互相配对,恢复双链结构为DNA复性Hybridization(杂交):不同核酸链之间的互补部分的复性。基因(gene):原核生物、真核生物以及病毒的DNA和RNA分子中具有遗传效应的核苷酸序列,是遗传的基本单位。二、基因的概念在细菌中:指编码一个蛋白质或RNA的遗传功能单位;在真核细胞中:指编码一个或多个产物的,或对某一个产物产生有贡献的一个转录单位。1、基因与DNA基因是DNA分子上的功能单位:遗传单位、交换单位、突变单位一个基因=一个顺反子=突变单位+重组单位顺反子:一段核苷酸序列,能编码一条完整多肽链(具有生物学活性)。基因的DNA共性:从细菌到哺乳动物的全部生命有机体的基因都是由DNA构成的。在分子水平上,所有生物DNA基本结构都一致,称为共性。但是,它们的DNA序列上的不同形成了千差万别的生物界。因此,来自两种生命形态的基因(DNA)可以相互融合重组。2、基因与多肽链基因的主要编码产物是多肽链,另外还包括许多编码RNA的基因,如:rRNA基因、tRNA基因以及其它小分子RNA基因等。一种基因一种酶(1941)基因的碱基序列与蛋白质分子中氨基酸的序列之间的对应关系是通过遗传密码实现的。3、基因的结构编码区(codingregions),开放阅读框(openreadingframe,ORF):可以翻译成蛋白质的DNA区域。在细菌中即为一个基因;在真核细胞中,编码区可被内含子隔断。非编码区(internalnoncodingregions),非翻译区(untranslatedregions,UTRs):转录单位中不能翻译成蛋白质的部分。在编码区或操纵子两侧的UTRs为5’和3’UTRs(或称为前导和尾随序列)。操纵子(operator):包含几个基因及其共同调控元件的细菌基因座。基因座(locus):一个基因在染色体、物理图、遗传图上的位置,包括两侧的调控元件。基因座本义指任何标记物的位置,包括基因、调控元件、复制起始区、细胞遗传学中的标记等。NCNCNC5’5’3’3’转录翻译5’UTR3’UTRUTRUTRgene1gene3gene2原核细胞编码蛋白质基因的典型结构•在细菌中,同一转录单位包含多个基因,每一个基因编码一条独立的多肽链。RNADNA翻译翻译protein真核细胞编码蛋白质基因的典型结构•在真核生物中,转录单位由单个基因组成。成熟的转录物编码单个多肽链,但不同的剪接方式可产生一系列不同的产物。NC5’3’转录5’UTR3’UTRintronintronexon1exon3exon2前体RNADNA翻译protein编码区域5’3’mRNARNA加工(剪接、转运)7meGAAAAAAAAAAAATheprocessingofa45SrRNAprecursormoleculeintothreeseparateribosomalRNAs.NearlyhalfofthenucleotidesequencesintheprimaryRNAtranscriptaredegradedinthenucleus.外显子(exon):基因中编码的序列,转录单位余下部分通过剪接结合起来并表达的区域,是基因中对应于mRNA序列的区域。内含子(intron):基因中不编码的、打断转录单位的间插序列,必需在RNA水平上去除。物种命名方式举例E.coli和其它细菌三个斜体小写字母表示一个操纵子,接着斜体大写字母表示不同的基因座。lac-乳糖操纵子:基因座-lacZ、lacY、lacA;表达产物蛋白质-lacZ、lacY、lacA质粒和其它染色体外的成分自然产生的质粒:用三个正字母表示,首字母大写重组质粒:在大写字母前加一个p(大写字母表示构建质粒的研究者或单位)ColEIpSC101(SC:StanleyCohen)酵母用三个大写斜体字母表示基因功能,后面数字表示不同的基因座啤酒酵母基因:GAL4、CDC28脊椎动物以描述基因功能的1-4个小写字母和数字表示其基因功能基因:sey、myc;蛋白质:Sey、Myc人方法同脊椎动物,但需要大写基因:MYC、ENO1;蛋白质:MYC、ENO1三、基因的命名四、基因组1.基因组的概念是指一种生物体中的整套遗传信息,一般为一个受精卵或一个体细胞的细胞核中所有DNA分子的总和。一特定生物体的整套(单倍体)遗传物质的总和。基因组的大小用全部DNA的碱基对总数表示。每种真核生物的单倍体基因组中的全部DNA量称为C值(C-Value)。三、基因组2.基因、核酸片段大小表示法:单链核酸:碱基数nucleotide,nt双链核酸:碱基对basepair,bp千碱基对kilobasepair,Kb兆碱基对megabasepair,Mb1Mb=1000Kb=1000000bp例如:乙肝病毒基因组DNA有3200bp或3.2Kb。痘病毒基因组DNA有300Kb。•生物界C值大小规律:••病毒细菌真菌动植物••进化程度递增,C值递增•3.基因组大小与C值矛盾随着生物的进化,生物体的结构和功能越来越复杂,其C值就越大。283-2102cm1.229•然而另一方面,随着进一步的进化,生物体复杂性和DNA含量之间的关系变模糊了,出现了很多令人不解的现象。一些生物类群基因组大小的变化范围很窄,而另一些类群的变化范围则很宽。•突出的例子是两栖动物,C值小的可以低至109bp以下,C值大的可以高达1011bp。而哺乳动物的C值均为109bp的数量级。人们很难相信不同的两栖动物,所需基因的数量会有100倍的差别,而且两栖动物的结构和功能会比哺乳动物更复杂。3.基因组大小与C值矛盾•由于人们无法用已知功能来解释基因组的DNA含量,所以产生了C值矛盾(Cvalueparadox,又称C值悖理)。••C值矛盾(Cvalueparadox,C值悖论):生物体的进化程度与基因组大小(C值)之间不完全成比例的现象。3.基因组大小与C值矛盾病毒是由一个或几个核酸分子组成的基因组,有一层蛋白或脂蛋白保护性外壳,且可在一定宿主细胞中自我复制的感染性因子。第2节病毒基因组一、病毒基因组的类型双链DNA病毒——乙肝病毒单链DNA病毒——微小病毒双链RNA病毒——动物呼肠孤病毒单链(+或-)RNA病毒——逆转录病毒DNA病毒RNA病毒遗传物质:DNA或RNA,单倍体(反转录病毒除外);基因组很小,但相差较大;基因重叠;编码效率高、非编码区小;基因往往丛集形成一个功能单位或转录单元;噬菌体的基因是连续的。二、病毒基因组的基本特点重叠基因(overlappinggene):两个基因的核苷酸序列完全重叠或部分重叠的情况,即一段核苷酸片段被两个基因重复使用的现象。34①部分重叠K和C②两个基因共用少数碱基对如:A*和CD和J-------ATGA-------CStartcodon-------TAATG-------A*StopcodonDStopcodonJStartcodon一、原核生物基因组的特点拟核(类核)结构;基因组相对较小,由DNA组成,包括染色体DNA和质粒DNA两种DNA分子,均为共价闭环双链。染色体DNA为单拷贝存在多顺反子结构;功能相关的基因常常组织形成操纵子结构,操纵子结构是原核基因组的一个突出的结构特点。除RNA基因外,基本是单拷贝的;利于核糖体的快速组装,短时间内合成大量核糖体。结构基因通常为连续基因,非编码区和重复序列少;存在不同的功能识别区,每个DNA分子(染色体DNA和质粒DNA)只有一个复制起始点。复制起始区、复制终止区等含可转移的序列,如插入序列、转座子等。第3节原核生物基因组Bacterialchromosome细菌染色体NucleoidNegativelysupercoiled(负超螺旋)asawhole核中央由支架蛋白和RNA组成,环状双链DNA绕在支架蛋白的外围,只有一个复制起点,DNA与细胞膜粘在一起,DNA上有结合蛋白。原核生物基因组一、真核生物基因组特点:真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,体细胞是双倍体(diploid),即有两份同源的基因组。真核细胞基因转录产物为单顺反子。存在重复序列,重复次数可达百万次以上。基因组中不编码的区域多于编码区域。大部分基因含有内含子,因此,基因是不连续的。基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。第4节真核生物基因组二、基因组的复杂度GenomicDNAextractionSonicationorshearingtoauniformsize(x100-1000bp)ThermalDenaturationRe-annealingMeasure&plottingthere-annealingprocesswillyieldkinetics1.复性动力学曲线Measuringmethods:Spectroscopy/UVabsorptionhydroxyapatite(羟[基]磷灰石)chromotographyD4GenomeComplexityHighlyrepetitiveDNAmoderatelyrepetitiveDNAuniqueDNAHumanE.coli二、基因组的复杂度1)据基因组重复次数高低:重复序列UniquesequenceDNA单一序列DNA1~101moderatelyrepetitiveDNA中度重复序列10~105HighlyrepetitiveDNA高度重复序列106UniquesequenceDNA单一序列DNA复性最慢在基因组中有一个或几个拷贝。真核生物的大多数基因在单倍体中都是单拷贝的。如:蛋清蛋白、血红蛋白等)单一序列中储存了巨大的遗传信息,编码各种不同功能的蛋白质。moderatelyrepetitiveDNA中度重复序列中度重复序列是指在基因组中重复十几次至几十万次的部分,其复性速度快于单拷贝序列,但慢于高度重复序列。中度重复序列在基因组中所占比例在不同种属之间差异很大,一般为12~35%,人类基因组中约占12%。moderatelyrepetitiveDNA中度重复序列Tandemgeneclusters(串联基因簇):通常是其基因产物需求量很高的基因,如rRNA基因、组蛋白基因、免疫球蛋白基因、tRNA基因等,这些结构基因常常以串联形式排列在基因组中,故也属于串联重复序列各种
本文标题:分子生物学 第2章 基因与基因组
链接地址:https://www.777doc.com/doc-3446948 .html