您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > 第4章-基因组、转录组和蛋白组
基因组、转录组和蛋白质组Genomes,TranscriptomesandProteomes结构基因组学、功能基因组学、比较基因组学概念•基因组–是指一个单倍体细胞中遗传物质得总量。染色体或基因•转录组–一个细胞全部的mRNA含量,是一个细胞在某一阶段必须的生物信息,这些RNA分子会指导合成基因组表达的最终产物,蛋白质组。•蛋白质组–一个细胞合成的功能蛋白质的总和。•蛋白质组学–是人类基因组计划研究发展的基础上形成的交叉学科,主要是从整体水平研究细胞内蛋白质的组成,结构及其自身特有的活动规律蛋白质组研究的意义•基因虽是遗传信息的源头,而功能性蛋白是基因功能的执行体•蛋白质本身的存在形式和活动规律,如翻译后修饰、蛋白质间相互作用以及蛋白质结构等问题,必须要依赖于对蛋白质组学的研究来解决。•任何一种疾病在表现出可察觉的症状之前,就已经有一些蛋白质发生了变化。因此寻找各种疾病的关键蛋白和标志蛋白,对于疾病的诊断、病理的研究和药物的筛选都具有重要意义。•肿瘤组织与正常组织之间蛋白质谱差异,找到肿瘤特异性的蛋白分子,可能会对揭示肿瘤发生的机制有帮助,目前已应用于肝癌、膀胱癌、前列腺癌等研究中。•开发新蛋白质、获得新基因Figure3.1.Thegenome,transcriptomeandproteome.•基因组的表达不仅仅是一个遗传信息由DNA-RNA-蛋白质的一个过程,这个法则忽略了信息流由基因组到蛋白质组传递过程是被调控的,这个过程每一步都是受到调控,从而使得转录组和蛋白组的成分能够做出迅速和准确的改变,并能使细胞调整自己的生化状态能对外界的刺激做出反应,转录组Transcriptomes•转录组是特定细胞在某一功能状态下所能转录出来的所有RNA的总和,包括mRNA和非编码RNA。•蛋白质是行使细胞功能的主要承担者,蛋白质组是细胞功能和状态的最直接描述,而由于目前蛋白质实验技术的限制,转录组成为研究基因表达的主要手段。转录组是连接基因组遗传信息与生物功能的蛋白质组的必然纽带,转录水平的调控是目前研究最多的,也是生物体最重要的调控方式。编码和非编码RNA•细胞的RNA含量可以分为两类–编码RNA–非编码RNA编码和非编码RNA–编码RNA•mRNA•4%•寿命短–细菌的mRNA半衰期几分钟,–真核细胞大部分mRNA的半衰期也只有几小时–转录组的成分不是固定的,可以通过快速的改变mRNA的合成来改变编码和非编码RNA•非编码RNA–rRNA–tRNA–真核生物特有的RNA•小核RNA(SmallnuclearRNA)(snRNA;也叫U-RNA)参与前体mRNA的剪接•小核仁RNA(SmallnucleolarRNA)(snoRNA),参与rRNA前体的加工以及核糖体亚基的装配。•小胞质RNA(scRNA),包括几种,有些功能已知,有些功能还未知小核RNA(snRNA,核内小RNA)•存在于真核细胞的细胞核内,为小分子核糖核酸,长度为106-189个核苷酸。•作用:参与hnRNA的剪接和转运。•hnRNA:核内不均一RNA,是成熟mRNA的前体。Figure3.3.TheRNAcontentofacell.ThisschemeshowsthetypesofRNApresentinallorganisms(eukaryotes,bacteriaandarchaea)andthosecategoriesfoundonlyineukaryoticorbacterialcells.Thenon-codingRNAsofarchaeahavenotyetbeenfullycharacterizedanditisnotclearwhichtypesarepresentinadditiontorRNAandtRNA.Forabbreviations,seethetext.1.无参考基因组的大规模功能基因的发掘(denovotranscriptomeanalysis);2.非编码区域功能研究:Non-codingRNA研究、microRNA前体研究等3.转录本结构研究,包括UTR(UntranslatedRegions即非翻译区)鉴定、Intron边界鉴定、可变剪切研究,融合基因鉴定等4.基因转录水平研究5.全新转录区域研究转录组研究的应用领域转录组检测的方法(一)构建cDNA文库并测序(二)基因表达序列分析技术Serialanalysisofgeneexpression(SAGE)(三)利用DNAchip可以比较不同的转录组(四)大规模平行信号测序系统MPSS(massivelyparallelsignaturesequencing,MPSS)。(一)cDNA文库(cDNAlibrary)的构建•cDNA:以RNA为模板,在反转录酶的作用下合成的DNA•cDNA基因文库:从一定生长阶段或条件的某种细胞分离到的全部mRNA经反转录成cDNA后再重组和增殖形成的基因文库。cDNA文库的特点1.细胞特异性来自结构基因,仅代表正在表达的基因的遗传信息:1—5%mRNA,80—85%rRNA,10—15%tRNA2.组织、器官特异性不同器官或组织的功能不一样4.可了解基因的表达丰度在同一个cDNA文库中,不同类型的cDNA分子的数目是大不相同的,尽管它们都是由单拷贝基因转录而来的。这与基因组文库中的单拷贝基因均具有相同的克隆数相较,这是两种文库的另一差别。3.代谢或发育特异性处于不同代谢阶段(或发育阶段)的结构基因表达亦不相同cDNA文库的优点•cDNA不存在间隔序列cDNA文库的缺点•要测序所有的cDNA克隆,费时费力•每一个cDNA克隆都只含有一种mRNA序列•cDNA基因文库是分离基因的重要手段(二)基因表达序列分析技术Serialanalysisofgeneexpression(SAGE)•表达的基因和表达丰度•Sage技术的主要理论依据–一个短得寡核苷酸序列(12bp)含有鉴定一个转录物特异性的足够信息,可以作为区别转录物的标签(tag)4–这些标签串联在一起,形成大量多联体(concatemer),对每个克隆到的多联体进行测序并应用SAGE软件分析,可确定表达的基因的种类和丰度12Figure7.22.SAGE.Seethetextfordetails.Inthisexample,thefirstrestrictionenzymetobeusedisAluI,whichrecognizesthe4-bptargetsite5-AGCT-3(seeTable4.3).TheoligonucleotidethatisligatedtothecDNAcontainstherecognitionsequenceforBsmFI,whichcuts1014nucleotidesdownstream,andsocleavesoffafragmentofthecDNA.FragmentsofdifferentcDNAsareligatedtoproducetheconcatamerthatissequenced.Usingthismethod,theconcatamerthatisformedismadeuppartlyofsequencesderivedfromtheBsmFIoligonucleotides.Toavoidthis,andsoobtainaconcatamermadeupentirelyofcDNAfragments,theoligonucleotidecanbedesignedsothattheendthatligatestothecDNAcontainstherecognitionsequenceforathirdrestrictionenzyme.TreatmentwiththisenzymecleavestheoligonucleotidefromthecDNAfragment.•用生物素酰化的oligo(dT)引导合成cDNA第一链,再合成双链cDNA,用专门识别4bp碱基的锚定酶(anchoringenzyme),如NlaIII(识别位点为CATG)消化合成的双链cDNA,释放5‘序列,而生物素酰化的3’端仍被吸附在链霉亲和素蛋白磁珠(streptavidin-coatedbeads)上•分离与磁珠结合的具3‘端poly(A)尾巴的cDNA片断,与含有IIS类限制酶位点的接头连接,酶切位点一般位于识别位点后20bp处,再用标签酶(taggingenzyme),如BsmFI等IIS类限制酶处理样品,释放带有接头的SAGE标签•带有接头的SAGE标签经DNA聚合酶(Klenow)补平后,由连接酶产生带有两个接头的双标签(ditag),对双标签PCR扩增后,再用锚定酶消化,得到尾尾相连的SAGE双标签,双标签的两端分布着锚定酶的酶切位点•去除接头的SAGE双标签彼此连接形成长短不一的多联体,电泳分离后收集大小适中的片段克隆到高拷贝的质粒载体,由此形成SAGE库•随机挑选SAGE库中的克隆测序,用专门设计的SAGE软件分析得到的标签序列,通过与GenBank、dbEST或SAGEmap等数据库进行比较,获取所需的资料。•SAGE的应用–确定不同组织或细胞的表达谱,并能确定基因的表达丰度•1995年Velculescu等首次从人类胰腺中得到了1000个标签,其中351个(41.6%)只出现一次,77个标签出现多次,10个丰度最高的标签中有9个至少与GenBank序列匹配一致。这个结果与cDNA文库结果一致–鉴定新的基因•利用13bp寡核苷酸(9bp标签加上4bp锚定酶位点)做为探针,筛选胰腺cDNA文库分离了4个未确定标签所对应的克隆,结果有3个标签对应的克隆代表了两个已知的基因,其中一个可能代表新的基因(三)生物芯片技术•生物芯片技术是20世纪90年代生命科学领域中迅速发展起来的一项新技术,是综合运用生物、微电子、微加工和计算机等知识制作的高科技杰作。其本质是固定在玻片等载体上的微型生物化学分析系统,芯片上每平方厘米可密集排列成千上万个生物分子,能快速准确地检测细胞、蛋白质、DNA及其他生物组分,并获得样品的有关信息,其效率是传统方法的成百上千倍,被美国科学促进会评为1998年的世界十大科技突破成果之一。•生物芯片技术:高通量的杂交技术。•生物芯片分类–根据芯片上的固定的探针不同,•基因芯片、蛋白质芯片、细胞芯片、组织芯片,–根据原理•元件型微阵列芯片、通道型微阵列芯片、生物传感芯片等新型生物芯片基因芯片(genechip)基因芯片(Genechip)DNA微阵列(DNAMicroarray)•原理–基本原理与传统的核酸印迹杂交(Southernblot,Northernblot)相似,是基于核酸探针互补杂交技术原理而研制的。所谓核酸探针只是一段人工合成的碱基序列,在探针上连接上一些可检测的物质,根据碱基互补的原理,利用基因探针到基因混合物中识别特定基因,当探针与芯片上的靶基因杂交后,经严格的洗涤,除去未杂交或部分配对的探针DNA分子(正常配对的双链热力学稳定性比错配双链高),用荧光检测仪定量分析杂交信号强度,由于探针与靶基因完全配对时产生的荧光信号强度比含一个或两个错配碱基的杂合分子高数十倍,因而精确测定荧光信号即可实现检测的特异性。同时通过检测每个靶基因分子的杂交信号强度,就可获得样品分子的数量和序列信息。•分类–cDNA芯片–有寡核苷酸芯片–Genomic芯片•优点:大规模、高通量、高效率、并行性、自动化Figure7.23.Transcriptomeanalysis.(A)TranscriptomeanalysiswithaDNAchipcarryingoligonucleotidesrepresentingallthegenesinasmallgenome.AfteraddinglabeledcDNA,thepositionsofthehy
本文标题:第4章-基因组、转录组和蛋白组
链接地址:https://www.777doc.com/doc-2338581 .html