您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 公司方案 > 转录组测序的发展和应用
桉树科技2018,35(4):20-26EUCALYPTSCIENCE&TECHNOLOGY________________________________基金项目:广东省林业科技创新项目(2017KJCX031,2018KJCX027)。作者简介:王楚彪(1982—),男,在读博士,助理研究员,主要从事林木遗传育种研究,E-mail:scauwcb@163.com.*通信作者:罗建中(1969—),男,博士,研究员,硕导,主要从事林木遗传育种研究,E-mail:luojz69@hotmail.com.转录组测序的发展和应用王楚彪1,2,卢万鸿1,林彦1,罗建中1*(1.国家林业和草原局桉树研究开发中心,广东湛江524022;2.南京林业大学,江苏南京2100037)摘要:转录组学研究是近年来分子生物学研究的热门,而转录组测序是其核心技术。分子测序技术经历了第一代到第三代的发展,取得长足进步,通量和准确性不断提高,现在应用最广的是二代测序技术,它主要有Roche/454、ABI/Solid、Illumina/Solexa三种测序平台,各有利弊。转录组测序历经基因芯片技术、基因表达系列分析技术、大规模平行测序技术和RNA-Seq技术,目前最活跃的RNA-Seq技术是基于二代测序技术。转录组测序的应用在基因表达水平分析和差异表达分析、新基因的挖掘、寻找单核苷酸多态性及应用、基因功能注释都有所体现。转录组测序和应用是活跃的研究课题,将迅速发展,并在生物研究中起到愈发重要的作用。关键词:转录组;测序技术;高通量;RNA-Seq中图分类号:Q752文献标识码:ADevelopmentandApplicationofTranscriptomeSequencingWANGChubiao1,2,LUWanhong1,LINYan1,LUOJianzhong1(1.ChinaEucalyptResearchCentre,Zhanjiang524022,Guangdong,China;2.NanjingForestryUniversity,Nanjing210037,Jiangsu,China)Abstract:Transcriptomicshasbecomeahottopicinmolecularbiologyresearchinrecentyears.Transcriptomesequencing,whichhasemergedasacoretechnologyformoleculargeneticsresearch,hasprogressedrapidlyfromitsfirsttothirdgenerationmethodologieswithgreatimprovementinthroughputandaccuracy.Currently,themostwidelyusedissecondgenerationsequencingmethodologyemployingoneofthreesequencingplatforms:Roche/454,ABI/Solid,andIllumina/Solexa,eachofwhichhasadvantagesanddisadvantages.AllofthesemethodologiesrelyontranscriptomesequencingusinggenechipsandexaminationofgeneexpressionusingSAGE,MPSSorRNA-Seqmethods,withthelatterbeingthatmostcommonlyused.Applicationsoftranscriptomesequencingincludeanalysesofgeneexpressionlevelsanddifferentialgeneexpression,miningfornewgenes,SNPdiscoveryandannotationofgenefunctions.Transcriptomesequencingisforecasttocontinuetobeanactiveresearchareathatwillcontinuetodeveloprapidlyandplayanincreasinglyimportantroleinbiologicalresearch.Keywords:Transcriptome;sequencingtechnology;highthroughput;RNA-Seq在人类基因组计划完成后,进入了探究生物奥秘的后基因时代。基因组学、蛋白质组学和转录组学等逐渐得以应用,由于转录组学研究能相对较快得到结果、容易入手,故迅速发展起来[1]。转录组,通常有广义和狭义之分。广义转录组:指生物体的细胞或组织在一个特定状态下转录出来的所有RNA的总和,包括不编码蛋白质的RNA(包括tRNA,rRNA,microRNA等)和能编码蛋白质的信使RNA(mRNA)[2];狭义转录组:单指所有信使RNA(mRNA)的总和[3]。转录组的研究有其重要的作用,是基因结构、功能和基因表达的重要研究手段,也是表型关联研究的重要方法。转录组学研究迅猛发展,并已应用在医学、动物、植物等领域应用,其研究的重点是对转录组的测序和分析。转录组学和基因组学比较而言,研究范围更小,针对性更强,因其仅研究被转录的基因[4]。而转录组测序是转录组学研究的关键技术,正是由于转录组测试技术的迅猛发展,推动了转录组学研究进入快车道。第4期王楚彪,等:转录组测序的发展和应用211转录组测序技术的起步和发展1.1高通量测序技术的发展历程1.1.1第一代测序技术DNA测序技术是分子生物学研究的基础和重要技术,它的发展经历了几个重要阶段。早在1975年,研究人员就发明了加减法用于测定DNA序列[5]。两年后,他们对原有测序方法进行改良,引入了双脱氧核苷三磷酸(ddNTP),从而得到了双脱氧链终止法(即Sanger测序法),这很好地提高了DNA序列测定的效率与准确性[6]。同年,MAXAM等[7]报道了通过化学降解以测定DNA序列的方法。以双脱氧链终止法和化学降解法为基础建立起来的DNA测序技术,称为第一代测序技术。第一代测序技术的优点是读长长、精度高,至今仍局部应用于序列的重测序、突变位点的检测等相关研究当中。但是,随着研究的深入和需求的增长,第一代测序方法存在通量小、成本高等方面的缺陷,已经不能满足深度、高通量测序、基因组测序等大规模的测序需求,其应用前景受到了明显的制约[8]。1.1.2第二代测序技术2005年,454生命科学公司(之后被Roche公司收购)首先推出了第二代测序平台GenomeSequencer20,它是基于焦磷酸测序的,并测定了支原体的基因组序列,打开了第二代测序技术的序幕[9]。很快美国Illumina公司推出了GenomeAnalyzer测序平台[10],ABI公司推出SOLID测序平台[11],多平台的推出标志着新测序时代的到来。新一代测序技术主要特点是测序时间和成本大幅下降、测序通量大幅提高[12],该技术又称作深度测序技术,是一次革命性变革。该测序技术目前仍然广泛应用于各行业的测序和研究。边合成边测序(sequencingbysynthesis,SBS)是第二代测序技术的中心思想之一,例如Illumina公司的的测序方法,先是将目标DNA打碎成约100~200个碱基小片段,并在片段两端加上特定的接头序列,构建成为测序文库,之后将要测序的单链的DNA碱基片段利用接头与芯片表面引物进行互补配对,令其一端固定在该芯片上,而另一端和其他引物进行互补固定,构造桥状结构。通过约30轮的扩增反应,每个芯片表面会形成若干亿单克隆DNA簇[8]。接下来,加入4种带有不同颜色荧光标记的dNTP和DNA聚合酶。在DNA合成时,带有荧光标记的核苷酸在引物末端配对时都会释放焦磷酸盐,令荧光标记蛋白放出荧光。之后利用激光扫描反应板来获取各个核苷酸聚合时的荧光颜色,这就能转化为对应的核苷酸序列。重复这个过程,使得每条模板DNA全部聚合为双链。对所有的荧光信号进行统计,可获得各个DNA小片段的序列[8]。二代测序的3种测序平台各有优缺点,见表1。表1不同二代测序平台的比较[12]测序平台Illumina/SolexaABI/SolidRoche/454原理可逆性链终止合成测序双碱基编码连接测序焦磷酸合成测序平均读长/bp35~15035~50100~400数据量/(Gb·run-1)1~101~100.1~1需要时间/(days·run-1)3~55~80.33成本*/(USD·b-1)0.0030.0050.09注:*成本会有所变化。Illumina公司的优点是测序性价比最高,其运行成本低,测相同数据量,成本约为454测序的1/10,机器售价也低,缺点是测序片段短。早期的Illumina测序技术只有测序读长20~30bp时能保证较高正确率,随着技术的进步,目前高质量的测序读长能达到2×150bp或以上。该公司的Hiseq4000一次运行能产生的数据量达到150G。454FLX的的优势是测序片段长,能获得读长达400bp的高质量序列。2008年,该公司全新GSFLXTitanium系列试剂和软件,使测序通量提高了22桉树科技第35卷5倍,一次测序可测得万条读长,数据总量约500M。SOLID测序的测序读长比较短,然而优点是准确度高,测序数据的准确度大于99.94%,在15X覆盖率的情况下准确度可达到99.99%,是所有公司测序技术中准确度最高的[13]。1.1.3第三代测序技术二代测序技术通量高,成本低,但存在读长短的问题,使测序后的分析存在不少困难。因此,以单分子测序为特点的第三代测序技术,也开始逐渐进入人们的视野当中。目前主流的三代测序技术有HelicoBioScience公司的HeliScope技术[14];PacificBioscience公司的SMRT技术[15]等。目前三代测序技术不够完善,因为单分子的荧光信号较弱,单碱基检测的准确率也较低,应用还不广泛。1.2转录组测序技术的发展转录组包括一个细胞的所有转录本信息,是指特定细胞在特定功能状态下全部表达基因的总和,而通常所说的转录组学研究主要是mRNA。转录组测序和分析可以用于发现低丰度转录本、寻找多态性标记、深度挖掘新基因、绘制转录图谱、鉴定基因家族、调控可变剪切、确定代谢途径以及进化分析等研究[16],尤其是分子生物学进入应用阶段的今天,转录组学显得尤为重要。转录组测序的方法有:基因芯片技术(Microarray)[17],基因表达系列分析技术(SAGE)[18],大规模平行测序技术(MPSS)[19]以及RNA测序技术(RNA-Seq)[20]。其中RNA-Seq技术有着高通量、高重复性、宽检测范围、准定量等优点,而且其应用不局限于已知基因组序列信息的物种,对于未知基因组序列的物种也能够使用,是其最大的优势[21]。1.2.1基因芯片技术在―人类基因组计划‖进行中,基因芯片技术迅速发展和广泛被应用,是当时功能基因组学研究最重要的研究手段之一。1991年Affymetrix公司在核酸杂交的基础上开发世界上第一块寡核苷酸基因芯片[22]。经过多年的发展,基因芯片技术比较成熟,提高了分析速度,减少了实验所需样品和试剂,实验技术及后期数据分析都是相当成熟,也形成了庞大的公共数据库。缺点一是芯片上探针的信息决定了基因芯片的检测范围,该技术只适用于检测已知序列的情况而没有探索新基因的作用,二是其杂交技术灵敏度不高,很难检测到低丰度基因或捕捉到基因表达水平的细小变化[23]。1.2.2基因表达系列分析技术(SAGE)SAGE技术的技术流程是使用锚定酶切开双链并连接相应的接头,后利用标签酶酶切取得SAGE标签并进行扩增,再将接头序列使用锚定酶切除,获得含标签二聚体的多聚体并对其测序[24]。SAGE技术是以前文提到的Sanger测序为基
本文标题:转录组测序的发展和应用
链接地址:https://www.777doc.com/doc-4981070 .html