您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 基因组测序基本原理分解
基因组测序生物信息系列讲座之二大纲I.核酸DNA的发现以及测序历史简介II.双脱氧化(Sangerdideoxymethod)测序III.大片段的DNA测序与基因组测序的大发展VI.人类基因组V.1000美元个体化基因组测序计划(The“$1,000dollargenome)OnWebCT--“The$1000genome”--reviewofnewsequencingtechniquesbyGeorgeChurchPartI.核酸测序原理核酸发现与测序简史MCchapter12DNA测序的简史DNA测序的方法A.双脱氧法(Sangerdideoxy)(primerextension/chain-termination)method:最流行也是最广为接受的方法。B.Maxam-Gilbert化学剪切法(chemicalcleavagemethod):DNAislabelledandthenchemicallycleavedinasequence-dependentmanner.ThismethodisnoteasilyscaledandisrathertediousC.焦磷酸测序(Pyrosequencing):measuringchainextensionbypyrophosphatemonitoring。焦磷酸测序技术是新一代DNA序列分析技术,该技术无须进行电泳,DNA片段也无须荧光标记,操作极为简便,可以快速、准确地确定DNA序列。SinglestrandedDNA5’3’5’3’Sanger双脱氧测序原理a)常规的PCR,粘附(Anneal)Sanger双脱氧测序原理b)在延伸的时候将DNA聚合酶与加入正常的dNTP,同时掺入少量的双脱氧的ddNTP5’3’DNA聚合酶延伸方向Sanger双脱氧测序原理5’3’5’3’TTTTddAddAddAddA以ddATP为例,可以看到在反应中带有T的模板被掺入的互补的ddATP随机停止。因为ddATP不能够再使其主链延伸。如何读取这些DNA片段?•同位素标记–同位素标记的引物(如32P)–同位素标记的dNTPs(如35S或者32P)•荧光标记–化学合成时带有荧光素标记的ddNTPs被掺入到反应中。–每一种ddNTP都带有自身特定的荧光波长以便于观测测序结果分析目前一般采用凝胶电泳法分析-能够比较好的将每一条dNTP产生的DNA条带分离开。DNA测序胶:老方法利用电泳或者放射自显影的方法来分析DNA序列在反应中加入不同的ddNTP得到结果带有同位素标记的引物或者ddNTP被掺入到反应中,以便于观测自动测序仪输出DNA测序的实例样本•一个带有28个DNA样品的胶图:绿带:碱基A,,蓝带C,黄带G,红带T.•越小的片段跑得越快自动测序仪测序的趋势相对而言一般很少实验室会自己做测序,一则自身测序费用比较高,而且荧光试剂容易粹灭,同时也比较消耗时间,另外可能出现一些其它问题引起结果不成功。所以大部分的测序都是送到相关的测序中心或者公司完成:--下面这个序列就是一个自动测序仪记录的一段DNA片段PartII.大片段DNA测序与基因组测序的大发展19蜜蜂基因组是如何获得的?基因组文库的建立•目前基将基因组片段打碎建立文库。基因组文库含有某种生物体全部基因的随机片段的重组DNA克隆群体。Page22酵母人工染色体(YACs)200-1000kbBacteriophageP190kbCosmids40kbBacteriophagel9-23kb质粒(2-6kb)Page23大片段载体Lambdaphage–插入大小:20–30kbCosmids–插入大小:35–45kbBACsandPACs(bacterialandP1artificialchromosomes(Viral)respectively)–插入大小:100–300kbYACs(yeastartificialchromosomes)–插入大小:200–1,000kbPage24大片段插入载体Lambda噬菌体以及cosmids–插入稳定–但插入片段的容量可能不足以做大规模的测序YACs–能够插入大片段–但不太稳定,比较难实际操作Page25BACsandPACsBACsandPACs–大规模测序通用质粒–对插入片段大小比较合适,而且容易使用–与其它正常质粒一样能够扩增和分离全基因组鸟枪法测序•但是片段比较大时,如在基因组测序时,仅仅由Sanger方法并不合适,因此Shotgun测序,将基因大片段打碎后测序。鸟枪法战略(ShotgunStrategy)又称随机测序战略,是由美国塞莱拉遗传公司创始人克雷格•文特尔发明,主要针对大片段的全长测序。因为整个基因组太长而每次只能测得一个500的小片断(read)。鸟枪法测序步骤•第一,建立高度随机、插入片段大小为2kb左右的基因组文库。克隆数要达到一定数量,即经末端测序的克隆片段的碱基总数应达到基因组5倍以上。•第二,高效、大规模的末端测序。•第三,序列集合。•第四,填补缺口。鸟枪法测序简要SIZESELECTe.g.,10Kbp±8%std.dev.SHEAR鸟枪法测序技术DNAtargetsampleVectorLIGATE&CLONEPrimerEndReads(Mates)SEQUENCE550bpPage30重叠群Contigs重叠群是指一组相互重叠的染色体DNA序列如何建立重叠群基因克隆?Forsequencingonewantstocreate“minimumtilingpath”–Contigofsmallestnumberofinsertsthatcoversaregionofthechromosome基因组genomicDNA重叠群contig最小路径minimumtilingpathPage31限制性酶切产生不同的重叠群Contigs通过限制性内切酶酶切将重叠片段序列排列直到建立一个完整的contig两种不同的全基因组鸟枪法测序序列拼接与组装•独立的测序片段(read)通过逐步把它们拼接起来形成序列更长的重叠群(Contig),直至得到完整序列的过程称为重叠群装配(Scaffold)。目前DNA序列拼接应用的主要软件是由美国华盛顿大学PhilGreen实验室开发的PhredPhrapConsed系统。目前36个国家900多个实验室都在使用上述系统。非赢利研究机构或个人可申请免费利用该系统。此外还有一序列的商业软件,如主流的基因组拼接软件(GenomeAssembly),华大基因开发的SOAPdenovo都可以做基因组的拼接,然后可以用补漏软件进行补漏,得到完整的基因组序列。基因组denovo测序•基因组denovo测序也叫做基因组从头测序,是指不依赖于任何已知基因组序列信息对某个物种的基因组进行测序,然后应用生物信息学手段对测序序列进行拼接和组装,最终获得该物种基因组序列图谱。Denovo基因原理浅解•假设有原始序列:Ididnotknowwhatiswritteninthispaper.那么通过denovo分段重复测序得到了3次不同的结果。•测序结果1:ididnotknowwhatiswritteninthispaper•测序结果2:ididnotknowwhatiswrriteninthispaper•测序结果3:ididnotknowwhatiswritteninthispaper•将3次重叠(overlap)部分进行拼接组成contig(重叠群)idnotknowwhididnotknowwhadnotknowwididnotknowwha(Contig)Denovo测序原理mapping测序•通过现有的已知同源主链序列,将同源测序片段组装拼装,建立新序列。该序列与的主链类似,但不一定相同。测序实验室39组装缺口测序缺口-我们如果已经知道重叠群的顺序和方向,那么可以通过跨越式测序得到缺口的序列信息。物理缺口-没有重叠群覆盖,同时也没有DNA测序结果测序缺口物理缺口重复序列干扰鸟枪法测序拼接41重复序列REPEATS重复序列•真核生物染色体基因组中重复出现的核苷酸序列。这些序列一般不编码多肽,在基因组内可成簇排布,也可散布于基因组。重复序列的屏蔽软件•CENSOR是一个通过参考序列筛选查询序列中的重复序列并屏蔽同源重复序列的软件工具,其能够将所有找到的重复生成报告以及分类CENSOR也可提供离线软件包Repeatmasker•RepeatMasker通过已知数据库中的重复元素筛选FASTA格式的查询序列,并返回一个屏蔽之后的可以用于准备数据库检索查询序列的DNA序列。Repeatmasker的离线软件包两种屏蔽方法的差别•Repeatmasker用法类似于CENSOR,但这两个工具各自有自身的优点,在于他们的数据库选取中有差异,如果要确保数据更加可信。所以同时用两个工具或者与与其他类似的工具组合使用。48一些错配的重复序列abcacbabcdIIIIIIIIIIIIabcdbcabdcefIIIIIIIVIIIIIIIVadbecfacollapsedtandemexcisionrearrangement人类基因组计划•人类基因组计划(英语:HumanGenomeProject,HGP)是一项规模宏大,跨国跨学科的科学探索工程。其宗旨在于测定组成人类染色体(指单倍体)中所包含的30亿个碱基对组成的核苷酸序列,从而绘制人类基因组图谱,并且辨识其载有的基因及其序列,达到破译人类遗传信息的最终目的。人类基因组数据库://genome.ucsc.edu/://asia.ensembl.org/index.html个体化基因组测序计划•已有的研究表明,基因或基因组变异是肿瘤发生的根本原因,利用单细胞全基因组测序技术,可以对获取的肿瘤细胞进行更为精确和深入的分析,了解癌细胞的基因如何突变,以及肿瘤的来源、属于哪种基因型等,为早期检测和诊断肿瘤和肿瘤的个体化治疗提供指导。•而基因分析是个体化医疗的前提,因此个体化的基因测序技术的发展能够驱动着个体化医疗的进程。乳腺癌患者全基因组测序•2012年欧洲内科肿瘤学会(ESMO)研究者首次完成了对个体的乳腺癌患者全基因组测序以期制定个体化治疗的大型临床试验。•截至2012年9月23日,共有402名乳腺癌患者已经完成了这项检测,还有26名患者分析正在进行中。276名患者得到了基因组检测结果,其中248例进行了完整的全基因组分析。André博士说,在172例患者中发现了一个能作为抗肿瘤药物靶点的基因组改变。有趣的是,20%的患者表现出一个罕见和意料之外的基因组改变,这就更加突显了全基因组测序的重要性。急性髓系白血病(AML)全基因组测序•华盛顿大学圣路易斯医学院的一个研究小组最初在对一个AML患者进行全基因组测序时发现了一个突变。随后研究人员利用靶DNA序列对大约300名AML患者样本进行测序筛选出了与疾病相关的基因及其突变。虽然以前的研究已证实AML存在有一些基因改变,在新研究中研究人员发现DNA甲基转移酶3A(DNMT3A)单基因突变与大量AML患者的治疗失败有关。新发现将快速推动AML患者个体化治疗,并为治疗药物的开发提供了一个新的分子靶点Thankyou
本文标题:基因组测序基本原理分解
链接地址:https://www.777doc.com/doc-3247296 .html