您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 交通运输 > 甘明宇-二代测序技术原理
二代测序技术原理甘明宇复旦大学基础医学院医学分子病毒学教育部/卫生部重点实验室深圳2017-12主要内容背景介绍:测序技术的发展测序技术的原理(illumina)下机数据文件格式(fastq)重点了解二代测序技术的基本原理核心名词:PE(Pairend),SE(Singleend),flowcell,cluster,read,fastqLifeisdiversity生命的本质——DNA测序可以得到大量的遗传信息鉴定多态性,染色体重排及基因组上的突变诊断,治疗及预防疾病为药物和疫苗提供潜在的靶位点…为什么要测序对DNA的解读人类基因组计划千人基因组万人基因组测序技术的发展史磷酸基团碱基(嘌呤/嘧啶)脱氧核糖脱氧核糖核苷酸结构第一代:sanger测序Dr.FrederickSanger两次获得诺贝尔化学奖第二代:高通量测序J.Ronhometal.Clin.Microbiol.Rev.2016二代测序技术Roche/454FLX(2005)Illumina/SolexaGenomeAnalyzer/Hiseq(2006)AppliedBiosystems/SOLiDTMSystem(2007)Hiseq2000Illumina测序仪原理构建文库簇生成测序数据分析Fragment:500bpinsertsizeGenomicDNA1.文库构建(TrueseqDNAlibraryPrepkit)超声打断1.文库构建(Nextera)Fragment:300bpHowdoestheNexteraDNAAssayWork?NexteraDNALibraryPrepReferenceGuide23HowdoestheNexteraDNAAssayWork?TheNexteraDNALibraryPrepKitusesanengineeredtransposometotagmentgenomicDNA,whichisaprocessthatfragmentsDNAandthentagstheDNAwithadaptersequencesinasinglestep.Alimited-cyclePCRstepusestheadapterstoamplifytheinsertDNA.ThePCRstepaddsindexadaptersequencesonbothendsoftheDNA,whichenablesdual-indexedsequencingofpooledlibrariesonIlluminasequencingplatforms.ANexteraDNAtransposomewithadapterscombinedwithtemplateDNABTagmentationtofragmentandaddadaptersCLimitedcyclePCRtoaddindexadaptersequences1.文库构建P5P7indexR2seqprimerR1seqprimerSequenceofinterestP5,P7:和flowcell上的oligo杂交index:6个nt的碱基序列,用以区分不同的样本Seqprimer:测序引物Flowcell的结构进样孔出样孔2.簇生成桥式PCR扩增成簇单链DNA杂交到flowcell表面退火延长变性n=35总数一个亮点即扩增后的一个簇核心原理:可逆阻断技术3.测序——边合成边测序Genes2010,145Figure4.(A)Illuminasequencingchemistry.Asequencingprimer(red)isannealedtothetemplatemoleculeslinkedtotheflowcellsurface.Next,DNApolymeraseandamixtureoffluorescentlylabelednucleotidesareaddedtotheflowcell.Thenucleotidesaremodifiedwithacleavableterminatormoietysuchthatonlyonenucleotidecanbeincorporatedduringeachsequencingcycle.Afternucleotideincorporation,thearrayisimagedandthefluorescentsignalsarerecordedforeachcluster.Theterminatormoietyandfluorescentlabelarecleavedoffandremoved,andfreshnucleotidesandpolymeraseareaddedtobeginthenextsequencingcycle.(B)Helicossequencingchemistry.Templatemoleculesmodifiedbytheadditionofadenosinestothe3’endarehybridizedtopoly-Toligonucleotidescovalentlylinkedtothesurfaceoftheflowcell.Thetemplatemoleculesarefluorescentlylabeledattheterminal3’adenosinesothattheinstrumentcanrecordthepositionofeachtemplateontheflowcellpriortothesequencingreaction.Afterthefirstimageisacquired,thefluorescentlabelisremovedandwashedaway.Next,DNApolymeraseandoneoffourfluorescentlylabelednucleotides(A,T,CorG)areintroducedtotheflowcell.SimilartotheIlluminaapproach,thenucleotidesaremodifiedwithterminatormoietiestopreventmultiplenucleotideadditionsduringasinglesequencingcycle.Afternucleotideincorporation,thearrayisimagedandthefluorescentsignalsrecorded.Thefluorescentlabelandterminatormoietyareremoved,andthenextcycleofsequencingcommenceswiththenextfluorescentlylabelednucleotide.Thenucleotidesaremodifiedatthe3’endwithacleavableterminatormoietytoensurethatonlyasinglenucleotideincorporationeventcanoccurwitheachsequencingcycle[17].Attheendofeachcycle,thefluorescentsignalismeasuredforeachcluster,andboththefluorescentlabeland3’1234CCCCGGGTTAAACycle1Cycle2Cycle3对A发出的光拍照对C发出的光拍照对G发出的光拍照对T发出的光拍照由4个cluster得到4条序列:①ATA...②CCT...③GCG...④GAC...123789456TTTTTTTGT…TGCTACGAT…单末端测序和双末端测序Singleend单端测序:只测DNA分子一段,得到一个测序文件;常用于小基因组,宏基因组测序。Pairend双端测序:对DNA分子两端分别测序,测序结果为read1和read2两个文件;具有insertsize信息,有利于鉴定插入缺失,重排等。单末端测序和双末端测序双末端测序对于鉴定小的indel以及长片段的重排和duplication等变异不可或缺!Fragment:500bpIllumina测序原理视频测序仪控制软件(HCS+RTA)1.控制测序过程2.进行图像分析3.basecalling输出basecalling结果:二进制的bcl文件BCLconverter将二进制bcl文件转化为qseq文本文件质控生成后续信息分析使用的fastq文件质控分析、数据备份、拆分index数据测序控制PC测序仪Fastq文件:标准的高通量测序输出文件每4行表示一条Read(1个cluster)第一行:@序列ID,包含index序列及read1或read2标志:第二行:碱基序列,大写“ACGTN”第三行:“+”,省略了序列ID第四行:质量值序列:字符的ASCII码值-33/64=质量值Read1:Read2:Fastq文件每条read长度SE90有效长度为90PE90有效长度为90(read1)+90(read2)Read1中所有reads长度相同,Read2中所有reads长度相同碱基总产量=reads数量*(Read1的长度+Read2的长度)估算覆盖度Fastq文件质量值@FC61FL8AAXX:1:17:1012:19200#GCCAACCACTGTCATGTGAACATCACAGAGACAT+bbbbbbbbbbabbbbbbbbbbbbbbaaaaaaaaa_\表示方法:Sanger:字符的ASCII值-33=质量值Q20代表错误率e=0.01Q30代表错误率e=0.001Fastq文件sangerIllumina质量值与错误率理论关系:Q=-10log10(e)质量值计算方法:根据光强信号信噪比,光强度衰减,GC含量等参数,计算质量值测序结果质量控制蓝线:平均值红线:中位数黄色:25-75%区间横线:10-90%区间ApplicationsDenovogenomesequencingMeta-genomicsExomesequencingCHIP-SEQDNAMethylationResequencingDenovo测序(Denovosequencing):是指在不需要任何参考序列的情况下对某一物种进行基因组测序,然后将测得的序列进行拼接、组装,从而绘制该物种的全基因组序列图谱二代测序的应用二代测序的应用重测序(Resequencing):全基因组重新测序的简称,是指是对已知基因组序列的物种进行不同个体的基因组测序,并在此基础上对个体或群体进行差异性分析。Zhangetal.Naturegenetics.2013二代测序的应用宏基因组(Metagenomics):也称环境微生物基因组MicrobialEnvironmentalGenome,环境品中所有微生物基因组集合Wangetal.Scientificreport.2013甲基化测序:用Bisulfite处理,将基因组中未发生甲基化的C碱基转换成U,进行PCR扩增后变成T,与原本具有甲基化修饰的C碱基区分开来二代测序的应用染色质免疫沉淀测序(Chip-seq):在生理状态下,把细胞内的DNA与蛋白质交联(Crosslink)后裂解细胞,分离染色体,通过超声或酶处理将染色质随机切割,利用抗原抗体的特异性识别反应,将与目的蛋白相结合的DNA片段沉淀下来,再通过反交联(Reversecrosslink)释放结合蛋白的DNA片段,最后测序获得DNA片段的序列。二代测序的应用二代测序的应用外显子测序(Exomesequencing):利用设计好的探针将坐标已知的全基因组外显子区域的DNA捕捉并富集后,进行高通量测序的基因组分析方法第三代:单分子测序J.Ronhometal.Clin.Microbiol.Rev.2016三代测序平台–Pacifi
本文标题:甘明宇-二代测序技术原理
链接地址:https://www.777doc.com/doc-1647982 .html