您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > PacBio原例及应用
PacBio的原理及应用主要内容1.PacBioRSII系统简介2.技术原理3.数据特点4.PacBio技术应用PacBioRSIIPacBioRS测序系统(SMRTDNASequencingSystem),是由美国PacificBiosciences公司研发的第三代测序系统。特征:SingleMolecule单分子测序,直接观测单个DNA聚合酶聚合过程,无需PCR扩增,无碱基偏向性,对GC含量不敏感Real-Time相对于二代,没有洗脱的过程,实时观测DNA聚合过程长读长读长可以达到几十K高错误率错误率高达15%从模板制备到完成初级分析10hours,其中需要手动操作的时间4hoursWorkflowPacBioRSII技术原理文库制备(约3~6hours)SMRTbellTemplates技术原理相当于NGS的Lane每个run可以测1~16个SMRTCell合成反应在ZMW中进行,每个SMRTCell上约有15万个ZMW,在测序过程中,大约有1/3处于活跃状态DNA聚合酶的活性直接影响测序读长技术原理DNA聚合酶4色荧光标记4种碱基读长主要与聚合酶的活性保持有关,而酶的活性主要激光对它的损伤的影响PacBio还在不断优化聚合酶的性能,比如给聚合酶加上免受激光影响的保护碱基等,进一步提高读长,提高测序质量和通量技术原理ZMW(Zero-ModeWaveguides)零模波导孔DNA聚合酶结合在ZMW底部,合成反应在孔中进行,ZMW的外径大约100多nm,而检测激光的波长为几百nm,激光从底部打上去后不能穿透小孔进入上方溶液区,能量被限制在一个小范围(体积20e-21L)里,正好足够覆盖需要检测的部分,使得信号仅来自于这个小反应区域,孔外过多的游离核苷酸单体依然留在黑暗中,将背景降到最低进入孔中的碱基,只有参加合成反应的碱基的光信号可以保持一段相对较长的时间,从而被识别技术原理荧光标记位点NGSPacBio标记位置5’端甲基3’端磷酸键特点在合成过程中,荧光标记物的一部分保留在DNA链上,随DNA链的延伸会产生三维空间阻力,导致DNA链延长到一定程度后会出现错读新的碱基加入时,在3’端磷酸键的标记会随磷酸键断裂自动被打断,标记物被弃去,即合成的DNA链不带荧光标记,和天然的DNA链合成产物一致,可以达到很长的读长技术原理时空段概念根据脉冲峰之间的距离可以判断模板相应位点是否出现碱基修饰数据特点长度长由于每个DNA分子的合成过程互不相关,所以reads长度长短不一,目前最大读长可以达到30k高错误率错误率高达15%,主要是Indel。但因为是随机错误,通过增加测序深度可以纠正无碱基偏向性无需PCR扩增,对于GC含量不敏感,理论上可以覆盖整个测序区域数据特点应用方向•细菌,真菌完成图•辅助基因组组装•16s全长测序•甲基化测序•CNV,SV检测应用方向-完成图应用方向——辅助Denovo组装PacBio+HiseqHiseqonlyPacBio+HiseqHiseq组装PacBio组装PacBio+Hiseq联合组装组装策略小片段组装大片段或OM连接骨架补洞(信息和PCR)PacBio+Hiseq假交替单胞菌组装结果统计原流程(Hiseq)现流程(PacBio+Hiseq)测序数据量500bpPE91164X2kPE91143X6kPE91131X10kPE91327X500bpPE91164XPacBioP4-C293XNum_Scaffold/Num_Contig2/21/1Total_Length(bp)54269435402140Gap_Length00N5041744875402140PE比对率(500bp)97.92%98.67%可能有结构错误的区域的个数60应用方向—甲基化测序应用方向——甲基化测序应用方向应用方向——SV,CNV检测案例分析一•利用illumina外显子组测序完成对92个成神经管细胞瘤病人中病灶/正常组织对的相关体细胞突变位点与易感基因的鉴定筛查辅助基因组组装成•使用PacBio单分子测序平台对外显子组测序中产生的点突变进行鉴定甲基化测序案例分析一•Demographiccharacteristics,molecularsubtypesandselectedcopynumberalterationsandsomaticmutationsacross92medulloblastomacases案例分析一•Locationofmutationsinhistonemethyltransferases,RNAhelicases,andN-CoRcomplex-associatedgenesa.Histonemethyltransferasedomains.b.N-CoRcomplex-associateddomainsinteractiondomainsaslabeled;CoRNRdomainsbindsnuclearreceptors;ANKrepeatsmediateadiversityofprotein-proteininteractions,andLIM-bindingdomainsbindacommonproteinstructuralmotif.c.RNAhelicasedomains案例分析二案例分析二Examplegene(ACD)withtwounannotatedisoformsshownbyCSMMs(consensussplit-mappedmolecule)案例分析二•AllCSMMs(blue)mappingtoAUP1(annotationinblack).
本文标题:PacBio原例及应用
链接地址:https://www.777doc.com/doc-6372298 .html