您好,欢迎访问三七文档
第五章DNA序列分析DNA的序列分析有两种基本方法,Maxam-Gilbert化学降解法和Sanger酶学法。因为测序每个反应读取的序列是有限的,做长片段DNA或基因组测序时,需要选用一定的策略。测序的策略有primerwalking,随机测序,定向测序等。现在全自动测序仍然沿用Sanger酶学法,但是在标记上作了改进。DNA测序结果通过生物信息学分析,获取需要的信息。5.1Maxam-Gilbert化学降解法1977年,A.M.Maxam和W.Gilbert首先建立了DNA片段序列的测定方法,其原理为:将一个DNA片段的5’端磷酸基作放射性标记,再分别采用不同的化学方法修饰特定碱基,然后用哌啶进行特异裂解,从而产生一系列长度不一而5'端被标记的DNA片段,这些以特定碱基结尾的片段群通过凝胶电泳分离,再经放射线自显影,确定各片段末端碱基,从而得出目的DNA的碱基序列。化学降解测序法的基本步骤硫酸二甲酯[(CH3O)2SO2]是一种碱性化学试剂,可以使DNA链上的腺嘌呤A的N2和鸟嘌呤G的N7甲基化,但是鸟嘌呤G的N7甲基化速度比腺嘌呤A的N2甲基化速度要快4-10倍,并且在中性pH环境中,DMS主要作用于鸟嘌呤G,使之甲基化,导致糖苷键断裂。哌啶甲酸可以使DNA链上的嘌呤在酸的作用下发生糖苷水解,导致DNA链在脱嘌呤位点(G和A)发生断裂。肼,又称联氨NH2.NH2,在碱性环境中作用于胞嘧啶C和胸腺嘧啶T的C4和C6位置,导致糖苷键断裂。如果加入高浓度的盐(1.2MNaOH),肼则主要作用于胞嘧啶C,使之断裂。化学修饰剂断裂碱基化学修饰试剂化学反应Gdimethylsulphate(硫酸二甲酯)甲基化A+GPiperidineformate(哌啶甲酸),pH2.0脱嘌呤C+Thydrazine(肼,联氨NH2.NH2)打开嘧啶环Chydrazine+NaCl(1.5M)打开胞嘧啶环AC90C,NaOH(1.2M)断裂反应哌啶(90C,1M)在修饰位点前端使DNA的磷酸脂键发生裂解Maxam-Gilbert化学降解法测序的常用化学试剂ACGT+CC化学降解测序法的应用Maxam-Gilbert化学降解测序法不需要进行酶催化反应,因此不会产生由于酶催化反应而带来的误差。化学降解测序法特别适用于测定含有如5-甲基腺嘌呤A或者G+C含量较高的DNA片段,以及短链的寡核苷酸片段的序列。Maxam-Gilbert化学降解测序法的测序长度大约为250个碱基。5.2Sanger双脱氧链终止法双脱氧核苷酸分子的脱氧核糖的3'位置的-OH缺失。当它与其他正常核苷酸混合在同一个扩增反应体系中时,在DNA多聚酶的作用下,虽然它也能够象正常核苷酸一样参与DNA合成,以其5'位置的磷酸基,与上位脱氧核苷酸的3'位置的-OH结合,但是,由于它自身3'位置-OH的缺失,至使下位核苷酸的5'磷酸基无法与之结合。POHOHNTPPOHHdNTPPHHddNTP反应体系加dNTP时,DNA链能正常延伸(extented)OH反应体系加ddNTP时,DNA链不能正常延伸(extented)H序列分析的基本步骤模板制备单链、双链DNA均可,但必须保证足够的浓度和纯度。引物设计长度为18-22个碱基;Tm值约为55-60℃;避免Hairpin和Dimer。反应步骤模板变性退火标记延伸电泳和数据读取3’AGCTCGTAGCATGCATCGATGCATGCTAGCAT5’TemplateddATPdATP,dCTP,dGTP,dTTPGA*GCA*ddCTPddGTPddTTPTCGTATCGTACGTATCTCGTACTCGTCGTACGTTCGTACGT3’AGCTCGTAGCATGCATCGATGCATGCTAGCAT5’dA*TP,dCTP,dGTP,dTTP聚丙烯酰胺凝胶电泳分离;放射自显影A:dNTP+ddATPG:dNTP+ddGTPC:dNTP+ddCTPT:dNTP+ddTTPACGTACCAAAGACCCAGGATCGCCA序列分析的工作模式手动测序按照上述经典的测序方法进行,在PCR技术广泛应用之前是DNA测序的主导方法。PCR测序手动测序模式中的模板变性、退火、标记、延伸和终止反应实际上相当于PCR反应的1个循环。可以通过类似PCR的热循环反应过程,重复多次这样的反应。产物数量不是指数扩增而是线性扩增。全自动测序核心技术在于不用同位素标记,而是用4种不同的罗丹明荧光染料分别标记4种双脱氧核苷酸。毛细管电泳进行检测,按相差1个核苷酸大小的DNA片段顺序向下泳动,当到达检测器时,激光探测器发出激光,激发4种不同的荧光。DNA序列分析仪377型5.3DNA片段序列测定的策略Sanger双脱氧链终止法是DNA测序的主导方法,用该方法测定DNA序列时需要有一段已知序列的寡核苷酸链引物。因此对于一段未知序列的DNA片段,选择合适测序的引物是测序的前提。由于一次测序给出的序列长度不超过800个核苷酸,因此对于一段长长的DNA片段必须采取一定的策略才能有效地完成其全部序列的测定。通用引物指导未知序列的测定把未知序列装载在质粒载体上,利用载体上的已知序列设计引物。引物步移primerwalking引物依次推进法是从目的片段的一端开始,利用载体上的序列为依据,设计第一次反应的反应引物进行测序,然后,依次根据前一次测序结果,设计下一次反应引物,递进测序,直至完成。引物依次推进法需多次设计和合成引物,比较繁琐。对于重复序列较多的目的DNA,由于引物的非特异性结合概率高,所以该方法不适合于测定含有多重复序列的DNA片段。随机克隆测序randomcloning如何计算随机克隆测序的覆盖率?公式:Sn=1-(1-/L)nSn:覆盖率L:靶DNA的长度:每次读取的长度n:需要测序次数实例:L=5,500,000,=500,Sn=99.99%N=log(1-Sn)/log(1-/L)n=101309覆盖了9.21倍5.4核苷酸序列的生物信息分析基因和基因组测序工作进展迅猛,因此积累了大量的基因和基因组数据。面对日益庞大的基因数据库,需要系统地整理和分析这些数据的方法和工具。为了适应这一需要,人们将信息学的概念运用于基因数据库的分析。庞大的基因组数据经过有效的整理和分析,反过来促进了测序工作以及生物学研究的发展。序列分析和生物信息学的应用基因序列的信息分析在获得DNA的核苷酸序列以后,可以进行多种初步的分析,比如分析和寻找开放阅读框、预测外显子、分析启动子和增强子的序列以及其他调控序列、在公共基因数据库库中寻找相似的序列以及对相似的两种或多种序列进行相似性比较。RNA结构分析根据DNA核苷酸序列,可以在相应的RNA水平上进行分析,如预测RNA的二级结构、计算折叠数等等。蛋白质序列的信息分析根据核酸的序列信息,可以推导出蛋白质的序列,预测蛋白质的二级、三级结构,从而预测其功能。基因数据库和分析工具基因数据库GenBank(美国)EMBL(欧洲)DDBJ(日本)基因在线分析工具
本文标题:5 DNA序列分析
链接地址:https://www.777doc.com/doc-3209208 .html