您好,欢迎访问三七文档
软件和文件用Sequencher软件Demo版看序列,Demo版不能保存序列,但其实绝大部分时候并不需要保存,只要简单看一下测序结果是否正确即可,用这个软件是最方便的。测序返回两种格式的文件,ABI和SEQ。ABI是原始文件,SEQ是根据ABI结果导出的,未必完全正确,建议只看ABI,有需要再拿SEQ去修改、拼接。1、选择同一个载体的所有测序ABI文件,拖拽到Sequencher窗口释放即可导入序列文件2、在Sequencher窗口中双击序列文件打开,可见序列质量:蓝色越深表示序列越不可信。2、点击ShowChromatogram可查看峰图:不可信不可信可信3、因此,先把序列前后深蓝色的部分都删掉这一条序列可信的长度只有880bp,而相应的SEQ文件并没有删除前后不可信的序列,仍然给出了1225bp的长度,因此不能用SEQ去判断测序结果。同时,在可信的序列中仍然存在个别深蓝色的碱基,这些碱基是否可信,也要根据峰图自行判断。4、所有序列都只留下可信区段之后,全选,点击第二个按钮AssembleAutomatically则可将序列比对到一起,形成一个Contig文件。4、Contig文件打开就是下图的overview形式,如果序列之间能连通,说明目标序列完整测通了,如果有缺口则需要加测。要把Contig文件拆散重组,则点击菜单栏的Contig→DissolveContig…即可4、第一个按钮AssemblyParameters是调整比对的参数,右图表示至少有85%相似性和20bp的overlap才能比对到一起,如果要比对引物且引物少于20bp,则要调低minimumoverlap的值;如果序列有某一段差异较大比对不上,也可调低minimummatchpercentage的值,但调得太低可能会比对到错误的位置。5、点击Bases按钮,可查看具体的序列信息5、一个载体挑至少两个克隆去测序,两个之间相互比,有不一样的就会在底下出现一个点(按Ctrl+D可以快速定位到有点的地方),这些点就是需要我们自己判断正误的地方。以上两个点的出现是由于测序质量下降导致,因为四条序列,1和2号克隆各测到两次,其中三条序列一样,说明两个克隆是相同的。左图四个克隆中,第四个与另外三个不同,说明第四个在PCR扩增中有碱基错配。也有发生碱基缺失的、碱基插入的。以上出现差异的点都是位于浅蓝色的可信区段,通常不会有读峰错误的问题,可以不用理会峰图。如果点出现在深蓝色的区段,则要打开峰图自己解读。如右图,第三个克隆多了一个G,且此处是深蓝色,表明仪器对此处的解读存在疑问。打开峰图比较三个克隆的差异,发现第三个克隆在GG处的两个峰拖得比较开,导致仪器误判为GGG,但又不及三个峰的宽度,原序列应该是正确的GG。6、若需导入模板和引物进行比对,可将模板和引物序列按以下格式保存在txt文档中,直接将txt拖拽到Sequencher窗口释放即可:16666-NIP-gDNAATCGATCG……16666-Pro-FATCGATCG……16666-Pro-RATCGATCG……注意区别错配与SNP位点的差异!一个载体挑至少两个克隆,如果它们之间有不一样的位点,则说明是PCR过程中引入的错配,发生错配的克隆就不要用了。我们从HHZ中扩出来的序列跟NIP比,会有很多SNP、InDels,表现为几个克隆之间一模一样,但都与NIP模板序列不一样。
本文标题:如何分析测序结果
链接地址:https://www.777doc.com/doc-6477407 .html