您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 信息化管理 > BLAST+技术文档
BLAST+的分析流程摘要本文简单的介绍了一下序列比对工具BLAST+。这个工具主要分三个部分搜索,数据库,序列筛选。有多个应用,本文主要针对blastn和blastp还有makeblastdb常用功能进行简要介绍。因为BLAST+虽然机制是BLAST,但却是从头写的,可被C和C++直接调用,效率更高,性能更好。本文用了酵母细胞色素c基因作为query,酵母基因组数据库作为database,进行简要功能的测试,常用参数及结果文件的解释。个别program及参数的使用方式请参见-help。目录摘要........................................................................................................................................................1目录........................................................................................................................................................11.文档目的............................................................................................................................................12.适用范围...........................................................................................................................................23.概述...................................................................................................................................................23.1BLAST简介.................................................................................................................................23.2BLAST+应用..............................................................................................................................24.业务流程及细节................................................................................................................................34.1数据..........................................................................................................................................34.2使用的方法或解决办法..........................................................................................................44.2.1方法的简单介绍...........................................................................................................44.2.2方法的常见参数以及默认值........................................................................................54.2.3备注................................................................................................................................94.3结果解释.................................................................................................................................105.实例.................................................................................................................................................126.参考内容.........................................................................................................................................121.文档目的BLAST是NCBI基本局部比对工具,发现序列之间的局部相似性,这个程序将核酸或者蛋白序列与序列数据库进行比较,计算匹配的统计值。BLAST用于功能推断和序列间进化关系以及帮助鉴别基因家族成员。BLAST+与BLAST相比,有很多改进和提高,NCBI强烈推荐放弃BLAST,使用BLAST+,本文主要学习和介绍BLAST+的用法。2.适用范围本文主要讨论本地化的BLAST+:适用系统:Windows,MacOSX,Linux/Unix。输入的数据格式有很多种:以makeblastdb为例有,String,`asn1_bin',`asn1_txt',`blastdb',`fasta',具体程序输入文件类型可参照如:blasn-help的方式查看。该软件适用系统:Windows,MacOSX,Linux,andSolaris。3.概述3.1BLAST简介BLAST(BasicLocalAlignmentSearchTool)是一套在蛋白质数据库或DNA数据库中进行相似性比较的分析工具。BLAST程序能迅速与公开数据库进行相似性序列比较。BLAST结果中的得分是对一种对相似性的统计说明。BLAST采用一种局部的算法获得两个序列中具有相似性的序列。应用BLAST+package有三个分类1)searchtools--搜索工具*blastn:核酸-核酸比对(query-DB)*blastp:蛋白-蛋白比对(query-DB)*blastx:核酸-蛋白比对(query-DB)*tblastx:核酸-核酸比对(query-DB)核酸序列到核酸库中的一种查询。此种查询将库中的核酸序列和所查的核酸序列都翻译成蛋白(每条核酸序列会产生6条可能的蛋白序列),这样每次比对会产生36种比对阵列。*tblastn:蛋白-核酸比对(query-DB)*psiblast:敏感度更高的蛋白序列与蛋白序列之间的比对*rpsblast*rpsblastn2)BLASTdatabasetools--数据库工具*makeblastdb:根据fasta文件建立数据库*blastdb_aliastool:.生成GI列表的二进制文件,可以传递给blast+的-gilist参数,用来限定比对到db中的序列。*makeprofiledb*blastdbcmd:相当于以前的fastacmd,用来从格式化好的blast数据库中取序列(blastdbcmd-dbrefseq_rna-entry224071016)3)sequencefilteringtools--序列筛选工具4.业务流程及细节4.1数据常用为NCBI规范的fasta格式的序列文件,以``开头为一条序列:如下所示:gi|330443743:447439-448368SaccharomycescerevisiaeS288cchromosomeXV,completesequenceATGTTTTCAAATCTATCTAAACGTTGGGCTCAAAGGACCCTCTCGAAAAGTTTCTACTCTACCGCAACAGGTGCTGCTAGTAAATCTGGCAAGCTTACTCAAAAGCTCGTTACAGCGGGTGTTGCTGCCGCCGGTATCACCGCATCGACTTTACTCTATGCAGACTCCTTAACTGCCGAAGCTATGACCGCAGCTGAACACGGATTGCACGCCCCAGCATATGCTTGGTCCCACAATGGGCCTTTTGAAACATTTGATCATGCATCCATTAGAAGAGGTTACCAGGTTTACCGTGAAGTTTGTGCCGCCTGCCATTCTCTTGACAGAGTTGCTTGGAGAACTTTGGTTGGTGTTTCTCATACCAACGAAGAGGTTCGTAATATGGCCGAAGAATTTGAATACGATGACGAACCTGATGAACAAGGTAACCCTAAAAAGAGACCAGGTAAGTTGTCCGATTACATCCCTGGCCCATACCCAAACGAACAGGCTGCAAGAGCTGCCAATCAAGGTGCCTTGCCACCTGATCTATCTTTGATCGTGAAAGCTAGACACGGTGGTTGTGACTACATTTTCTCTTTGTTGACCGGTTATCCTGATGAACCTCCTGCTGGTGTGGCTTTACCACCAGGTTCTAATTATAACCCTTACTTCCCAGGTGGTTCCATTGCAATGGCAAGAGTCTTGTTTGATGACATGGTTGAGTACGAAGATGGTACCCCCGCAACGACATCTCAAATGGCAAAGGACGTTACCACCTTTTTAAACTGGTGTGCCGAACCTGAACATGACGAAAGAAAGAGATTGGGTTTGAAAACGGTGATAATCTTATCATCTTTGTATTTGCTATCTATCTGGGTGAAGAAGTTCAAATGGGCCGGTATCAAAACCAGAAAATTCGTTTTCAATCCACCAAAACCAAGAAAGTAG4.2使用的方法或解决办法4.2.1方法的简单介绍1、安装BLAST+Windows:下载如:ncbi-blast-2.2.18+.exe,双击。RedHatLinux:下载合适的*.rpm,然后就可以安装或更新Install:rpm-ivhncbi-blast-2.2.18-1.x86_64.rpmUpgrade:rpm-Uvhncbi-blast-2.2.18-1.x86_64.rpOtherUnixplatforms:下载tarball并解压到指定目录。2、下载BLASTdatabase(1)下载多个数据库tarfiles:(htgs.00.tar.gz,…,htgs.N.tar.g
本文标题:BLAST+技术文档
链接地址:https://www.777doc.com/doc-1655650 .html