您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 第3讲 生物信息学序列分析生物信息学常用软件及其使用
一、DNA序列片断拼接(电子基因克隆)获得感兴趣的EST,在dbEST数据库中找出EST的最有途径是寻找同源序列,标准:长度≥100bp,同源性50%以上、85%以下。然后将检出序列组装为重叠群(contig),以此重叠群为被检序列,重复进行BLAST检索与序列组装,延伸重叠样系列,重复以上过程,直到没有更多的重叠EST检出或者说重叠群序列不能继续延伸,有时可获得全长的基因编码序列。再与GeneBank核酸数据库进行相似性检测,假如有精确匹配基因,将EST序列数据据EST六种阅读框翻译成蛋白质,接着与蛋白质序列数据库进行比较分析。VectorNTI5.2中的contigExpressContigExpress软件:Sequencer软件:举例说明使用二、DNA序列测定图谱分析Chromas软件:三、限制性核酸内切酶位点的分析限制性核酸内切酶(restrictionendonuclease)识别DNA的特异序列,并在识别位点或其周围切割双链DNA的一类内切酶。即一类能识别双链DNA分子中特异核苷酸序列的DNA水解酶。是细菌内存在的保护性酶。分为I、II、III三类。(一)定义:其中的II类限制性核酸内切酶是重组DNA技术中的重要工具酶。II类酶识别序列特点为回文结构,大多为4~6bp回文结构(palindromesequence),如EcoRI识别序列:5’GAATTC3’5’GGATCC3’3’CTTAAG5’3’CCTAGG5’限制性核酸内切酶命名Smith和Nathame命名原则(1973)属名+种名+株名+流水例如:流感噬血杆菌d株(Haemophilusinfluengaed)HindⅠHindⅡHindⅢHindⅣ常用的限制性核酸内切酶酶切序列限制酶识别序列及切口限制酶识别序列及切口AluⅠAG/CTHindⅢA/AGCTTTC/GATTCGA/ABamHⅠG/GATCCSalⅠG/TCGACCCGAG/GCAGCT/GBglⅠA/GATCTSmaⅠCCC/GGGTCTAG/AGGG/CCCEcoRⅠG/AATTCCTTAA/Gstickyend5’3’5’3’5’3’EcoRⅠGAATTCGAATTCCTTAAGCTTAAG3’5’3’5’35’bluntend5’3’5’3’5’3’SmaⅠCCCGGGCCCGGGGGGCCCGGGCCC3’5’3’5’3’5’利用NEBLab在线免费软件分析:DNAStar、DNAClub、DNATool等其他商业软件均能分析。以DNAClub为例说明。四、PCR引物设计(包括杂交探针设计)(一)引物设计的原则引物要跟模板紧密结合;引物与引物之间不能有稳定的二聚体或发夹结构存在;引物不能在别的非目的位点引起高效DNA聚合反应(即错配)。引物长度(primerlength),产物长度(productlength),序列Tm值(meltingtemperature),ΔG值(internalstability),引物二聚体及发夹结构(duplexformationandhairpin),错误引发位点(falseprimingsite),引物及产物GC含量(composition),有时还要对引物进行修饰,如增加限制酶切点,引进突变等。(二)引物设计需要考虑的因素(三)引物设计要点一般引物的长度为15-30bp,常用的长度为18-24bp,过长或过短都不合适。引物3’端的碱基一般不用A,因为A在错误引发位点的引发效率相对比较高,而其它三种碱基的错误引发效率相对小一些。引物的GC含量一般为45-55%,过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。引物所对应模板序列的Tm值最好在72℃左右,当然由于模板序列本身的组成决定其Tm值可能偏低或偏高,可根据具体情况灵活运用。ΔG值反映了引物与模板结合的强弱程度,也是一个重要的引物评价指标。一般情况下,在Oligo5.0软件的ΔG值窗口中,引物的ΔG值最好呈正弦曲线形状,即5’端和中间部分ΔG值较高,而3’端ΔG值相对较低,且不要超过9(ΔG值为负值,这里取绝对值),如此则有利于正确引发反应而可防止错误引发。其原理,引物与模板应具有较高的结合能量,这样有利于引物与模板序列的整合,因此5’端与中间段的ΔG值应较高,而3’端ΔG值影响DNA聚合酶对模板DNA的解链,过高则不利于这一步骤。可能的错误引发位点决定于引物序列组成与模板序列组成的相似性,相似性高则错误引发率高,错误引发的引发率一般不要高过100,最好没有错误引发位点,如此可以保证不出非目的产物的假带。引物二聚体及发夹结构的能量一般不要超过4.5,否则容易产生引物二聚体带,且会降低引物浓度从而导致PCR正常反应不能进行。对引物的修饰一般是增加酶切位点,应参考载体的限制酶识别序列确定,常常对上下游引物修饰的序列选用不同限制酶的识别序列,以有利于以后的工作。推荐使用自动搜索软件(商业软件):PrimerPremier5.0推荐使用引物评价软件(商业软件):Oligo6网址:(四)、引物设计软件的使用OLIGO6.0PCR引物设计设计引物的免费在线软件Primer3,网址:我的评价:是非常优秀的设计引物的软件!是真正的“免费的午餐”!天上会掉下“馅饼”的?——会的!!以一条序列为例,说明其使用方法五、质粒绘图软件Winplas(商业软件)pDRAW32软件(商业软件),其网址:,可以看到演示版和有关信息VectorNTI(商业软件)Winplas2.6质粒构建Plasmidprocessor其免费下载的网址DMUPbeta其免费下载的网址质粒作图软件是压缩软件,需要先将其解压到一个目录下(不需安装即可直接应用),然后才能应用。(压缩文件是网络传输的最常用文件,目的是为了传输方便);1)在资源管理器中双击Plasmid.exe文件(553kb),进入作图的界面;2)点file--new,在出来的对话框中填上Plasmidname和length,比如分别填pBR322和4322(bp)(注意不能填4.322kb,否则软件不认识)。点击OK,进入下一个界面,上面是一个圆,标着pBR322和4322bp。3)点--date--restrictionsite加酶切位点,填酶的名称及定位;4)点Date--multiple--Genes,填基因名称(如E6),位点在500至890处,还是在此对话框中,选择右下角的style选所加基因的格式是箭头还是长的圆弧等格式(根据喜好),选厚薄度(thichness),然后点击此对话框右上部分的AddGene,,在点击done,于是基因就加上了。基因和酶切位点可反复加多次。5)但本软件缺陷之处上多克隆位点不能直接加,只能通过点--date--restrictionsite加酶切位点,在此对话框中加多克隆酶切位点(如加HinIII,EcoRI,BstI时,点--date--restrictionsite加酶切位点,出现对话框后,HinIII,location比如填1,--Addsite;EcoRI填3,--Addsite;Bst填5--Addsite;然后点击OK.在圆上将位点1~5处用鼠标往旁边分别一拖,就可看见这三个位点了。质粒作图的在线软件PlasMapper2.0六、进化树分析软件MEGA4.0:免费分子进化遗传分析软件免费下载地址:VectorNTI:商业软件VectorNTISuit同源比较—主窗口VectorNTISuit同源比较—进化树NosemagranulosisNosemafurnacalisVairimorphaimperfectaNosematyriaeMG5NosemabombycisNosemabombycisNosemabombycisNosemasp.Vairimorphasp.Mh8535MG4Mh7521N.BNosemacernanaeVairimorphanecatrixNosemanecatrixNosemaoulemaeC.SNosemasp.P.RMG2Vairimorphasp.Nosemasp.NosemaportugalMicrosporidiumsp.NosemavespulaVairimorphalymantriaeVairimorphasp.NosemaapisNosemaapis七、序列的同源性分析软件BlastClustalWBlast简介BLAST是由美国国立生物技术信息中心(NCBI)开发的一个基于序列相似性的数据库搜索程序。BLAST是“局部相似性基本查询工具”(BasicLocalAlignmentSearchTool)的缩写。(网络版)主要的blast程序程序名查询序列数据库搜索方法blastn核酸核酸核酸序列搜索逐一核酸数据库中的序列blastp蛋白质蛋白质蛋白质序列搜索逐一蛋白质数据库中的序列blastx核酸蛋白质核酸序列6框翻译成蛋白质序列后和蛋白质数据库中的序列逐一搜索。tblastn蛋白质核酸蛋白质序列和核酸数据库中的核酸序列6框翻译后的蛋白质序列逐一比对。tblastx核酸核酸核酸序列6框翻译成蛋白质序列,再和核酸数据库中的核酸序列6框翻译成的蛋白质序列逐一进行比对。举例说明使用过程p1MSDNGPQSNQRSAPRITFGGPTDSTDNNQNGGRNGARPKQRRPQGLPNNTASWFTALTQHGKEELRFPRGQGVPINTNSGPDDQIGYYRRATRRVRGGDGKMKELSPRWYFYYLGTGPEASLPYGANKEGIVWVATEGALNTPKDHIGTRNPNNNAATVLQLPQGTTLPKGFYAEGSRGGSQASSRSSSRSRGNSRNSTPGSSRGNSPARMASGGGETALALLLLDRLNQLESKVSGKGQQQQGQTVTKKSAAEASKKPRQKRTATKQYNVTQAFGRRGPEQTQGNFGDQDLIRQGTDYKHWPQIAQFAPSASAFFGMSRIGMEVTPSGTWLTYHGAIKLDDKDPQFKDNVILLNKHIDAYKTFPPTEPKKDKKKKTDEAQPLPQRQKKQPTVTLLPAADMDDFSRQLQNSMSGASADSTQAClustwalW简介和使用——进行核酸或蛋白质的多序列的比较网址:://八、ORFFinder(核酸编码蛋白质区域分析软件)目前,在国际上,一些优秀的软件根据功能归类被集中在一个网页上,极大地方便了使用。ht
本文标题:第3讲 生物信息学序列分析生物信息学常用软件及其使用
链接地址:https://www.777doc.com/doc-3366980 .html