您好,欢迎访问三七文档
实验常用统计方法及生物学软件介绍卡方独立性检验(X2)单倍型估计无系谱——SAS有系谱——Pedphase关联分析卡方独立性检验(X2)——等位基因和基因型频率东北农业大学肉鸡高、低脂双向选择品系由高脂系和低脂系组成,这两个品系以AA肉鸡群体为共同祖先,针对腹脂性状向两个相反的方向进行选择。理论上随着选择世代增加,腹脂性状分离,影响腹脂性状的等位基因频率在两系间也会逐渐分离。两系间等位基因频率的差异很有可能是由于我们对腹脂性状选择而造成的。基因型在两系间分布的检验:系别(a)基因型(b)AAABBB12030152321418程序:dataok;doa=1to2;dob=1to3;inputx@@;output;end;end;cards;203015321418;procfreq;tablesa*b/exact;weightx;run;等位基因在两系间分布系别(a)等位基因(b)AB1706027850dataok;doa=1to2;dob=1to2;inputx@@;output;end;end;cards;70607850;procfreq;tablesa*b/exact;weightx;run;00.20.40.60.81G8G9G10等位基因频率低脂系低腹脂率15%个体F等位基因频率高脂系高腹脂率15%F等位基因频率单倍型估计——SAS单倍型构建Haploview第1步,制备基因型的文档,我用的是EXCEL,如图,从左至右依次为:pedigree/samplename,individualID,Father'sID,Mother'sID,sex(M=1,F=2),Affectionstatus(0=UNKNOWN,1=UNAFFECTED,2=AFFECTED).然后是每个SNP的基因型....第2步:由于软件无法识别ATCG,需要将其转化一下,一般为:A=1,C=2,G=3,T=4.I=1,D=2,分别为insertionanddeletion.直接CTRL+H就行了.无基因型的以(00)表示,注意,两数字中间有一个空格.第3步,制备样品LOCUS的位置文档.也就是以第一个SNP为1,第2个SNP与第1个相差N个bp,N=两个SNP的position之差.制备成如下的表格.(postion可以用BLAST得到其物理地址)此图A列为SNP_ID,B列为相对位置.然后将制备好的表格另存为.txt.注意:两文档必须是一一对应的,也就是SNP的数目要一致.然后分别上传.第一个文档至DATAFILE...完成,你不光会得到图,还会得到其它信息.你也可以根据一些设置调整图的算法或色彩.Pedphase关联分析JMP,SAS,ASREML.引物设计软件引物设计需要考虑的问题:引物长度(primerlength)产物长度(productlength)序列Tm值(meltingtemperature)ΔG值(internalstability)引物本身和引物之间二聚体及发夹结构错误引发位点(falseprimingsite)引物及产物GC含量(composition)PCR引物设计原则1.引物长度一般在15~30碱基之间。引物长度常用的是18-27bp,但不应大于38bp,因为过长会导致其延伸温度大于74℃,不适于TaqDNA聚合酶进行反应。2.引物GC含量在40~60%之间,Tm值最好接近72℃GC含量过高或过低都不利于引发反应。上下游引物的GC含量不能相差太大。另外,上下游引物的Tm值是寡核苷酸的解链温度,即50%寡核苷酸双链解链的温度。一般有效引物的Tm为55~80℃,其Tm值最好接近72℃以使复性条件最佳。PCR引物设计原则3.引物3’端要避开密码子的第3位。如扩增编码区域,引物3′端不要终止于密码子的第3位,因密码子的第3位易发生简并,会影响扩增的特异性与效率。4.引物3’端不能选择A。引物3′端错配时,不同碱基引发效率存在着很大的差异,当末位的碱基为A时,即使在错配的情况下,也能有引发链的合成,而当末位链为T时,错配的引发效率大大降低,G、C错配的引发效率介于A、T之间,所以3′端最好选择T。PCR引物设计原则5.碱基要随机分布。引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错误引发。降低引物与模板相似性的一种方法是,引物中四种碱基的分布最好是随机的,不要有聚嘌呤或聚嘧啶的存在。尤其3′端不应超过3个连续的G或C,因这样会使引物在GC富集序列区错误引发。6.引物自身及引物之间不应存在互补序列。引物自身不应存在互补序列,否则引物自身会折叠成发夹结构使引物本身复性。这种二级结构会因空间位阻而影响引物与模板的复性结合。引物自身不能有连续4个碱基的互补。两引物之间也不应具有互补性,尤其应避免3′端的互补重叠以防止引物二聚体的形成。引物二聚体及发夹结构如果不可避免的话,应尽量使其△G值不要过高(应小于4.5kcal/mol)。否则易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。PCR引物设计原则7.引物5’端和中间△G值应该相对较高,而3’端较低。△G值是指DNA双链形成所需的自由能,它反映了双链结构内部碱基对的相对稳定性,△G值越大,则双链越稳定。应当选用5′端和中间△G值相对较高,而3′端△G值较低(绝对值不超过9)的引物。8.引物的5’端可以修饰,而3′端不可修饰。引物的5′端决定着PCR产物的长度,它对扩增特异性影响不大。因此,可以被修饰而不影响扩增的特异性。引物5′端修饰包括:加酶切位点;标记生物素、荧光、地高辛等;引入蛋白质结合DNA序列;引入点突变、插入突变、缺失突变序列。PCR引物设计原则9.扩增产物的单链不能形成二级结构。某些引物无效的主要原因是扩增产物单链二级结构的影响,选择扩增片段时最好避开二级结构区域。用有关软件可以预测估计mRNA的稳定二级结构,有助于选择模板。10.引物应具有特异性。引物设计完成以后,应对其进行BLAST检测。最好与其它基因不具有互补性。PCR引物设计常用软件PrimerPrimer5.0,强大的引物搜索功能,限制性内切酶位点分析。(引物设计,酶切位点分析)Oligo6.0,引物搜索功能,较强的引物分析评价功能。Oligo6的使用方法Oligo6的使用方法Oligo6的使用方法Oligo6的使用方法Oligo6的使用方法Real-TimePCR引物设计原则做RealTime时,引物与一般PCR的引物,在引物设计上所要求的参数是不同的。引物设计的要求:1)避免重复碱基,尤其是G2)Tm=58-60度。3)GC=30-80%.4)3'端最后5个碱基内不能有多于2个的G或C.5)PCR扩增产物长度:引物的产物大小不要太大,一般在80-250bp之间都可;80~150bp最为合适(可以延长至300bp)。6)引物的退火温度要高,一般要在60度以上;要特别注意避免引物二聚体和非特异性扩增的存在。而且引物设计时应该考虑到引物要有不受基因组DNA污染影响的能力,即引物应该跨外显子,最好是引物能跨外显子的接头区,这样可以更有效的不受基因组DNA污染的影响。常用生物学软件及网站的使用分子生物学综合软件:VectorNTI10.3,分子生物学的综合软件,什么功能几乎都全了。BioEdit7,杂七杂八的功能凑在一起的一个分子生物学软件,有些罕见的VectorNTI所没有的功能。DNAMAN6,与VectorNTI类似的一个软件,但是图型化上做的很差,集成度和序列的管理功能比VectorNTI差的不是一点点。常用生物学软件及网站的使用代谢网络和信号传导分析软件:CellNetAnalyzer6.0,以前叫FluxAnalyzer,基于MatLab的代谢网络和信号传导网络分析模块,大部分论文中的代谢网络分析都是用这个分析的。PathwayStudio5.0,蛋白质相互作用、细胞信号转导和代谢分析的软件。(这部分我用到的很少)序列比对DNAMAN(引物设计、二级结构、引物设计、酶切位点分析、画质粒图等)Clustal1.83Contigexpress(序列拼接)MEGA4.0(进化树构建,但和Clustal1.83配合)参考文献添加软件EndnoteNoteExpress图片处理软件•PS•PaintDotNet※还有许多在线生物学软件都很好用谢谢!2011年8月4日
本文标题:软件介绍
链接地址:https://www.777doc.com/doc-3871721 .html