您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 关联分析相关软件演示
DEMOofrelatedsoftwareinassociationanalysis张学海xuehai85@126.com2010.5.18PowermarkerStructure2.2SPAGeDiTASSEL2.0MoreinformationPowermarkerStructure2.2SPAGeDiTASSEL2.0=com_content&task=view&id=89&Itemid=SSR带型记录第一种读带方式:以0、1统计,相同迁移率位置上,有带记为1,无带记为0。适合于NTSYS,powermarker等软件第二种读带方式:FileformatofPowermarker材料名称或编号群体类型引物名称标记基因型,中间用“/”隔开,缺样用?/?表示。演示FileformatofStructureInbrednametwolinesMarkernameMarkergenotypeMissinggenotype应用STRUCTRE软件(Pritchard2000),是对群体进行基于数学模型的类群划分,并计算材料相应的Q值(第i材料其基因组变异源于第k群体的概率)。分析的大致理念是,首先假定样本存在K个等位变异频率特征类型数(即服从Hardy-Weinberger平衡的亚群,这里K可以是未知的),每一类群标记位点由一套等位变异频率表征,将样本中各材料归到(或然率用Bayesian方法估计)第k个亚群,使得该亚群群体内位点频率都遵循同一个Hardy-Weinberg平衡。structureCreateanewproject1)Projectinformation2)Informationofinputdataset3)FormatofinputdatasetSetupparametersResults演示K值确定L′(K)=L(K)–L(K–1)|L′′(K)|=|L′(K+1)–L′(K)|ΔK=m|L′′(K)|/s[L(K)]ΔK=m(|L(K+1)−2L(K)+L(K−1)|)/s[L(K)]注:s[L(K)]为标准差,K值确定方法具体请参考原文献:G.EVANNO,S.REGNAUTandJ.GOUDET,DetectingthenumberofclustersofindividualsusingthesoftwareSTRUCTURE:asimulationstudy[J].MolecularEcology,2005,14,2611–2620.Distruct---柱形图绘制参见distruct软件包,将文中的相应部分替换为自己的相应数据即可。FileformatofSPAGeDi群体大小标记数目亚群数目二倍体用于定位基因型的最大字符数空间坐标spagedi参数选择问题:第一步:1kinshipcoefficient第二步:4Jackkniefoverloci第三步:3Reportmatriceswithpairwisespatialdistancesandgeneticcoefficients第四步:3mutilocusestimatesmatrixandcolumnarforms生成的结果需做如下处理:将生成的txt文件用excel打开,然后将矩阵数据部分复制到一excel中,对于小于0的数据用0代替,对角线上的空着的用1代替,最后对整个矩阵乘以2即可,此时可用于tassel分析。演示FileformatofTasselGenotypicdataPhenotypicdataPopulationstructuredataKinshipdataGenotypicdataInbredlinesnumberSequencelengthormarkernumberInbredlinenameMarkerorsequencePhenotypicdataInbredlinenameInbredlinesnumberTraitsnummerHeadrowsnummerTraitsPopulationstructureOutputfilefromStructureKinshipOutputfilefromSpageDiTASSEL演示1、powermarker算出后为何不显示聚类图?需要安装MEGAV4.0分子进化遗传分析软件2、STRUCTURE为何都是按正常操作进行却不能运行?重新加载工程即可,勿须重新建立工程3、TASSLE软件无法启动!?TASSLEneedjava1.54、标记分析时需注意那些问题?a:allelicsize,b:needCK5、多少标记估计群体结构(Q)及kinship(K)合适?ForQ,1000singlenucleotidepolymorphismsor100simplesequencerepeatsformaize.ForK(aminimumofseveralhundredSNPsspreadoverthewholegenomeisrecommended.6、缺失数据如何表示?TASSLE:Fortraitdataandpopulationstructure,use“-999”formissingForSNPdata,use“N”.ForSSRdata,use“?”.Kinshipdoesnotallowformissingvalues.Structure:missinggenotype:-9.Ntsys格式演示
本文标题:关联分析相关软件演示
链接地址:https://www.777doc.com/doc-2628721 .html