Plink-命令汇总

关联分析步骤个人总结，还一些问题待解决已有1570次阅读2013-2-620:34|个人分类:科学笔记|系统分类:科研笔记|关键词:安装软件个人总结style希望查看此贴的同仁们对步骤提出改进，指出不足，谢谢！一、软件安装和存放1.将plink文件直接放在D盘；将map和ped文件拷贝到plink文件下面，保证和在一起；2.Ped文件的格式和map文件都是先弄成txt文件，再直接更改文件后缀。可以在excel里先将需要的格式把数据排列好，再将excel保存为txt，再改txt后缀为ped或map.1）(.PED)文件的前六列是强制的格式，依次为：ped文件包含内容的顺序依次为以下信息备注FamilyID可以用1,2,3,4……表示IndividualID用入库编号表示PaternalID可以用0表示MaternalID可以用0表示Sex1=male;2=female;other=unknownPhenotypecontrol设定为1，case设定为2Genotype如AT，中间空一格，缺失用0补平2）(.MAP)文件包括以下的四项：map文件包含内容的顺序依次为以下信息备注chromosome1-22,X,Yor0ifunplacedrs#orsnpidentifierrs号Geneticdistance(morgans)可以用0代替Base-pairposition(bpunits)用NCBI上的染色体起始位置3）协变量信息：协变量先单独建立一个文件，要txt格式的，比如有10个协变量，我命名为var01.txt。这个文件必须放在和ped，map和plink.exe文件一起。Var文件是先在excel格式里面整理好，删除第一行协变量的表头，但自己要单独记下来每列代表的意思，然后转化成txt文本格式，就是另存为txt。顺序依次为：familyID，个体ID，后面就是协变量了（number1-10），空缺的信息的用-9补全。二、软件启动开始——运行——cmdC:\Documentsandsettings\AdministratorcdC:\Documentsandsettings\AdministratorC:\Documentsandsettings\Administratord:D:\cdplink三、软件运行的命令前提是冠心病数据文件分别为1.ped和1.map；用file1和bfile3的结果相似，那些限制性条件只是去掉了3个对照；单倍型分析，在同一染色体上且位置较近的SNP分析单倍型才有效，不同染色体上SNP的分析那是联合效应分析运行命令功能plink--file1--make-bed--out2转成二进制文件，2即为二进制文件了plink--bfile2--maf0.01--geno0.05--mind0.05--hwe0.001--make-bed--out3设定过滤数据plink--bfile3--filter-controls–hardy计算control的hw，将hwe0.05的位点过滤掉，23个SNP又去掉了2个SNPplink--bfile3--assoc--adjust--outassoc1等位基因的关联分析，每运行后及时更改文件名称（assoc1+时间）plink--bfile3--filter-females–assoc--adjust--out333女性样本关联分析plink--bfile3--filter-males–assoc--adjust--out444男性样本关联分析plink–bfile3–assoc–permpermutation检验，就是模特卡罗模拟分析经验性的P值plink–bfile3–all--missing缺失率或得出率（callrate）分析，查看log文件结果plink–bfile3–model–outmodel1默认是卡方检验plink–bfile3–model–fisherfisher检验，但是结果比卡方检验差plink–bfile3–logistic--ci0.95--covarvar01.txt分析所有的协变量plink–bfile3–logistic–covarvar01.txt–covar-number1,3,5只分析1,3,5这几个协变量plink–bfile3–logistic–sexplink–file1–logistic–ci0.95加性模式下分析plink–file1–logistic–ci0.95–dominant显性模式下分析plink–file1–logistic–ci0.95–recessive隐性模式下分析plink–file1–logistic–ci0.95–genotypic基因型分析plink--file1–logistic–ci0.95–covarvar01.txt–covar-number1,2,4-6加性模式下分析plink--file1–logistic–ci0.95–covarvar01.txt–covar-number1,2,4-6–dominant显性模式下分析plink–file1–logistic–ci0.95–covarvar01.txt–covar-number1,2,4-6–recessive隐性模式下分析plink–file1–logistic–ci0.95–covarvar01.txt–covar-number1,2,4-6–genotypic基因型下分析plink–bfile3–hap-snpsrs653667,rs2261434–hap-assoc单倍型分析Plink–bfile3–filter-cases只包含casesPlink–bfile3–filter-controls只包含controlsPlink–bfile3–filter-males只包含malesPlink–bfile3–filter-females只包含femalesplink–bfile3--filter-females–logistic–ci0.95默认加性模型plink–bfile3--filter-females–logistic–ci0.95–dominantplink–bfile3--filter-females–logistic–ci0.95–recessiveplink–bfile3--filter-females–covarvar01.txt--covar-number1,2,4,8,9--logistic–ci0.95默认加性模型plink–bfile3--filter-females–covarvar01.txt--covar-number1,2,4,8,9––logistic–ci0.95–dominantplink–bfile3--filter-females–covarvar01.txt--covar-number1,2,4,8,9––logistic–ci0.95–recessive四、结果查看可以先用notepad打开看一下，也可以用excel打开，打开步骤：用excel的文件，打开——分隔符号——下一步——空格——完成，再另存为即可。看到unjust对应的P值是未校正的，plink默认Bonf校正，非常严格，校正后基本没有显著的了。如果文章中不用plink校正后的结果的话，前面的分析也不要用plink的结果，不然别人会问你为什么不用plink校正。Log文件是保存运行过的命令，如果不及时更名，就被后面的log文件给覆盖掉了。五、关于单倍型的分析过程分型数据结果出来后，首先要做的是按照染色体将SNP位点分类（在位点位于不同染色体的情况下），1）如上图所示，按照不同染色体分好位点数；2）首先分析的是control数据里的LD，如果存在LD，即D’接近1，r2大小似乎关系不大，就可以判定有LD，这个在Haploview软件里面分析。分析时的数据格式整理成Linkageformat。可以把一个数据弄成ped，一个是map的。(奇怪的是我用plinkformat，系统总说我少SNPcolumn，给ped加head,genotype那里换成rs号或SNP1，SNP2之类的都不行，map文件是标准的plink格式，headless)，有时间再找出问题在哪。Map的文件：只有2列，一列是rs号，一列是染色体上的起始位置，至于这个位置，我用的是Hapmap数据库上的。不同数据库之间的相差不大，起始需要的是每2个SNP之间的相对距离，估计软件自己会计算。Ped文件：前6列是固定的，一次为FID，IID，fatherID，motherID，sex(1male;2female)，phenotype（1control；2case），后面就是基因型的了。按照SNP号排列好，但是不要表头。注意在map文件中，SNP的顺序要和这个对上。3）结果可以看到LD，右键点击，可以看到D’，r2；点Haplotype，不知道怎么有的没有结果出来，可能是没有单倍型？？？对于有单倍型的，比如，对照中有这样的结果，我再计算case中的单倍型结果。得出这些数据后，我是再把数据导入到SPSS，运用卡方分析casecontrol中数据是否有差异。可惜今天分析的结果都没有差异，奇怪为什么直接用plink的haps命令结果有一个是单倍型显著的呢？（P=0.045）。

Plink-命令汇总

免费阅读已结束，点击付费阅读剩下 ... 页

阅读已结束，您可以下载文档离线阅读

东方太阳城别墅地产广告提案

机械手论文：海洋采矿机械手设计及有限元计算

高等学校本科教学质量与教学改革工程

银税通－网上缴税终端11版用户操作手册（下载）-招商银行

走客房及住人房清洁程序

长安汽车发展战略

年终执行考核流程

媒体影音光盘播放系统项目可行性研究报告

面向分布式开放环境的信任管理机制及其应用研究

员工手册范本（工厂类）（DOC 6页）

相关文档

相关搜索