您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 咨询培训 > gromacs-中文-索引文件
Gromacs的索引文件,即index文件Gromacs的索引文件,即index文件,由make_ndx程序生成,文件后缀为.ndx。索引文件是gromacs最重要的概念文件,使用它可以在模拟过程中为所欲为。举一个简单的例子,比如想详细了解HIV整合酶切割DNA的反应机理,使用量子力学模拟反应位点的反应过程,而分子其他部位使用一般分子动力学模拟。于是我们就面临一个对模拟系统进行分割定义的问题,在gromacs中,就要用到索引文件。基本的思路是这样的,在索引文件中,定义一个独立的组,这个组包括反应位点处所有原子。在模拟的.mdp文件中,对这个组定义量子力学模拟,事情就是这么简单。对蛋白进行量子力学模拟时,一般使用洋葱模型。所谓洋葱模型,就是对反应位点使用量子机制,在反应位点一定的半径内,使用半量子力学机制,然后分子部分使用分子机制。那么索引文件就定义一个使用量子力学的组,把需要引进量子机制的原子都放到这个组中;再定义一个半量子机制的组,同时放进需要半量子力学机制模拟的原子,再在.mdp文件中独自定义即可。再举一个例子,比如说在进行SMD(SteeredMolecularDynamics,这个我一直没有想到或者找到切恰的中文翻译方法,或许可以叫做牵引分子动力学??别扭!!)中,要对蛋白莫一个原子或者残基作用力,那么可以建立一个索引文件,在该文件中定义一个组,把要施力的残基或者原子放到该组中。然后在.ppa文件中使用该组就行了。如果我还没有说明白,那么看看gromacs的参考文件吧。如果还是不明白,可以来找我,我免费培训。^_^索引文件使用make_ndx命令产生,make_ndx-h可以看到全部的参数。运行make_ndx后,可以使用r命令选择残基,a命令选择原子,name命令多组进行改名。可以使用|表示或运算,&表示与运算。下面是几个简单的例子:-----------------------------1.选择56号残基r562.选择3至45号残基r3-453.选择3至15,23至67号残基r3-15|r23-674.选择3至15号残基的主干链原子r3-15&4#在索引文件中,4号组为默认的主干链。-----------------------------组合是灵活的,使用的时候好好发挥聪明的大脑啦。个人觉得gromacs把索引文件概念做得非常好,并独立成一类文件是一个不小的创举啊。在这个概念很值钱的年代,基本上使gromacs多一个大大的卖点命令g_energyGromacs的各个工具都很有个性,如果互相结合,可以做很多事情。g_energy求系统轨迹各个能量的,一般跑完MD之后,使用g_energy处理ener.edr只能得到系统的各个能量项。但是如果想求系统中两个不同部分在模拟过程中的相互作用能量,那就要使用一些小窍门。以下是实现的一个方法:第一,根据原来的tpr文件建立一个新的tpr,在这个新的tpr中,明确定义感兴趣的组。这要用索引文件,见上文。第二,用mdrun的-rerun参数指定原来的轨迹文件再跑一次模拟,这个过程很快。如果还想更快,可以使用trjconv把水分子去掉。这一个重复的模拟也产生轨迹文件,重要的是,还产生一个新的ener.edr文件,这个文件中包含了tpr文件中定义的各个组能量及相互作用能量(库伦相互作用能,范德华相互作用能等)。第三,再使用g_energy把各个能量项提出来,想要什么提什么。嗯,结果非常好。不信你试试。命令g_traj几乎gromacs的所有分析数据都可以输出为xmgrace的数据文件,g_traj可以产生gromacs轨迹的各个组的坐标,速度,受力和边界等等。使用”-com“参数可以求出轨迹中各个组的质心的坐标,速度,受力等;使用”-mol“则可以求取系统中各个分子的信息;”-ot“则可以求出系统中各个组的温度。还有几个其他参数,比如”-cv“可以求平均速度,”-cf“可以求平均受力等。其他参数同其他命令无异,参加说明文件。命令editconf在使用pdb2gmx创建模拟分子系统之后,可以使用editconf为你的分子画一个盒子。也可以认为使用editconf把分子放进一个盒子中,这样,你就可以往盒子里面添加水分子,离子,或者其他溶剂等等了。使用“eidtconf-h”可以看到editconf的参数,其中比较常用的有以下几个:-----------------------------------------------------------f指定你的坐标文件。-n分子系统的索引文件。索引文件是gromacs一个十分突出的功能,刚接触有点复杂,但是功能相当强大。-o输出文件,即放进盒子里面的分子系统。-bt盒子类型,有正方型,长方形,八面型等等,看个人需要跟癖好啦。-box自定义盒子大小,需要三个长度,即X、Y、Z三个方向的长度。-d分子离盒子表面的最短距离。这个跟-bt一起使用,基本就足够了;如果蛋白在模拟过程尺寸变化很大,那就用-box吧。-center确定哪一部分分子放在盒子中心,如果和索引文件一起使用,可以非常详细的定义分子的位置。-translate平移分子,跟X、Y、Z三个方向,随便移动。可以参考我前面一篇关于加大盒子的e文文章,练习e文,不好意思。-rotate转动分子,还是三个方向。我觉得editconf开发者太有才,什么都想到了,我想要什么,他就有什么,以后遇到他,我会让他给我签名。-princ这个参数可以用来对齐分子,比如使分子沿X轴对齐。举一个例子吧,比如你想将分子中两个残基沿Y轴对齐,那么就在索引文件中将这俩个残基标记以下,然后使用-princ,根据提示走就能对齐分子啦。----------------------------------------------------------由于gromacs的很多命令都可以接受不同的文件类型,editconf也有其他功能,如和trjconv一样进行gro和pdb的转化:editconf-fsen.pdb-osen.gro或者editconf-fsen.gro-osen.pdb命令pdb2gmx使用gromacs做分子动力学模拟时,第一个要用到的命令一般都是pdb2gmx。这个命令吧pdb分子文件转化成gromacs独特的gro分子结构文件类型,同时产生分子拓扑文件。Gromacs是典型的GPL软件,每一个命令都有很多命令参数。这对熟悉windows环境的人来说有一点烦,但是如果熟悉了Linux环境,也就慢慢喜欢啦。(建议多使用命令,就像VMD,Pymol,rasmol和Chimera等等分子可视化软件,如果接合命令使用,功能都非常强大。另外一个比较bt的软件叫做WHATIF的,完全建立在bt的命令菜单上,心理承受能力不强者多半吐血而终。使用“pdb2gmx-h”可以得到pdb2gmx的所有参数及简单说明(gromacs的任何命令都可以使用-h参数得到类似帮助)。pdb2gmx的参数很多,但是常用的只有以下几个:------------------------------------------------------------------------f指定你的坐标文件,可以是pdb、gro、tpr等等包含有分子坐标的文件;-o输出文件,也就是处理过的分子坐标文件,同样可以是pdb、gro、g96等文件类型;-p输出拓扑文件。pdb2gmx读入力场文件,根据坐标文件建立分子系统的拓扑;-water指定使用的水模型,使用pdb2gmx的时候最好加这个参数,不然后面会吃苦头。它会提前在拓扑文件中添加水分子模型文件;-ff指定力场文件(下文讨论),也可以不用这个参数,再自行选择;-ignh舍弃分子文件中的H原子,因为H原子命名规则多,有的力场不认;-his独个指定HIS残基的质子化位置。------------------------------------------------------------------------其他的参数还不少,可以好好看一个pdb2gmx的帮助文件,一般的pdb2gmx的执行格式如下(假设你的分子坐标文件为sen.pdb):pdb2gmx-fsen.pdb-osen.gro-psen.top-watertip4p-ignh-his该命令读入分子文件,使用tipp水模型,等等,然后pdb2gmx会让你选择力场文件。然后它就很聪明的帮你建立初始模拟系统啦。gromacs自带的力场有很多:------------------------------------------------------------------------0:GROMOS9643a1forcefield1:GROMOS9643b1vacuumforcefield2:GROMOS9643a2forcefield(improvedalkanedihedrals)3:GROMOS9645a3forcefield(SchulerJCC2001221205)4:GROMOS9653a5forcefield(JCC2004vol25pag1656)5:GROMOS9653a6forcefield(JCC2004vol25pag1656)6:OPLS-AA/Lall-atomforcefield(2001aminoaciddihedrals)7:[DEPRECATED]Gromacsforcefield(seemanual)8:[DEPRECATED]GromacsforcefieldwithhydrogensforNMR9:Encadall-atomforcefield,usingscaled-downvacuumcharges10:Encadall-atomforcefield,usingfullsolventcharges------------------------------------------------------------------------本人建议使用OPLS力场和tip4p水模型。tip4p水有四个粒子,分别是两个氢原子,一个氧原子和一个没有质量的电粒子。这个电粒子在其他三个原子中间靠近氧原子。tip4p水模型多了一个粒子,模拟代价高一点,但是结果要好一点。但是最近有报道说使用spce水模型和GROMOS力场的计算结果最好,嘿嘿,好一个百家争鸣的学术氛围啊,我真的号感动哦。Gromacs也可以使用其他力场,如AMBER力场等,使用方法请参考google。pdb2gmx的输出基本可以做真空中模拟了,现在对MD模拟的要求高,一般都要有点水。为分子系统添加水环境和离子环境需要其他命令,要慢慢来。命令genion在给蛋白质添加水环境之后,一般要在水环境中添加金属离子,使模拟系统更加接近真实系统。如果系统中蛋白质本身已经带了静电量,那么就更要给系统加几个带相反电量的金属离子,使系统处于电中性。gromacs中添加金属离子的命令是genion,使用genion-h可以得到其使用的参数,其中有几个比较常用:----------------------------s:指定系统tpr文件。-p:指定系统拓扑文件,在往系统中添加金属离子时,genion会往拓扑文件最后的分子类型中写入添加的离子数,并修改拓扑文件中系统原子数。-o:指定输出文件,genion的输出是pdb文件或者gro等结构文件。也就是说你产生这个文件之后,还要再用这个文件产生tpr文件。-np/-nn:带正/负电金属粒子的数目。这个数目有一点讲究,一般需要看个人的应用。假如想要得到0.1mol/L的离子浓度到底要加多少,可以自己算一下(很简单,方法很多,比如看课本)。也可以直接使用-conc参数直接指定离子浓度,在使用-conc参数时,建议使用-neutral参数配合,即使系统的最后处于电中性。嗯,gromacs开发组想得不要太周到哦(南京话)。-pn/-nn指定正负金属离子的名字,比如NA+或者CL-。可以看看gromacs安装途
本文标题:gromacs-中文-索引文件
链接地址:https://www.777doc.com/doc-4415609 .html