您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 入侵物种紫茎泽兰的叶绿体全基因组分析
入侵物种紫茎泽兰的叶绿体全基因组分析研究背景•紫茎泽兰是危害最大的入侵物种之一,在世界范围内造成了严重的经济损失和环境破坏。然而,关于紫茎泽兰的序列资源和基因组信息却十分有限,使得其系统发育的鉴定以及进化方面的研究难以进行。这里我们报道了基于Illumina测序获得的紫茎泽兰完整叶绿体基因组。研究背景•叶绿体被认为是起源于蓝细菌的内共生作用,是植物所特有的细胞器,能进行光合作用来为植物和藻类提供必要的能量。它们有着自己的遗传复制机制,能对自己的基因组进行转录并进行母系遗传。在高等植物中,叶绿体基因组是一个大小在120到160bp的双链环状DNA分子。通常,陆生植物的叶绿体基因组在基因顺序、基因内容以及基因组组织方式上都是高度保守的。叶绿体基因组高度保守的特性以及低的进化速率说明它能较为统一地进行不同物种的比较性研究,但是在捕捉进化史上的事件时又具能产生有效的分歧,这使得其成为分子系统发育学以及分子生态学研究的合适且不可多得的工具。研究背景•紫茎泽兰是一种多年生草本植物,属于菊科(泽兰族)。它原产于中美洲,在墨西哥至哥斯达黎加均有分布,在十九世纪被作为观赏植物引进至欧洲,澳大利亚以及亚洲。紫茎泽兰能抑制那些本土植物生长,还能毒害动物。•它最初是于二十世纪四十年代从缅甸入侵中国云南省,随后迅速地传播至中国南部及西南各省,包括贵州、广西、四川及重庆。如今它已经成为了当地环境中的优势种,影响了当地的生物多样性以及生态系统,在其入侵地区造成了严重的经济损失。研究背景•在过去的二十年间,大量基于叶绿体DNA序列数据的研究从种、属和族的水平上促进了我们对于被子植物进化上关系的理解。同时,叶绿体基因组在系统发生学、DNA条形码、光合作用研究以及最近的叶绿体转化上的重要性,使得越来越多的叶绿体基因组被测序。自从烟草的完整叶绿体基因组被首次公布以来,已有超过200个完整的叶绿体基因组被测序及分析。随着下一代测序技术的出现,由于其具有高通量、省时以及廉价等特点而被逐渐用于叶绿体基因组测序。研究背景•尽管菊科有五个成员的叶绿体基因组已被测序完成,包括小油菊、向日葵、银胶菊(均属向日葵族)、莴苣(莴苣族)以及新疆千里光(千里光族),但目前并未有泽兰族物种的叶绿体基因组被测序完成。这里我们报道了使用Illumina高通量测序技术获得的紫茎泽兰完整叶绿体基因组序列。该叶绿体基因组序列将为紫茎泽兰种群的研究提供有用的遗传学工具,并帮助揭示外来物种入侵的遗传学和进化机制。材料和方法•①叶绿体提取和DNA测序•从中国云南腾冲县生长的紫茎泽兰中采集新鲜的叶子样本。采用向日葵细胞器分离所用的方法进行了叶绿体的分离。经DNA酶处理之后提取出了其叶绿体基因组DNA。构建了短插入片段文库,根据中国深圳BGI提供的操作流程使用IlluminaGAII进行测序。测序以51bp的单末端进行,进一步的图像分析以及碱基读出是使用IlluminaPipeline软件进行的。材料和方法•②基因组的装配和注释•叶绿体基因组的过程中,首先使用perl脚本剔除了Illumina测序的低质量片段。随后我们比较了两种装配短片段序列的方法:•其一:•直接将质量筛选后的片段使用SOAPdenovo进行最小长度为100bp的重叠群的组装,随后使用BLAST软件将这些重叠群与向日葵叶绿体基因组进行比对(将其用作参考基因组),并将进行比对的重叠群按照参考基因组进行排列。材料和方法•其二:•先使用BLAST从原始的质量筛选后的片段中捕捉叶绿体片段,并使用向日葵、小油菊、银胶菊、莴苣和烟草的叶绿体基因组作为参考。随后,这些捕捉的片段再通过使用SOAPdenovo组装成最小长度为100bp的重叠群,接着,通过与向日葵叶绿体基因组进行比对,将短的重叠群拼接成长的重叠群。•最后,对照向日葵基因组使用原始片段的连贯序列来代替denovo重叠群之间的缺口,剩余的缺口通过使用PCR以及Sanger测序来进行填补。材料和方法•叶绿体基因组的注释是是基于可用的在线程序DOGMA来进行的。tRNA基因的鉴定使用的是DOGMA和默认设置下的tRNAscan-SE。内含子位置的确定使用了向日葵叶绿体基因组中的内含子作为参考。叶绿体基因的功能分类参考了叶绿体基因组数据库。•环形的cp基因图谱的绘制使用了OGDRAW软件。•为了证实组装和注释的正确性,我们对大单拷贝区域和反向重复序列以及小单拷贝区域和反向重复序列之间的连接处进行了PCR以及测序来验证。材料和方法TableS1.Primersusedforgapfillingandassemblyvalidation.Primer*Sequence(5’3’)Ampliconsize1F:AGTTACTAATTATGATCTGGCATGTR:ATAGCAATGAGATTCCCCAA5792F:TGGGGAGAAATGACAAGAR:TTTATCTTATTATTAATCACGGA10893(IR1/LSC)F:TGTTGACCTAAAGCGTATR:TGAACCCTGTAGACCATC4634(LSC/IR2)FAAGCGTTGGCTAGGTAAGR:TAGCCAAGTGGATCAAGG8965(IR2/SSC)FCCAGGGCTATGGAACAAAGR:AAACCACAACGACCGAAT6526(SSC/IR1)F:CTCGCTAACATTGAACTTGGR:ACCTCCCGTTCTTCATACTT660*Primerpairs1and2wereusedtofillthegapsoftheassembledgenome;Primerpairs3-6wereusedtoverifythejunctionsbetweentheIRsandSSC/LSCregions.材料和方法•③与菊科其它植物叶绿体基因组的比较以及标记的鉴定•使用mVISTA软件来将紫茎泽兰cp基因组与菊科其他物种(包括向日葵、莴苣、银胶菊、小油菊和新疆千里光)进行比对。所有的在六个基因组中进行比对发现存在分歧的区域均被提取出来用于标记的鉴定。这些区域均使用手动调整过的ClustalW软件进行了比对。•为获得这些区域的信息位点,使用最大简约法构建了系统发育树,所用软件为Mega4.0。简约信息位点、一致性指数(CI)以及保留指数(RI)的值也同样被计算了出来。材料和方法•④重复结构以及序列分析•使用TandemrepeatFinder软件进行了串联重复的分析。•使用REPuter对散在重复序列进行了鉴定和定位,包括正向重复和回文重复,设置重复的一致性要大于90%(汉明距离3),长度要大于30bp。•在软件分析过后,我们对少于15bp的串联重复序列以及REPuter的冗余结果进行了手动剔除。材料和方法•⑤系统发育分析•选取了33个代表了被子植物所有家系的物种的cp基因组。•选用了35个蛋白质编码基因:atpA,atpB,matK,petA,petB,petD,petG,petN,psaA,psaB,psbA,psbB,psbC,psbD,psbE,psbF,psbH,psbI,psbJ,psbK,psbN,psbT,rpoB,rpoC1,rpoC2,rps8,rps11,rps14,ycf3,ndhA,ndhD,ndhH,ndhF,rpoA以及rbcL。这35个基因在这33个叶绿体基因组中普遍存在。材料和方法•序列通过ClustalW进行了比对。最大简约(MP)分析使用了PAUP*4.10。•使用PhyMLv3.0进行了最大似然(ML)分析。•使用了萍蓬草属和睡莲属作为外群。结果和讨论•①测序及基因组装配•使用Illumina测序技术,我们获得了16,977,743个51bp长度的原始序列,包括11,117,985个唯一序列,筛选后获得了11,617,950条结果清晰的序列。随后我们比较使用了两种方法来对短片段进行装配:•第一种:使用SOAPdenovo法直接进行富集,获得了12,161个重叠群,大小100到14,932bp,这些重叠群以向日葵的叶绿体基因组为参照进行排列,213个重叠群与参照基因组具有同源性。将排列的重叠群按照参照基因组的顺序进行了整理。使用此方法获得了一段长为145519bp的序列草图。结果和讨论•第二种方法是先从原始的质量筛选后的序列中捕捉叶绿体序列(在材料与方法中有介绍),总共获得了1,815,199条叶绿体基因组序列,总长度达90,759,950bp,为向日葵叶绿体基因组的510.66倍。随后,通过使用SOAP对获得的片段进行富集,得到了了190个重叠群,长度为100bp到8,810bp不等。这些重叠群按照向日葵叶绿体基因组进行了整理和排序。最后获得了一个长度为149,899bp的基因组草图。结果和讨论•为了确定哪一种方法更好,把以上两个基因组草图与向日葵、莴苣、小油菊的叶绿体基因组进行了比对。序列比对发现两种方法富集得到的序列之间有95%的序列具有一致性,且第二种方法富集得到的基因组草图包含了一些第一种方法中缺失的区域。结果和讨论•与向日葵叶绿体基因组相比,本研究中的基因组草图仍含有两处缺口。使用PCR以及Sanger测序对缺口进行了补全,由此得到了一个完整的150,698bp的紫茎泽兰叶绿体基因组。•为了对富集结果进行验证,使用PCR对反向重复序列之间以及大/小单拷贝区域间的连接区域进行了扩增并进行了Sanger测序。我们将测序的结果与富集得到的基因组进行了直接比对,没有发现错配或者插入缺失,这就证实了富集结果的正确性。结果和讨论•②基因组内容及组织方式•紫茎泽兰叶绿体基因组大小与其它被子植物相当。其叶绿体基因组GC含量为37.5%,这一点与已报道的其它菊科物种的叶绿体基因组相一致。大小单拷贝区域的GC含量分别为35.8%和30.1%,在反向重复序列中该值为43.0%。结果和讨论结果和讨论•紫茎泽兰叶绿体基因组包含有80个蛋白质编码基因,其中七个(rps19,rps7,rpl23,rpl2,ycf2,ndhB和ycf15)在反向重复序列中存在重复。•此外,基因组中分布着有编码全部20种氨基酸的28个tRNA基因(1个发现于SSC,20个发现于LSC,7个发现于IR中)。•在该基因组中还鉴定出了4个rRNA基因,位于反向重复序列中。结果和讨论总的来说,紫茎泽兰叶绿体基因组中存在130个基因,其中14个基因(8个蛋白质编码基因以及6个tRNA基因)含有一个内含子,3个基因(rpoC1,ycf3,clpP)含有两个内含子。结果和讨论•在这17个含有内含子的基因中,有12个位于LSC之中(包括8个蛋白质编码基因和4个tRNA编码基因,其中9个含有一个内含子,3个含有两个内含子),4个位于IR中(两个蛋白质编码基因和两个tRNA编码基因,均只含一个内含子),1个位于SSC中(单内含子)。•rps12是一个反式拼接基因,其5'端的外显子位于大单拷贝区域而其重复的3'端外显子位于反向重复序列中。•trnK-UUU有着最大的内含子(1,559bp),其中含有另一个基因matK。结果和讨论结果和讨论编码内容蛋白质tRNArRNA比例49.56%2.32%5.94%•除此之外,剩下的42.18%为非编码区域,其中包含了内含子、基因间隔区以及假基因。结果和讨论结果和讨论•③与菊科其它植物叶绿体基因组的比较•这种序列长度上的变异可能主要是由大单拷贝区域和反向重复序列间的长度差异导致的。另外,研究也发现紫茎泽兰的叶绿体基因组有着六个物种之中最长的LSC以及最短的IR。新疆千里光(150,689bp)莴苣(+2.07kp)小油菊(+0.77kp)向日葵(+0.4kb)紫茎泽兰(150,698bp)银胶菊(+2.1kp)结果和讨论•菊科多个植物叶绿体基因组的获得提供了一个从基因组水平来比较菊科物种序列变异的机会,使用VISTA软件以注释后的紫茎泽兰叶绿体基因组为参考计算了前述六个菊科物种叶绿体基因组的序列同源性。•尽管在这些基因组之间发现了一些分歧区域,整个序列的排列显示菊科植物叶绿体基因组具有相当
本文标题:入侵物种紫茎泽兰的叶绿体全基因组分析
链接地址:https://www.777doc.com/doc-6501202 .html