您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 项目/工程管理 > 为基因定位而发展的INDEL标记依赖于大豆的基因组重测序
为基因定位而发展的INDEL标记依赖于大豆的基因组重测序主标题:用INDEL标记在大豆中进行基因定位关键词:大豆,基因组重测序,NITEL标记,褶皱叶突变体,基因定位摘要大豆是世界上重要的农作物,在本研究中,一个中国本地大豆栽培中黑豆21,被用下一代测序技术重测序进而发展NITEL(插入,缺失)标记为了基因定位。在黑豆12和威廉82的参考序列中,共发现了49276个NITEL多态性和2420590个单核苷酸多态性。其中,长度在5bp-50bp之间的243个候选NITEL标记被选择用于PCR验证,其中的165(68%)个展现出了核苷酸多态性现象,在黑豆21和威廉82之间。对NITEL标记的验证测试在其他12中大豆品种间也进行了。在14个大豆品种间进行了两辆比较后,多态性数量在27-165之间。为了测试NITEL标记的功用,它们被用于一个褶皱叶片突变体的基因定位,褶皱叶片的基因座被成功定位到了7号染色体的一个36kb的区域。研究表明高通量基因组测序技术能够促进广泛的基因组分子标记的发展,为了大豆的基因定位。引言栽培大豆是能提供大量蛋白和油的一种经济作物。大豆的大部分农业特征是被量化的,包括产量,质量,对环境胁迫的抵抗。大豆有多于46430的蛋白编码基因,接近75%都以多同源染色体的形式存在。大豆基因的复杂性让我们很难对其基因功能展开研究。为所关注的基因型发展足够的分子标记是非常重要的,它能被用于定位和标记协助的选择物(MAS)。然而,大多数可利用的分子标记都是基于大众研究品种的多态性。在新的本地品种和研究的栽培变种间对多态性的筛选能够扩大分子标记基因的范围,这些分子标记基因能够促进大豆基因的研究。整个基因测序工程为传统的基因定位带来了重大改变。NGS技术为植物和动物的基因测序打开了新的天地,为能被用于基因育种和基因研究的基因标记的发展提供了低成本的测序数据。通过NGS技术,丰富的基因标记揭露出了单核苷酸多态性,单核苷酸多态性被用于基因研究,因为他们相对简单的技术。在人类和植物中,继单核苷酸多态性之后,NITEL多态性是第二个最丰富的基因变异。它们在基因组中无处不在,与单核苷酸多态性的发生一样频繁,在长度上有更多的多样性,并且依据它们的长度能被简单的区别出来。之前,NITEL被用于强大的分类诊断和系统发育,而现在,它们变得非常流行,作为基因标记用于谷物中基因定位或其他研究。随着大豆基因组信息的公布,大豆基因组被以空前的速度测序出来。数以百计的野生和栽培的大豆品种基因组被发表出来。NITEL能被从大豆基因组中简单的发现。大量的大豆分子标记,包括RFLPs,AFLPs,SSRsandSNPs已经被收集到了大豆基地中。黄文博检查了23个大豆栽培种或系以及一个野生种的1238个SSR等位基因的差异。宋创建的BARCSOYSSR数据库包括33065个SSR有很高的可能性包含核苷酸多态性。这些多态性对于大豆育种和大豆遗传作为DNA标记的来源来说,是一个有用的工具。海顿为合成的地图增加了额外的2500个单核苷酸标记,为QTLs建立了一个通用的连锁专门小组,通过对一个降低的表型文库的重测序,使通用的连锁专门小组有1536个单核苷酸多态性。通过对4个栽培种和2个野生种重测序,宋发展了SoySNP50K系。最近,Leeetal(2015)从48种大豆的全基因组重测序中鉴定了超过4百万的高质量SNPs,并且创造了包含180,961SNPs的AxiomSoya序列。相比较于SNP标记在大豆中所取得巨大进步,在公共数据中关于LNDEL的记录却非常少,因此利用NGS数据信息来填补这片空白是非常必要的。何豆12在中国山东省是一个广泛种植的大豆栽培种。因其高效且稳定的产量,几十年来已经成为中国大豆多样性鉴定的参考栽培种。田间产量产量超过4000kg/ha,高产记录是4531.5Kg/ha,在中国是一个相当高产的栽培种。它也可以抗大豆花叶病毒,Phytopythora,megasperma,和Penonosporamanschurica.何豆12的r射线突变种群有超过6000独立系列,从2008到2014年在我们实验室已经合成出来,在这个种群中,有2742个可见的突变体被检测到。为了鉴定这些突变体的突变基因,可靠的锚定标记系统用于未来基因图谱研究。在这份研究中,我们通过NGS重测序了何豆12,并且鉴定了大量LNDEL和SNPs用全基因组重组测序数据,在初步图谱中发现了一小部分INDEL作为锚定标记。通过这些标记,发现皱叶突变体的突变位点已被成功定位在7号染色体的一小段区域。材料和方法植物材料14个大豆栽培种被用于INDEL多态性鉴定,包括9个中国品种来自于7个省,和5个美国品种。9个中国品种是Hedou12,jilin35,wandou28,jindou21,fendou33,shidou111,andou1311,zhanghuang30和zhoudou30.5个美国品种是williams82,jack,essex,forrest和HVE。皱叶突变体是从hedou12的r射线的突变群中筛选的。这个突变体与野生hedou12回交4代来纯化基因背景,用于更深入的分析。一个纯合突变体与williams82杂交,F1子代种植在山东师范大学田间。从F2代突变体开始分离,依据基因型进行收集。通过jaderetal的体系作出皱叶的图谱。在IlluminaHisea2000平台上重测序Hedou12.从单个植株叶片器官中提取hedou12的染色体组DNA,利用Biorupgter声振来生成200-600bp的DNA片段,产生的片段是平末端,连接上适配器,用1.0%的琼脂糖凝胶选择。利用IlluminaHiseq2000平台纯化和重测序350-600bp的片段。从插入了400+/-100bp大小的双末端中生成了100nt长的序列。使用Qscore方法将低质量的读段删除或修剪,Qscore方法是在phred范围20和读段大小60bp,参考基因组的纯化数据仅3个不匹配,这个基因组是Williams82使用Burrow-WheelerAligner软件从phytozome挽回的,应用SAMtools版本时,INDELs和SNPs被使用,仅INDELs满足以下所有标准被保留:a:readdepth区域5b:最小映射质量≥20C:参考或变体等位基因没有Nd:仅一个变体等位基因存在。INDEL标记的选择预先制图时,195个INDELs作为标记分布在20个染色体上。为了把制图和标记做好,我们运用电位测试了INDEL标记。为了把INDEL标记筛选做好,我们在3个区域选择了48个INDEL。在3个区域:Gmo1,Gmo2,Gm11上包含37.3Mb。选择INDEL是5bp到50bp长度,是为了在聚丙烯酰胺凝胶电泳之后清晰可辨。PCR引物设计时,phytozome收集INDEL的上游和下游序列。设定的引物大小为18bp到30bp,并且GC含量为40%~60%。前面的引物和后面的引物之间,Tm最大不同为3℃。在聚丙烯酰胺凝胶电泳之后,根据引物和多行型可读性,PCR产品大小为100bp到600bp。DNA提取和INDEL标记分析使用DNeasyPlantMinikit提取DNA,在一个10ul容积中,100ng的模板DNA被放大,此反应容积包括0.5UTaq聚合酶,1xPCR缓冲液(具有2.0MmMg2+)100uMdNTP和每个引物为0.5uM.PCR条件如下:94℃3min;然后94℃30s;54℃~58℃30s;72℃30s,这三部进行35个循环,最后为72℃5min,用一个12﹪的原生聚丙烯酰胺凝胶电泳将PCR产品分开,凝胶用EB染色5min,在紫外分析仪下显现和拍照。反向PCR在一个25ul的反应容积中,2ug基因组DNA在65℃20min被分解,此反应容积由4份20个单位的EcoR1(NER)组成缓冲液3h制备而成,在一个200ul反应容积中,这个分解的DNA被相互连接在一起,此反应容积由80个单位的T4连接酶(NEB)组成的缓冲液整夜22℃制备而成,然后加20ul3MNaAc和500ul乙醇到反应容器,12000rpm离心8min,干燥沉淀物,使用50ulDDW分解DNA,PCR反应条件和上述描述的一样,但延长2min,逆转录PCR引物是OL2578(GGACTACCAGATCTCTAGCAGGC)和OL2579(ATGAAGAAGTTGCTCGTCTATTGTG)。逆转录PCR对于引物证实的结果是OL2623(AACATATTCCTGGCTGACATCAG)和OL2624(CATATTTAACTGGTCGGTGAAGC)。聚类分析与数据访问14号的栽培种的聚类分析是通过MEGA5.21来执行的。关于hedou12和williams之间的indels与snps的信息是储存在SoyBase。().结果与讨论hedou12和williams之间的indels识别Hedou12基因组的测序产生429767262个读数,对应有42gb未加工的序列数据。在质量控制后,有333.6百万有效读数被记录,对应有32.3序列数据。使用BWA软件设置默认参数,27.1gb(占有效数据83.8%)与Williams82基因组对齐,覆盖了参考序列(一个30.3×测序深度)91.7%。使用SAMtools软件,有49276候选的indels与242059snps被召集在hedou12和williams82参考序列之间。被检测到的49276indels,有43个在hedou12上是杂合子,49233是纯合子(29586缺失与19647插入)。被检测到620indels位于不锚定序列支架(29141缺失与19472插入).关于hedou12和williams参考序列之间的242059snps的插入与与缺失对于两品种的遗传作图也是有用的工具。图表1A表示着穿插在20号大豆染色体的插入与缺失的频率。在每条染色体上检测到的indels的数目是1466到3397(图表1B)。48613indels中的23545被分布在中心体周围(中心体周围区域的信息是从大豆基因组浏览器上收集的。网址()。这基因组的平均密度大约是每Mb有52.4个indels。5bp的插入与缺失最为常见(4,397和7,477案例,各自的),然而长一点的插入与缺失比较罕见。hedou12和williams之间的indels多态性的验证我们用PCR扩增来证实hedou12和williams之间选择的indels标记。候选indel标记的243引物设置,有237能产生可靠的产物,剩下的6个不能扩增任何pcr产物。237个被验证的标记中有165个有如预测那样的清晰多态性,剩下的则是产生了同样长度的pcr产物或者不是预测的多态性。这有效的165标记被分布贯穿在整个基因组上(图表3)。有效插入缺失标记的范围是每条染色体的4—24位点。这些有效插入缺失标记包括132锚定设计标记和来自三条染色体的37.3Mb区域的33标记,为筛选测试插入缺失标记的有效性,从而获得精细的基因图谱。在精细的分析中,我们分别在Gm01,Gm02,Gm03上获得了18,9,和6有效插入缺失标记。我们在大的和精细的标记的成功率中没有发现不同。这样的结果表明,插入缺失标记在锚定标记和精细图谱标记中都可以使用。关于插入缺失标记的信息,包括引物序列,PCR产物大小,物理位点,在tableS1提供。栽培大豆中插入缺失多态性的表型165有效的插入缺失标记在其他的12种栽培大豆中也被检测到,包括8中国品种,金林35,豌豆28,金豆21,分豆33,市豆111,安豆1311,中黄30和周豆30,和四个美国品种,Jack,Esssex,Forresthe和HVE。在14个评估的栽培种中,插入缺失标记的多态性在TableS2
本文标题:为基因定位而发展的INDEL标记依赖于大豆的基因组重测序
链接地址:https://www.777doc.com/doc-2729064 .html