您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 管理学资料 > 数量性状的分子标记(QTL定位的原理和方法讲义)
数量性状的分子标记(QTL定位的原理和方法讲义)作物中大多数重要的农艺性状和经济性状如产量、品质、生育期、抗逆性等都是数量性状。与质量性状不同,数量性状受多基因控制,遗传基础复杂,且易受环境影响,表现为连续变异,表现型与基因型之间没有明确的对应关系。因此,对数量性状的遗传研究十分困难。长期以来,只能借助于数理统计的手段,将控制数量性状的多基因系统作为一个整体来研究,用平均值和方差来反映数量性状的遗传特征,无法了解单个基因的位置和效应。这种状况制约了人们在育种中对数量性状的遗传操纵能力。分子标记技术的出现,为深入研究数量性状的遗传基础提供了可能。控制数量性状的基因在基因组中的位置称为数量性状基因座(QTL)。利用分子标记进行遗传连锁分析,可以检测出QTL,即QTL定位(QTLmapping)。借助与QTL连锁的分子标记,就能够在育种中对有关的QTL的遗传动态进行跟踪,从而大大增强人们对数量性状的遗传操纵能力,提高育种中对数量性状优良基因型选择的准确性和预见性。因此,QTL定位是一项十分重要的基础研究工作。1988年,Paterson等发表了第一篇应用RFLP连锁图在番茄中定位QTL的论文。之后,随着分子标记技术的不断发展以及许多物种中分子连锁图谱的相继建成,全世界出现了研究QTL的热潮,每年发表有关QTL研究的论文数量几乎呈指数增长(图5.1),显示了该研究领域的勃勃生机。目前,QTL定位研究已在许多重要作物中展开,并且进展迅速。本章主要介绍QTL定位的原理和方法。图5.11986~1998年期间国际上每年发表有关QTL研究的论文的数量.数据从英国BIDS信息系统检索得到第一节数量性状基因的初级定位QTL定位就是检测分子标记(下面将简称为标记)与QTL间的连锁关系,同时还可估计QTL的效应。QTL定位研究常用的群体有F2、BC、RI和DH。这些群体可称为初级群体(primarypopulation)。用初级群体进行的QTL定位的精度通常不会很高,因此只是初级定位。由于数量性状是连续变异的,无法明确分组,因此QTL定位不能完全套用孟德尔遗传学的连锁分析方法,而必须发展特殊的统计分析方法。80年代末以来,这方面的研究十分活跃,已经发展了不少QTL定位方法。一、QTL定位的基本原理和方法孟德尔遗传学分析非等位基因间连锁关系的基本方法是,首先根据个体表现型进行分组,然后根据各组间的比例,检验非等位基因间是否存在连锁,并估计重组率。QTL定位实质上就是分析分子标记与QTL之间的连锁关系,其基本原理仍然是对个体进行分组,但这种分组是不完全的。根据个体分组依据的不同,现有的QTL定位方法可以分成两大类。一类是以标记基因型为依据进行分组的,称为基于标记的分析法(marker-basedanalysis;SollerandBeckmann1990);另一类是以数量性状表型为依据进行分组的,称为基于性状的分析法(trait-basedanalysis;KeightleyandBulfield1993)。(一)基于标记的分析法如果某个标记与某个QTL连锁,那么在杂交后代中,该标记与QTL之间就会发生一定程度的共分离,于是,在该标记的不同基因型中,QTL的基因型频率分布(分离比例)将不同(图5.2),因而在该标记的不同基因型之间,在数量性状的分布、均值和方差上都存在差异。基于标记的分析法正是通过检验标记的不同基因型之间的这些差异来推知标记是否与QTL连锁的。在分子标记技术出现之前提出的基于标记的分析法主要是针对单标记分析的,即每次只分析一个标记,这是因为当时可利用的遗传标记(主要是形态标记和生化标记)数量稀少,难以在一个试验群体中建立起完整的标记连锁图谱。随着高密度分子标记连锁图谱的出现,单标记分析方法暴露出了不能充分利用分子标记图谱所提供的遗传信息的缺点。为了能更好地挖掘分子标记图谱的潜力,更多、更准确地定位出QTL,科学家们相继开发出了许多新的QTL定位方法,总的趋势是朝着多标记分析(即同时用多个标记进行分析)的方向发展。根据所采用的统计遗传模型,现有的基于标记的分析方法大体上可分成四类,即:均值差检验法、性状-标记回归法、性状-QTL回归法及性状-QTL-标记回归法。这些方法的原理将在后面分别介绍。图5.2DH群体中某QTL的基因型QQ和qq在连锁标记基因型MM和mm中的频率分布(分离比例).r为标记与QTL间的重组率.仅当r=0.5(亦即标记与QTL间没有连锁)时,QQ和qq在MM和mm中的频率分布才相同(二)基于性状的分析法虽然数量性状在一个分离群体(如DH群体)中是连续变异的,但如果淘汰大多数中间类型,则高值和低值两种极端表型的个体就可以明确地区分开来,分成两组。对每个QTL而言,在高值表型组中应存在较多的高值基因型(如QQ),而低值组中应存在较多的低值基因型(如qq;图5.3)。如果某个标记与QTL有连锁,那么,该标记与QTL之间就会发生一定程度的共分离,于是其基因型分离比例(频率分布)在两组中都会偏离孟德尔规律(图5.3)。用卡平方测验方法对两组或其中一组检验这种偏离,就能推断该标记是否与QTL连锁。图5.3基于性状的分析法和分离体分组混合分析法的原理.在DH群体中,与QTL连锁的遗传标记的两种基因型的分离比例在高值组和低值组中都会偏离1:1的孟德尔分离规律,其电泳带型在高值组DNA和低值组DNA间也会表现出差异,且分别与高值亲本和低值亲本相似还有一种更简单的做法,就是将高值和低值两组个体的DNA分别混合,形成两个DNA池,然后检验两池间的遗传多态性。在两池间表现出差异的分子标记即被认为与QTL连锁(图5.3)。这种方法称为分离体分组混合分析法(BSA法;DarvasiandSoller1994;参见第4章)。基于性状的分析方法(特别是BSA法)的突出优点是,可以大幅度减少需要检测的DNA样品的数量,从而降低分子标记分析的费用。它特别适合于对一些抗性(包括抗病、抗虫、抗逆)性状的基因定位,这是因为,抗性鉴定试验常常造成敏感个体(基因型)的死亡,只有具有抗性的个体才能够存活,于是只能对表现抗的极端个体进行分子标记分析,这正好符合基于性状的分析法。基于性状的分析法的缺点是,它只能用于单个性状的QTL定位,且灵敏度和精确度都较低,一般只能检测出效应较大的QTL。因此,基于性状的分析法目前用得不多,主要还是采用基于标记的分析法。下面着重对基于标记的分析法进行介绍。二、均值差检验法均值差检验法的基本思想是检验同一标记座位上不同基因型间数量性状均值的差异,若差异显著,则表明被检标记与QTL连锁。单标记均值差检验法包括t测验法(Simpson1989)和方差分析法(Solleretal.1976;李维明等1993)。凡是每个标记只有两种基因型的群体(包括BC、DH、RI)都可以使用t测验法。以DH群体为例,由图5.2可知,当某个标记与一个QTL连锁时,两种标记基因型(MM和mm)的性状均值(MM和mm)分别为:qqQQMMrr)1((5.1)qqQQmmrr)1((5.2)式中,QQ和qq分别是QTL基因型QQ和qq的表型均值,r为标记与QTL间的重组率。比较式(5.1)和(5.2)可以看出,仅当r=0.5,亦即标记与QTL没有连锁时,才有MM=mm(qqQQ2121);而只要r0.5,亦即标记与QTL间存在连锁,则总有MMmm。而且,r值越小,标记与QTL间连锁越紧密,则MM与mm之间的差异就越大。当r=0,亦即标记与QTL之间完全连锁时,标记基因型间的均值差异达到最大,这时有MMmm=QQqq。因此,用t测验方法检验两种标记基因型间的数量性状表型均值差异是否显著,就能推断该标记是否与QTL连锁。t值越大,即显著性越高,则连锁越紧密。如果群体中每个标记存在3种基因型(如F2群体),或者尽管群体中每个标记只有两种基因型(如DH、RI群体),但试验中设置了重复(李维明等1993),则可以采用方差分析的方法来检测标记与QTL之间的连锁关系。以F2群体为例。假设某个标记与一个QTL连锁,采用与图5.2类似的推导方法,可以得到3种标记基因型的性状均值分别为:qqQqQQMMrrrr22)1(2)1((5.3)qqQqQQMmrrrrrr)1()]1(21[)1((5.4)qqQqQQMMrrrr22)1()1(2(5.5)式中所用符号的含义与式(5.1)和(5.2)的相似。比较式(5.3)~(5.5),可以看出,与上面DH群体的情形相似,仅当标记与QTL间的重组率为5.0r,亦即标记与QTL间没有连锁时,才有MM=Mm=mm(qqQqQQ412141);而只要r0.5,亦即标记与QTL间存在连锁,则总有MMMmmm。因此,用单因素方差分析法检验3种标记基因型间的性状均值差异是否显著,就能推知该标记是否与QTL连锁。标记与QTL间连锁越紧密,则标记基因型间均值的差异就越大,方差分析中F测验得到的F值也越大(即显著性越高)。单标记均值差检验法的优点是简单直观。一般而言,标记离QTL越近,它与QTL间的重组率就越小,则其t值或F值就越大;反之,标记离QTL越远,它与QTL间的重组率就越大,则其t值或F值就越小。因此,根据染色体上各个标记的t值或F值的大小,可以大致判断出QTL的位置。但是,单标记均值差检验法不能估计QTL的具体位置和效应,灵敏度较低,且一般不适用于一条染色体上存在多个QTL的情形。当两个QTL呈相引连锁(即两增效基因连锁在一起或两减效基因连锁在一起)且相距不太远时,由于两QTL的效应相互累加,可能会使得位于两QTL之间的标记表现出最大的t值或F值,从而导致无法识别那两个真实QTL,却错误地认为在它们之间的某个位置上存在一个QTL。这个推断出的QTL显然是虚假的,是一个“幻影QTL”(ghostQTL)。相反,当两个QTL呈相斥连锁(即一个增效基因与一个减效基因连锁在一起)且相距不太远时,由于两QTL的效应相互抵消,可能会使得两QTL附近的标记表现出很小的t值或F值,从而无法检测出这两个QTL。由于这些局限性,目前单标记均值差检验法仅用于对数据的初步分析。对单标记均值差检验法的一种改进方法,是将同一条染色体上各标记的t测验或方差分析联合于一个回归分析之中,称为联合定位法(jointmapping;WuandLi1994,1996a,b)。下面以DH群体为例来说明联合定位法的原理,它也适用于BC和RI群体。至于F2群体的联合定位法,读者可参阅Wu和Li(1996b)。从式(5.1)和(5.2)可以得到:))(21(qqQQmmMMr(5.6)令y=MMmm,x=1–2r,b=QQqq,则式(5.6)可写成bxy(5.7)可以看出,式(5.7)形式上恰好是一个截距为零的一元线性回归方程。假设Haldane作图函数成立(参见第三章),则有)1(||02.021QMzzer(5.8)或||02.0QMzzex(5.9)式中,zM和zQ分别是标记和QTL在染色体上的位置,以厘摩(cM)为单位。在完整的标记连锁图上,每个标记的位置都是已知的。因此,在式(5.9)中,只有QTL的位置zQ是未知的。当zQ值给定时,x也就确定了。如果一条染色体上有n个标记,那么在zQ值给定的情况下,就有n对观察值:(yi,xi),i=1,2,…,n。这样,就能应用最小二乘法配合方程(5.7)。沿着整条染色体以一定步长(如1cM)改变zQ的值,必能找到某一点(Qzˆ),使方程(5.7)配合得最好(即剩余平方和RSS达到最小;图5.4)。那么,该点(Qzˆ)即为QTL位置的估计值,而得到的回归系数bˆ即为QTL效应的估计值。需要指出的是,由于同一条染色体上的标记互相连锁,因而不同观察值yi(i=1,2,…,n)之间不是相互独立的。因此,应使用广义最小二乘法来配合方程(5.
本文标题:数量性状的分子标记(QTL定位的原理和方法讲义)
链接地址:https://www.777doc.com/doc-3445803 .html