您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 市场营销 > LECTURE-5-种下数据分析方法
种下数据分析方法DataAnalysisatIntraspeciesLevel黄原2010-3主要内容1.大进化与小进化的联系与区别2.用于种下研究的分子标记和数据类型3.种下遗传多样性和分化参数及应用4.种下系统发育分析及应用5.种界确定1.大进化与小进化的联系与区别进化模式不同大进化=种上分类单元进化:树状分歧进化为主。种间由于生殖隔离和突变以及分歧导致有完全不同的基因型的固定,从而形成非重叠的基因库(non-overlappinggenepools)和相互的单系性(reciprocallymonophyleticlineages)。小进化=种下进化:网状形式的进化种内群体内/间的个体因随机交配有发生重组的机会,从而使个体的基因谱系呈现网状关系(reticulatingrelationships=tokogeny)。种间树状进化遗传分歧种内网状进化遗传多态性研究内容的区别种下研究(1)群体遗传结构(populationgeneticstructure)(2)群体分化(populationsubdivision)(3)谱系生物地理学(phylogeography)(4)分子进化动力(theforcesofmolecularevolution)(5)个体/群体/亚种系统发育关系(individuals/populations/subspeciesphylogeneticanalysis)种上研究(1)种界确定(speciesboundarydelimitation)(2)分类单元单系性检验(testingtaxamonophyly)(3)系统发育关系重建(phylogeneticrelationshipamongtaxa)(4)性状进化(characterevolution)研究方法的区别采用分子标记不同抽样策略不同(Samplingstrategy)数据分析方法不同MoleculesandtheirusefulrangesinphylogeneticrelationshipsSpeciesGeneraFamilyOrderClassDivisionsSpacers[its]mtDNANurDNATaylor,etal.,1991;moresufficientstatisticallysignificantresults;sufficientstatisticallysignificantresults2.用于种下研究的分子标记和数据类型分子标记SNPSSRRAPDAFLP单核苷酸多态性SNP:singlenucleotidepolymorphismsSNP是指由于单个核苷酸的变异所引起的DNA序列多态性。Asinglebasechange,occurringinapopulationatafrequencyof1%istermedasinglenucleotidepolymorphism(SNP).Whenasinglebasechangeoccursat1%itisconsideredtobeamutation.微卫星MicrosatellitesDesignprimersto“flankingregions”微卫星基因分型原理Li(1998).随机扩增多态性DNARAPD:randomlyamplifiedpolymorphicDNARAPDprofileofDNAfrom23samplesAFLP:amplifiedfragmentlengthpolymorphismDigestionofDNAwithtwoenzymesLigationofadaptersPrimerscomplementarytoadaptersandto3’regionofsomeofthefragmentsAFLPGel分子标记的性质显示方式:共显性(codominant)标记可以识别所有的等位基因,包括杂合子和隐性等位基因。显性(dominant)标记只能识别显性等位基因,无法区分杂合子和隐性等位基因的纯合子。座位数目:单座位(singlelocus)标记可以识别等位基因。多座位(multipleloci)标记一般无法识别等位基因。遗传方式父系遗传标记YChromosomeHaploid,noneorlittlerecombination1.9×10-9~5.4×10-9persiteperyear母系遗传标记MitochondrialDNAHaploid,noneorlittlerecombination3.5×10-8persiteperyear双亲遗传标记nDNADiploid,undergoesrecombination基因型与基因分型(genotypeandgenotyping)一个个体在某一座位上所拥有的一对等位基因类型被称作基因型(genotype)。检定个体在特定座位上的基因型的方法被称作基因分型(genotyping)。单倍型与单倍型分型haplotypeandhaplotyping单倍型是指在一条DNA上多态性的分子标记的不同等位基因之间的组合。单倍型分型:单倍型分型方法对于位于Y染色体或mtDNA以及男性X染色体上的任何标记,每种基因型均为单倍型。对于位于常染色体及女性X染色体上的标记,如果研究的座位为纯合子,则可以直接得到单倍型;如果研究的座位为杂合子,则得到2个联合的单倍型。可以通过3种方法获得单倍型。二倍体标记的单倍型分型方法从二倍体的基因型推导单倍型的方法:等位基因分离法:等位基因特异性PCR;克隆法;体细胞杂交法。统计推论法:Clarck算法;最大似然法;贝叶斯法。家系分析法:单倍型块HaplotypeBlocks染色体在一代代的传递中同源片段发生重组,多代之后祖先染色体片段的原有排布已被打乱。那些没有被重组打破的区域相互间被重组区域隔开,这些区域就是单倍型块。单倍型块的长度一般为3~92kb。人类基因组的65%-85%是以单倍型块方式组织起来的.识别单倍型的意义构建基因树的基础识别致病基因理解重组和LD模式单倍型的起源与进化位于Y染色体和mtDNA上的单倍体分子标记无重组,因而单倍型多样性仅仅是由于突变产生。二倍体分子标记的单倍型的起源有突变和重组二种原因。如果重组是随机发生的,则n个等位基因可以有2n种单倍型。任何2个标记之间发生重组的可能性取决于它们的相互距离和位置。不同座位的等位基因之间由于重组降低而导致的association称为连锁不平衡(linkagedisequilibrium,LD)。3.种下遗传多样性和分化参数及应用物种遗传变异程度的度量测量遗传变异参数的方法随所研究标记的类型和遗传方式而异。一般地,物种的遗传变异可以从三个方面来描述:遗传多样性:遗传变异的量遗传分化:遗传变异在群体之间的分布遗传距离:遗传变异在成对群体之间的数量。遗传多样性遗传多样性通常用于描述生物学实体(个体,群体和物种)内存在的遗传变异。杂合度和多态性水平是2个在个体、群体和物种3个水平上定量描述多样性的参数。广义的多样性包括2个组分:丰富度(richness)和均匀度(evenness)。前者测量变异的数量,后者指示变异的分布。等位基因丰富度的测量1等位基因多样性(allelicdiversity)或丰富度(allelicrichness):每个座位上出现的等位基因数量的平均值。计算时也包括单态座位。可以以群体或物种为单位计算。2多态座位百分数:当一个座位上最常见的等位基因的频率〈0.95时该座位称多态座位。多态座位的定义是人为的,在当代文献中,只要表现出任何水平的变异就认为是多态座位,而并不特别强调0.95或0.99的标准。3多态座位的平均等位基因数(meannumberofallelesperpolymorphiclocus):计算方法同上但不包括单态座位。4平均观测杂合度(meanobservedheterozygosity,Ho):在所观测的座位上杂合子的数量占所有检测座位的比例。该参数广泛用于二倍体生物的共显性标记中,显然,单倍体生物是无杂合性可言的。当用于多倍体生物时对数据的解释须十分谨慎。该参数对显性标记不适合,因为无法识别出杂合性的个体。5平均期望杂合度(ExpectedheterozygosityHe),是根据哈温定律所估算的期望值:He=1/mΣΣPij(1-Pij)M:基因座总数N:各基因位上的等位基因数Pij:第i个基因座的第j个等位基因的频率。Nei’s基因多样性参数(genediversitystatistics)基因多样性首先由Nei(1973)提出,通常被看作是期望杂合度(expectedheterozygosity)。Nei(1973)提出的基因多样性的计算:HT为总的期望杂合度,¯p为k个等位基因中的第i个在所有群体中的平均频率。基因多样性被广泛使用,但该参数也存在缺陷。如其值在0-1之间变化,随着一个座位上的等位基因频率接近相等时,它变得不灵敏,此外,该参数严重依赖于2个最常见等位基因的频率。211ikTiiHp单倍体基因组的考虑单倍体基因组的标记在计算基因多样性参数时也用同样的方法,如计数单倍型的数目。对于单倍体标记独特的参数是计算单倍型多样性(haplotypediversity)。群体遗传分化的度量1Nei’sGST2Wright’sF-statisticsNei’sGST总遗传多样性(HT)是以期望的总杂合度来度量的。HT可以分解成存在于群体内部的基因多样性部分HS和存在于群体间的基因多样性的部分DST(Nei,1973)。即HT=HS+DSTHS为每一群体内的期望杂合度的平均值,即其中p为每个群体中第k个座位上的第i个等位基因的平均频率(在所有群体中的均值)。多样性指数HT、HS、DST可以用于计算遗传分化参数GST,GST定义为群体之间相对于群体混合后(即总群体)的基因多样性,Nei(1973)称为基因分化系数(coefficientofgenedifferentiation):GST=DST/HTGST值在0~1之间变化,当HT=HS时GST=0,表示等位基因频率在所有群体中相同,群体之间没有遗传分化;当HS=0时GST=1,亦即群体内部无变异,而每个群体都固定了不同的等位基因,因而群体达到了最大的分化,所有检测的变异都分布在不同的群体中。在动物中,活动哪里强的鸟类的GST值是脊椎动物中最低的;同样能够飞行的昆虫是无脊椎动物中最低的。211ikSiHpWright’sF-statistics多样性指数HT、HS也可以用于计算每个个体的平均观测杂合度HI,也可以用于F-统计值来分析群体的遗传结构。Wright描述的HT和HS分别是在假定处于哈代-温伯格平衡时的全部群体的总的期望杂合度和群体内的平均期望杂合度,因而Wright和Nei对HT和HS的定义是不同的,尽管他们二人所使用的符号和计算公式相同。Wright基于在个体、群体和总群体(totalpopulation)3个水平上的变异情况提出3种分析方法。Wright’sF-statistics近交系数FIS定义为随机交配下群体内观测杂合度与期望杂合度之间的偏离值,即FIS=(HS-HI)/HS=1-HI/HSFIS可当做一个种群内个体之间的近亲交配程度的指标:如果Ho=He,则FIS=0,群体为随机交配。如果Ho<He,则FIS>0,近亲交配。如果Ho>He,则FIS<0,远亲生殖(outcrossing)。Wright’sF-statistics固定指数FST定义为在自然选择和遗传漂变作用下群体内的杂合度与总群体杂合度相比的下降值,即FST=(HT-HS)/HT=1-HS/HTWright’sF-statistics整体近交系数(theoverallinbreedingcoefficient)FIT定义为由于亚群体内(FIS)或群体分化(popu
本文标题:LECTURE-5-种下数据分析方法
链接地址:https://www.777doc.com/doc-5191495 .html