您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 基于SNP的连锁不平衡分析
药物基因组学教研室基于SNP的连锁不平衡分析刘智广药物基因组学教研室主讲内容一、单核苷酸多态性二、连锁不平衡分析三、单体型分析四、应用举例药物基因组学教研室一、单核苷酸多态性(singlenucleotidepolymorphisms,SNPs)1.SNPs概念5SNPs指染色体DNA序列中的某个位点由于单个核苷酸的变化而引起的多态性,在群体中的频率1%。SNPSNPAACACGATCCGCCATGATATCAGTGACCGTAAACACGATTCGCCATGATATCAATGACCGTA药物基因组学教研室SNPs的基本类型5SNPs属于二等位基因,有两种基本类型:转换:嘧啶置换嘧啶C-T嘌呤置换嘌呤G-A颠换:嘧啶与嘌呤互换C-A(G-T)C-G(G-C)T-A(A-T)5转换:颠换=2:1GpC岛SNPs发生率较高,约占总SNPs25%,主要是C-T。可能胞嘧啶是最易发生突变位点;且大多数是甲基化的,自发脱氨基形成胸腺嘧啶。药物基因组学教研室2.SNPs的特点5数量多、分布广:一个个体至少携带300万SNPs,平均300-1000pb有一个SNPs。有学者推测基因组约有1000万个SNPs。5相对稳定:每一代中每个核苷酸变异频率极低(10-8),且这种变化的随机性。5易于快速筛查和基因分型:SNPs的二态性标记,非此即彼。有利于实现高通量、自动化的筛查和分析。药物基因组学教研室3.SNPs的基因型5人体除性染色体外,每个染色体都有两份,个体所拥有的一对等位基因的类型称作基因型。5例如,一SNPs(A/G),则个体在该位点的基因型则:AAAGGG5检定个体的基因型,被称作基因分型。AAAGGG药物基因组学教研室基因型与表现型5表现型(表型):指由不同基因型与环境共同作用,而生物体可观测到的物理或生理性状(如疾病)。5寻找基因型与表现型的关系是遗传学的基本目标。基因型环境表现型(疾病)药物基因组学基因型药物(耐药、不良反应)药物基因组学教研室4.SNPs可用于发现致病基因6大部分SNPs都不具有这种功能性的变异,但是可以作为寻找致病基因的标志(路标)。SNPs等位基因导致疾病的突变携带者发生疾病的风险↑SNP1?致病基因?SNP2?SNP8在这…致病基因药物基因组学教研室6为了寻找致病基因所在的区域,可以将病人和正常人的SNPs等位基因的频率进行比较。某些等位基因频率比正常人高这些SNPs可能与该疾病相关SNPs-疾病相关性提示:致病基因可能存在于SNPs所在的染色体区域药物基因组学教研室5.SNPs分析:基于实验的分析方法未知SNPs温度梯度凝胶电泳(TGGE)变性梯度凝胶电泳(DGGE)单链构象多态性(SSCP)变性高效液相色谱检测(DHPLC)限制性片段长度多态性(RFLP)随机扩增多态性DNA(RAPD)发现含有SNP的DNA链:测序已知SNPs突变错配扩增检验实时定量PCR技术焦磷酸微测序技术荧光偏振光技术基因芯片技术SNPs的实验分析方法可用于基因型的分析药物基因组学教研室SNPs分析:基于公共数据库的方法5利用数据库中的大量序列信息,采用生物信息学软件,用计算机自动识别,是发现SNPs的新策略和重要方法。5与癌症和肿瘤相关的候选SNP数据库:适于生物医学研究的SNP数据库:人类SNP数据库:药物基因组学教研室SNP1(A,a)SNP2(B,b)二、连锁不平衡分析(一)连锁不平衡概念(一)连锁不平衡概念连锁不平衡(linkagedisequilibrium,LD),又称等位基因关联,是指同一条染色体上,两个等位基因间的非随机相关。即,当位于同一条染色体的两个等位基因(A,B)同时存在的概率,大于人群中因随机分布而同时出现的概率时,就称这两个位点处于LD状态。药物基因组学教研室假设:位于同一条染色体相邻两个SNP:3组合方式(单体型):AB,Ab,aB:ab。3如果A与B无LD:两个SNP的等位基因相互独立,随机组合,概率为AB:Ab:aB:ab=0.25:0.25:0.25:0.25,AB组合的频率:fAB=fA×fB(等位基因频率)3如果A与B存在LD:A与B连锁,当完全连锁时概率为AB:ab=0.5:0.5,AB组合的频率fAB=fA×fB+D,(D表示两位点间LD程度)3LD定义式:D=fAB-fA×fBSNP1(A,a)SNP2(B,b)药物基因组学教研室LD的产生原因6LD是由突变或重组形成的。在染色体某一SNP附近有新的突变产生时,则LD出现。重组的发生:两位点间LD程度↓。6理论上,LD强度与2个SNP间的距离有关:距离越小:发生重组机会越小→LD强;距离越大:发生重组机会越大→LD弱。7实际上,也有距离很近不存在LD,而距离相当远(超过100kb)存在LD。1(A,a)2(B,b)药物基因组学教研室LD的度量6LD的度量一般不直接使用LD定义式,而对D进行归一化后,用LD系数D’和r2进行检验。6取值范围:0(无LD)——1(完全LD)。︱D′︳=D2/min(fAfb,fafB)(D<0)︱D′︳=D2/min(fAfB,fafb)(D>0)r2=D2/fAfafBfb药物基因组学教研室D′的意义6D’是与频率无关的量,两位点间无重组时,D’=16D’=1称为完全LD,说明两个位点间没有发生重组;两位点组成的单体型最多出现3种。6D’=0称为无LD或连锁平衡,即4种单倍型频率相等。6D’<1说明两位点间发生过重组或突变;4种单倍型均可出现;D’相对值意义模糊。D’接近1:提示:两位点间发生重组的可能性很小;D’中间值:无法比较两位点LD的差别。D’值的95%可信区间(confidenceinteeval,CI)进行比较。药物基因组学教研室D′值的95%可信区间(95%CI)695%CI:对每对SNP,采用重复采样算法(一般大于1000次),建立一个95%可信区间。695%CI的定义:区间上限值CU>0.98区间下限值CL>0.70区间上限值CU<0.90:“重组证明明显”;其余:“无提示意义”。}“强LD”药物基因组学教研室r2的意义:6r2是与频率有关的量,在两位点间无重组时,r2也不一定达到最大值1。6r2=1说明两位无重组;4种单倍型最多只能出现2种(AB,ab),且等位基因频率相同。称为完美LD:观察一个标记即可得到另一标记的全部信息。6r2=0与D’=0意义相同.6r2>0.33:提示“强LD”.药物基因组学教研室D’=0,r2=0药物基因组学教研室D’=1,r2=1药物基因组学教研室D’=0,r2=0.33药物基因组学教研室6遗传漂变:群体较小,导致群体中基因频率随机波动的现象称为遗传漂变。一般认为:群体越小,漂变效应越大→LD程度↑。6“奠基者效应”:是一种剧烈的漂变;指一个小群体从一个大群体中分离出来,并逐渐发展壮大的现象。“奠基者效应”→LD程度↑6人口增长:人口增长会降低遗传漂变,LD强度减弱。群体的增长→LD程度↓;群体的再分→LD程度↑(“奠基者效应”)。(二)影响LD的因素(二)影响LD的因素药物基因组学教研室6重组率的变化:LD程度与重组率呈反比。重组率↑→LD↓重组区域→LD↓非重组区→LD↑6突变率的变化:与重组类似,突变率↑→LD↓突变率高的SNPs间几乎无LD。6基因转换:指染色体的部分片段在减数分裂过程中转移到另一片段的过程。基因转换在人类的发生率较高。类似重组或突变,基因转换→LD↓。.基因转换对紧密相邻SNPs间的LD影响最大。药物基因组学教研室6在关联分析中,主要采用基于LD的关联分析。6将LD应用于关联研究,可定位复杂的疾病基因。如果:某因素(基因)可增加某种疾病发生风险认为:该因素与疾病相关联满足:该因素发生频率患病人群正常人群(三)基于SNP的LD关联分析(三)基于SNP的LD关联分析药物基因组学教研室1.基于LD的关联分析原理致病基因-遗传标记强LD致病基因在疾病发生中相对危险度比较遗传标记差异:患者-正常人药物基因组学教研室基于SNP的LD分析原理SNP1(A/G)SNP2(C/T)当SNP1A与疾病易患性有关强LDSNP2C频率患病群体高于对照群体观察到等位基因A:与该疾病相关单体型AC:确定了与疾病相关的风险因子药物基因组学教研室2.LD作图6LD作图是将一段基因的所有SNPs的LD关系标记在基因序列中。用来观察重组热点。6作图方法有:LD散点图(dotplot)LD矩阵图(LDmatrix)邻近LD窗口分析(adjacentLDwindowanalysis)药物基因组学教研室(1)LD散点图(dotplot)LDdecayplotofshrunken1(sh1)inmaize.以两个SNPs间的LD值与其两点间的物理距离(bp)绘图。用于观察LD与物理距离之间的关系,即SNPs间的LD延伸范围(extentofLD)LD延伸范围1.5kb(R20.33)药物基因组学教研室LDmatrixforpolymorphicsiteswithinsh1.(2)LD矩阵图(LDmatrix)52877482012675287748201267以SNPs在基因序列中的位点组成阵列,将SNPs间的LD或P值填到相应的阵列中。可直接观察LD与物理距离bp之间的关系。药物基因组学教研室3.邻近LD窗口分析(adjacentLDwindowanalysis)7方法:是将相邻SNPs(1-2,2-3…)、间隔1个SNPs(1-3,2-4,3-6…)、间隔2个SNPs(1-3,2-5,3-6…),与其对应的LD值绘制散点图再连线即可。7作用:观察强LD区域,分析推断在扫描的基因组区域潜在的重组热点(波谷或较低的LD区域)。SNP1234567药物基因组学教研室CDKN1A基因调控区21个SNPs邻近LD窗口分析发现:在~2800bp有较低的LD值及波谷;提示:在该位置可能有较高的重组率。药物基因组学教研室6单体型:一条染色体区域中所有SNPs等位基因的集合称为单体型或单倍型(haplotype)。6单体型理论数量:有n个SNP→2n个单体型。如:SNP1(A,G)SNP2(C,T)AC、AT、GC、GT三、单体型分析药物基因组学教研室LD存在,实际上只存在少数几个常见的单体型:6例如,在一段含有6个SNPs区域中,理论上应有26=64种单体型,实际上只有3种常见的单体型(频率90%)。6对1和2:4种单体型中实际只有AC和GT是常见的。123456频率…A…C…A…T…G…T40%…A…C…C…G…C…T30%…G…T…C…G…G…A20%…其他…10%药物基因组学教研室单体型块(haplotypeblock)6单体型块概念:染色体在传递中同源片段发生重组,多代之后祖先染色体片段的原有排布已被打乱,染色体形成没有发生重组的区域被重组区域相互隔开,这些没有发生重组的区域称为单体型块或单体型区域、单体型域。重组区域称为重组热点。单体型块单体型块单体型块单体型块重组区域药物基因组学教研室单体型块特点6单体型块的形成:由重组区域所致。6单体型块的大小:从lkb~数百kb;6人体之间单体型块的大小及单体型种类非常相似;6一个单体型块一般只有几个常见单体型,用几个SNP位点,就可以确定单体型块的类型。单体型块单体型块单体型块单体型块SNP关联度低:弱或无LDSNP高度关联强LD药物基因组学教研室DalyMJ,etal.High-resolutionhaplotypestructureinthehumangenome.NatGenet,2001,29(2):229例如,Daly等用103个常见SNPs(频率5%),研究250个欧洲人5号染色体上500kb范围内的单体型结构。发现:5500kb区段被分为11个单体型块;5单体型块大小
本文标题:基于SNP的连锁不平衡分析
链接地址:https://www.777doc.com/doc-4137782 .html