您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 基因组分型技术的发展和应用
中国科学C辑:生命科学2008年第38卷第10期:900~906基因组分型技术的发展和应用施锦绣,王莹,黄薇*国家人类基因组南方研究中心,上海市-科技部共建疾病与健康基因组学重点实验室,上海201203*联系人,E-mail:huangwei@chgc.sh.cn收稿日期:2008-10-03;接受日期:2008-10-08国家杰出青年基金(批准号:30625019)和上海市青年科技启明星计划(批准号:08QA14053)资助项目摘要伴随着人类基因组计划、人类单倍型图谱和人类拷贝数变异图谱的完成,基因分型技术获得了长足的发展,同时促进了对复杂性状疾病的研究.本文结合国家人类基因组南方研究中心的发展和研究项目,介绍了目前国际上广泛应用的几种基因分型技术,及国内外复杂性状疾病遗传研究的突破和进展.关键词单核苷酸多态性拷贝数变异复杂性状疾病从古至今,人类一直在探索疾病的相关知识.1986年,人类基因组的第一个完整的限制性片段长度多态(restrictionfragmentlengthpolymorphism,RFLP)图谱绘制完成,这是人类的第一张分子遗传图谱,标志着人类疾病发生机制的遗传学研究进入了一个新的阶段[1].而后,微卫星位点(shorttandemrepeat,STR)代替了RFLP[2].此时,基于家系连锁分析的疾病遗传学机制研究占据了统治地位.1996年,Risch和Merikangas指出,通过对一般人群进行病例-对照研究,即关联分析,对捕获变异基因具有更高的效力[3],因而提出了构建人类基因所有变异图谱的全球计划,人类单倍型图谱计划得以启动.随着人类单倍型图谱的完成[4,5],单核苷酸多态性(singlenucleo-tidepolymorphism,SNP),即单个核苷酸的变异所引起的DNA序列多态性,因其数量众多和易检测性,成为新的主要的遗传标记.目前,公共数据库内已有超过九百万的SNP[6].人类拷贝数变异图谱的完成[7],标志着拷贝数变异(copynumbervariation,CNV)正在逐渐成为另一个越来越受到关注的遗传标记[8].CNV被定义为超过1kb的DNA序列,相对于参考基因组,具有不同的拷贝数,其中包括缺失、插入及其他较为复杂的变化.与此同时,基因分型的方法也在不断发展.从繁琐低通量的单链构象多态性(singlestrandconforma-tionpolymorphism,SSCP)[9],变性梯度凝胶电泳(denaturinggradientgelelectrophoresis,DGGE)[10],到自动化高通量的生物芯片技术,使得我们发现和鉴别DNA序列上多态位点的工作变得快速而准确.不同遗传标记中,适合高通量、自动化分型的多态主要是SNP和CNV,因而近年来迅猛发展的基因分型技术主要是基于SNP检测的分析技术.国家人类基因组南方研究中心(简称南方中心)成立之时,正是人类基因组计划STR遗传图谱绘制完成并开始被世人所认识的重要时期.利用微卫星的全基因组分型技术,南方中心遗传学研究部联合国内各临床学科,广泛开展了中国人群疾病易感基因的全基因组定位研究,在鼻咽癌[11]、肝癌、高血压、糖尿病、自身免疫性疾病、皮肤病等复杂性状疾病的遗传易感性研究中取得了令人鼓舞的成果.与此同时,南方中心遗传学研究部还积极参与国际合作项目,承担了人类单倍型图谱计划中21号染色体的图谱构建工作,并籍此建设、发展和完善了我国基因分型技术平台,包括Illumina生物芯片技术,TaqMan技术和SNPstream基因分型系统等.在此,本文将结合900中国科学C辑:生命科学2008年第38卷第10期国家人类基因组南方研究中心的发展和研究项目,简要介绍几种近年来发展的检测技术及复杂性状疾病遗传研究的突破和进展.1基因分型技术的革新与发展目前基因分型技术主要是针对SNP的检测分析,其原理包括目标DNA片段的扩增及扩增产物通过质谱、荧光或化学的方法进行测定,从而获得SNP的位点信息[12].但是,即便同样是对SNP的检测,根据样本的多少和每个样本上所需检测SNP的多少,人们必须采用不同的技术平台,以获得昀佳的“投入产出比”.1.1高通量的基因分型技术高通量的基因分型技术主要为基于各种基因芯片的技术;其制作是将大量已知序列的DNA探针,采用特殊方法固定在厘米见方的硅芯片或玻片上,以此获得高密度的DNA探针阵列,然后通过杂交获得SNP分型的信息.具体的检测技术包括:DNA探针阵列的构建、待测样品的准备、杂交及杂交信号的检测分析.代表性产品主要有下列两大类:(1)IlluminaBeadarray的SNP分型技术系统包括全基因组分型的Infinium技术和自定义芯片的GoldenGate技术.DNA探针阵列的构建是利用微珠芯片技术[13,14].Infinium技术无需PCR,不受内切酶的位点限制,在单管反应中获得高得率和精确度的实验数据.GoldenGate技术具有高度灵活的特点,它根据实验者的需要在一个样品里同时检测96,384,768或1536个SNP,是昀早生产的用户特制芯片代表性产品.两种技术的原理见图1().(2)Affymetrix公司是利用原位光刻专利技术,生产高密度寡核苷酸基因芯片[15].其GeneChip系列芯片昀新产品是AffymetrixGenome-WideSNPArray6.0.这张芯片上富集超过906600个SNP和超过946000个用于检测拷贝数变化的探针,探针高密度且均匀地覆盖整个基因组.样品准备及检测原理见图2.1.2中等通量的基因分型技术与高通量基因分型技术主要在基因组中心使用,用于大量样本的“全基因组基因分型”不同,中等通量的基因分型技术可在各个层次使用,目的一方面是候选基因验证的相关分析,另一方面多数是在走向临床前的大规模样本检测这样的转换研究.为此目的,很多公司致力于该技术的改进,目前已有较多很好的发展.其中较常用的主要有ABI公司的TaqMan技术,Beckman公司的SNPstream,Sequenom公司的时间飞行质谱等.(1)TaqMan技术的原理是合成一对能与PCR产物杂交的探针.这对探针序列仅区别于多态性位点.这对探针的3端连有荧光粹灭剂,5端分别有2种不同的荧光染料.在PCR扩增过程中,利用Taq酶5核酸外切酶活性降解与目标序列完全互补的探针,使荧光剂与粹灭剂分离而发出荧光.如果探针与目标序列间存在错配,就会大大减少荧光的释放量.TaqMan探针技术昀突出的优点是不需要分离或洗脱等PCR后处理过程,从而提高了检测速度[16,17].(2)SNPstream基因分型系统是一套自动化的多重SNP分析系统,在特制384孔板的每个微孔中可分析12个或48个SNP位点.检测SNP位点的引物由2部分组成,3端是能与模板互补的部分,约20~25个碱基的长度,5端是20个碱基的尾段序列,与微孔中的核苷酸序列互补.当引物与待检测的PCR片段杂交后,在靶SNP位点处单碱基延伸.延伸后的产物随后被带有与尾段互补的核苷酸序列的微矩阵芯片捕获并检测[18].(3)时间飞行质谱系统是目前唯一采用质谱法直接检测SNP的设备,主要步骤包括碱基延伸,样品离子化和离子化样品的质量分离三个部分.该系统反应体系为非杂交依赖性,不存在潜在的杂交错配干扰,不需要各种标记物,因而其突出特点是能以极高的精确度快速进行基因型识别,直接测出带有SNP或其他突变的目标DNA[19,20].基因分型技术仍然在向着更高通量,更高准确性和更低廉成本的方向不断发展.在全基因组测序技术的费用下降到足够低廉之前,基因分型技术将是研究复杂性状疾病的主要技术手段之一.与此同时,如SSCP,DGGE,DHPLC等技术,在筛查特定基因的突变或多态中仍旧有其重要作用.901施锦绣等:基因组分型技术的发展和应用图1Illumina芯片技术原理(a)GoldenGate原理图.该方法的原理是根据SNP两侧已知DNA序列设计上下游引物,检测每个SNP需要3条寡核苷酸引物:两条上游引物,P1和P2,覆盖同一位点,分别代表二态SNP中的一种等位基因型;一条下游引物,P3.这3条寡核苷酸都包括与基因组DNA互补的区域和与通用PCR引物配对的序列.下游探针还包含一段特异性“标志”序列,能与BeadArray中特定类型珠子上的探针互补结合.当3条寡核苷酸引物与少量的基因组DNA样品杂交时,上游引物P1和P2的3末端碱基与SNP位置上碱基互补后,随即被DNA聚合酶有效地延伸到与下游引物P3的5磷酸基团毗邻,然后通过连接反应与之连接起来.这样产生的全长拷贝即成为下一步PCR循环扩增的模板.在第二步的PCR扩增中,Cy3和Cy5-标记通用上游引物P1和P2,生物素标记通用下游引物P3.PCR扩增之后,产物中由P3延伸的链被带有抗生物素蛋白的磁珠吸附从而去除,留下荧光标记的单链.然后荧光标记的单链与微阵列杂交,通过特异性“标志”序列与BeadArray中特定类型珠子上的探针互补结合.(b)Infinium技术原理.变性的DNA片段与芯片微珠上位点特异的50个碱基长度的探针退火复性.过夜杂交后,洗去芯片上未杂交的和非特异结合的DNA,以捕获到的DNA为模板,摻入特殊标记的核苷酸,进行碱基延伸反应,再通过标记物与荧光基团的免疫结合,将样本的SNP位点信息转换成可以用扫描仪检测的荧光信号902中国科学C辑:生命科学2008年第38卷第10期图2Affymetrix芯片技术原理转自GeneChip®Mapping500KAssayManual2复杂性状疾病遗传研究的突破和展望复杂性状疾病是受遗传和环境因素共同作用和/或相互作用所引起.它的遗传模式往往很难用一种固定的遗传模式来描述,且具有遗传异质性和表型异质性[21].因而,如何抽丝剥茧,寻找到真正的致病基因一直是遗传学上的难点和重点.连锁分析早在20世纪70年代,就成功应用于疾病基因的鉴定[22].第二代人类遗传图谱的完成,使得基于家系的全基因组连锁策略在单基因疾病的基因定位方面取得了巨大的成功.如南方中心参与的恒齿缺失这一孟德尔常染色体显性遗传病的研究,取得了致病基因的成功定位[23].在一个中国人家族性房颤家系的研究中,南方中心课题组与国内临床合作,通过全基因组扫描、分型以及连锁分析,在11p15.5上定位了这个房颤家系的致病基因;进一步在该区域内检测到了致病基因突变位点——一个编码钾离子通道蛋白的基因KCNQ1.这是在我国成功定位、克隆的迄今为止第一个引起家族性房颤的致病基因[24],标示了我国科学家在疾病基因组学研究上进入了一个新的高度.20世纪90年代,全球遗传学家将全基因组连锁分析广泛应用于一些复杂性状疾病的研究,例如精神分裂症[25],型糖尿病[26]等.南方中心遗传学研究课题组利用我国丰富的疾病遗传资源,在上世纪末本世纪初定位了一批重要疾病,包括肝癌、鼻咽癌、原发性高血压、型糖尿病、甲状腺疾病、皮肤病等的遗传易感基因位点和区域[11,27,28].然而,对于大多数常见疾病而言,连锁分析所取得的成功非常有限,对于那些具有较低外显率的等位基因的检测能力不强,而且一项研究的结果很难在不同人群被其他的研究重复.因而比连锁分析具有更强检测能力的关联分析应运而生.关联分析的基本原理是检验一个遗传标志物在病例组的频率是否高于对照组.如果得到阳性关联的结果,排除各种混杂之后,可以推断该标志物存在于疾病易感基因座内或者与易感基因座连锁不平衡.候选基因的关联分析,即对有限的高风险候选基因内的遗传标记进行分型,来分析其与疾病或某种表型之间的关联.候选基因方法因其经济、省时成为众多研究者的共同选择.例如,我们采用候选基因策略,在脑部神经发育和主要神经生化通路的相关基因中挑选了112个基因的1536个标签SNP,利用Illumina的GoldenGate技术平台,在26
本文标题:基因组分型技术的发展和应用
链接地址:https://www.777doc.com/doc-534841 .html