您好,欢迎访问三七文档
生物芯片及其应用陈欢副研究员Email:chenhuan7809@gmail.comQQ:20179430什么是芯片?内容•介绍目前主要的生物芯片类型•介绍表达谱芯片的实验过程一、生物芯片的类型•表达谱芯片•CGH芯片•芯片测序•MicroRNA芯片•ChIP-chip(ChIP-seq)•蛋白质芯片•组织芯片核酸水平非核酸水平CGH芯片工作原理CGH芯片应用(1)精确、定量地研究人类基因组微缺失和微扩增及其定位方面的应用,如肿瘤诊断,发育方面研究的应用。基因组差异的发现在双倍体生物中(假设Ratio=Cy5/Cy3,Cy5标记实验基因组,Cy3标记正常基因组)log2Ratio0.58或者log2Ratio-1则认为有差异即:Ratio=3/2或者Ratio1/2则认为有差异CGH芯片的应用(2)-产前诊断•Affymetrix公司的GeneChip®aCGH芯片CytogeneticsWhole-Genome2.7M)。采用高密度的芯片制备技术,通过改进的长探针合成技术(约49mer),覆盖全基因组约270万个标记,其中包括约40万个SNP位点,在高分辨率下实现对人类基因组的检测。该技术可发现微小缺失和扩增,还可以检测染色体中性杂合性缺失(copyneutralLOH)、单亲二体病(UPD)及嵌合现象。•Agilent2x105K芯片:每个芯片包含105,000个探针,Agilent的60mer高精确度优化探针,提供了灵敏而精确的拷贝数检测。芯片的设计针对有高置信度CNV区域,从而能用较少的数据点获得极高的检出率。•Illumina的CNV/LOH研究芯片适用于杂合性缺失(LOH)和CNV的分析。CGH芯片的应用(3)微生物进化及功能分析中的应用:原理:根据已经测序的参考基因组(referencegenome)的基因来设计探针,和待测菌株的基因组DNA杂交,就可以检测出该菌株基因组是否含有某基因。并且可以根据菌株间基因的相似度来反映其进化关系,也就是说两个菌株共享的基因越多,则两个菌株亲缘关系越近。优点:方便快捷准确;避免了同一物种的重复测序,能够节省大量的时间和经费金黄色葡萄球菌不同菌株的致病基因的组合芯片测序基因芯片的测序原理是杂交测序,即通过与一组已知序列的核苷酸探针进行杂交完成核苷酸序列测定。用图说明测序原理。在一块基片表面固定已知序列的八核苷酸探针,当溶液中带有荧光标记的核苷酸序列TATGCAATCTAG与基因芯片上对应位置的核酸探针产生互补杂交时,通过确定荧光强度最强的探针位置,获得一组序列完全互补的探针序列,据此可重组出靶核苷酸待测序列。DNA芯片测序技术包括芯片制备、样品制备、分子杂交、检测分析、序列分析和组装等过程。(Solid测序-35bp)芯片测序的特点•优点;陕速、成本低、易于自动化。•缺点:第一,由于众多寡核苷酸的组成各不相同,其最佳杂交条件难于统一,易出现假阳性和假阴性的杂交结果;第二,根据获得的数据无法准确地排列重叠序列;第三,如果检测核酸存在重复序列,那么重叠的探针不是唯一的,重组探针无法再继续。所以,这种方法不能用于含有许多内部重复和简单序列单元的DNA。但这种方法用于再测序,即确认已知的核酸序列和研究单核苷酸多态性(SNP)的检测或突变具有其他方法不可比拟的优越性。突变分析、疾病分子诊断、基因分型。MicroRNA芯片•MicroRNA芯片检测可用于发现样本间差异表达MicroRNA,从而发现调控基因mRNA转录后调控的关键因素。样本间差异基因由mRNA是否翻译成蛋白质以发挥功能,将受到差异MicroRNA的调控影响。实验表型的差异将体现在差异基因功能分布中,通过构建差异MicroRNA与差异基因功能间的相互作用网络实验流程1、小分子量的RNA提取;2、加Poly(A)尾巴;3、利用Oligo(dT)的连接作用加入荧光;4、杂交;5、图像,数据获取。ChIP-chip(ChIP-seq)ChIP-chip的基本原理是在生理状态下把胞内蛋白质和DNA甲醛作用下交联在一起,用超声波打碎为0.2-2kb的染色体小片段,然后通过目的蛋白质特异性抗体沉淀此复合物,获得特异地作用于目的蛋白结合的DNA片段,通过对目的片段的纯化与检测,从而获得蛋白质与DNA相互作用的信息。其中共沉淀的DNA和合适的对照用荧光标记,加在载玻片上,用于芯片分析。使用外源性DNA作为背景,免疫沉淀DNA与作为背景的对照进行比较,可以找到特异性蛋白在基因组中的结合位点。二、表达谱芯片介绍•cDNA芯片的合成方法•样本的处理方法•数据分析方法简介基因芯片的合成方法•原位合成芯片光蚀刻原位合成法、电化学原位合成法、喷墨式原位合成法•点样芯片针点式合成法、喷墨式合成法原位光刻合成基因芯片原理光源遮蔽板芯片arrayprobesA3×3arrayCGACGACACGAGCGAGCNucleotideDepositionSequenceACGAMask1AAAAA探针合成探针合成arrayprobesA3×3arrayCGACGACACGAGCGAGCNucleotideDepositionSequenceACGCMask2AAAAAA3×3arrayCGACGACACGAGCGAGCNucleotideDepositionSequenceACGGMask3AAAAACGACGACGAGCGAGCAC探针合成完成的芯片点样芯片•预先合成探针Oligo探针(GoArrays)PCR产物探针(Primegens)•点制芯片预先合成好的探针通过类似于喷墨打印机的技术喷射到玻璃基片表面,或者用针头点在片基上。芯片探针的设计•PCR产物设计软件(Primegens)•Oligo芯片设计软件(GoArrays)点制过程点片后检查样本的处理方法•按照样本分DNA、RNA、DNA-蛋白复合体•按照标记信号分子划分荧光燃料、生物素、放射性元素•按照标记方法分cDNA直接标记(间接标记)、PCR扩增标记、末端标记Cy3和Cy5Cy3激发波长532nmCy5激发波长635nm芯片实验流程1、分离RNA(10µg)2、标记3、杂交(预杂交)4、洗片5、扫描图像扫描Cy5Cy3D.radiodurans全基因组芯片D.radioduranswholegenomemicroarray建议1、如可取小量修饰好的玻片进行点样并测试整个后处理和杂交过程。2、一旦玻片点样后,应对小量点样玻片进行后处理,后处理是否成功可用已知应产生良好结果的RNA制备的探针进行测试来判定。3、所有阵列在杂交前应扫描一次,弃去那些有明显污点的玻片,并弃去那些杂交前背景就高的阵列。简单的数据分析主要步骤•数值提取•归一化•差异基因筛选数据读取(GenepixPro)数据框获取:1、人工获取;2、Gal文件获取Flag=-50Flag=-100GenepixPro一些直观数据背景数据的获取•局部法•全局法theglobalbackgroundvaluesareeithercalculatedfromameanormedianofalllocalvalues•阴性对照法Negativecontrolsarefeaturesthatareknownnottobereactive,sothattheycanrelieduponalwaystogivethesameintensityvaluesindependentoftheexperiment2个像素其他的信号点背景取值区Thisregionhasadiameterthatisthreetimesthediameterofthecorrespondingfeature-indicator芯片背景为什么要归一化?•由于样本差异、荧光标记效率和检出率的不平衡,需对cy3和cy5的原始提取信号进行均衡和修正才能进一步分析实验数据,Normalization正是基于此种目的。归一化的方法•一组内参照基因(如一组看家基因,外参基因)校正Microarray所有的基因、阳性基因、阴性基因、单个基因。•LowessLowessA=1/2Log2RGM=Log2R/G归一化的类型•With-inslidenormalizationglobenormalizationprint-tipnormalization•BetweenslidesnormalizationGlobenormalizationPrint-tipnormalizationBetweenslidesnormalization差异基因筛选•原理:采用cy3/cy5的ratio值对差异基因进行判断,或采用统计方法对差异基因进行统计推断。方法:倍数法:cy3/cy5比值大于2或者小于0.5•Z值法:Z=(X-μ)/σ作用:发现两个样本间的差异表达基因,便于后续分析。Z值法对于处在同一张芯片上的基因,一般我们认为只有小部分基因是有表达差异(在对芯片原始数据做标准化的时候,我们也曾提到过这个假设),同时信号比值在经过对数转换后,整张芯片上的基因比值近似于正态分布。我们计算每个基因的Z值,Z=(X-µ)/ơ,其中,X表示该基因的表达比值,µ表示整张芯片上所有基因的比值平均数,ơ表示整张芯片上所有基因的方差。当Z值大于2或者-2时表示基因表达值在平均比值加2倍方差以外,这样的差异就具有统计学意义,可以认为是差异表达基因。虽然Z值法可以帮助我们发现差异基因,但是它也有很大的缺点,如果在给定的基因内不存在差异表达基因,当我们利用Z值方法来发掘差异基因时,它总能给出Z值的绝对值大于或者小于2的基因,即增加了假阳性率。同时,当我们关于“整张芯片中只有小部分基因是有表达差异”的假设不成立,既有大量基因有表达差异的时候,Z值法又会增加假阴性率。重复实验的差异基因判别方法差异基因的筛选(t-test)CDE小结•芯片数据处理,过程不是越复杂越好(因为每一步处理都会带进新的误差);•不要执迷于软件的选择(各式各样的软件实在太多),选择通用的软件比较好(Limma,TM4);•不要过分执着于个别基因的情况,应该重视一类基因表达的模式(pattern)情况。高级数据处理•Clusteringandpatterndetection(芯片研究往往是一个动态的过程)•Discoveryofcommonsequencesinco-regulatedgenes•Linkagebetweengeneexpressiondataandgenesequence/function/metabolicpathwaysdatabases聚类的实例芯片实验往往会研究一个动态的过程,如药物处理的时间段,药物处理的浓度梯度,还有就是不同的方法处理后的差异,等等。右图--电离辐射后的细菌(D.radiodurans出现明显的生长停滞)为什么要聚类•芯片数据的聚类分析目前应用较为广泛,它根据芯片的基因表达数据(通常是经过标准化后的数据),利用相应的算法,将基因分到各个类别中。在这个阶段,我们的注意力不是集中为某几个或者某些基因的表达情况,而是发现整个转录组在一定条件下的转录模式。一般认为在同一类中的基因有相同或相似的生物学功能。聚类的基因表达谱为研究人员提供基因表达差异,启动子分析,表达模式研究等等便利的条件。NormalizeddataD.radioduransrecoveryafterionizingradiation聚类常用的软件聚类的类型•HerarchicalClusteringLinksimilargenes,builduptoatreeofall•K-means•SelfOrganizingMaps(SOM)PrincipleComponent(PCA)HerarchicalClustering中的距离计算HerarchicalClustering中的聚类的方法D.
本文标题:基因芯片及其应用
链接地址:https://www.777doc.com/doc-4258875 .html