您好,欢迎访问三七文档
转录组学基本研究方法陈军chenjun@xmu.edu.cn2011.5.10上堂课内容•mRNA检测技术–核酸杂交技术–原位杂交–逆转录PCR(ReversetranscriptionPCR,RT-PCR)–RACE–全长cDNA文库–Real-timePCR核酸杂交northernblot•放射性同位素标记物α-32P-dCTP灵敏度达0.01pg•非放射性标记物地高辛灵敏度达0.1pgDIG-dUTP-----通过酶促反应掺入到DNA/RNA中去制成探针----杂交----加抗地高辛-酶的复合物—加底物—显色探针制备探测不同条件下的基因表达变化B.WITEK-ZAWADA,200328SrRNA18SrRNA•FISH:FluorescenceInSituHybridization原位杂交1原位杂交3MorozLL,2006•逆转录酶:依赖于RNA的DNA聚合酶。这种酶是1970年美国科学家特明(H.M.Temin)和巴尔的摩(D.Baltimore)分别于动物致癌RNA病毒中发现,他们并因此获得1975年度诺贝尔生理学或医学奖。逆转录(Reversetranscription)RT-PCR是将RNA的反转录(RT)和cDNA的聚合酶链式扩增(PCR)相结合的技术。首先经反转录酶的作用从RNA合成cDNA,再以cDNA为模板,扩增合成目的片段。RT-PCR•以mRNA的polyA为锚定3’RACE•原理上比3’RACE要稍微复杂•要点:逆转录酶MMLV合成cDNA具有加尾特性,即在合成的cDNA链3’加上3-4个dCTP,而且当存在帽子结构时该酶的加尾活性最高•然后以这段polyC为锚定5’RACE•Real-timePCR•转录组学基本研究方法–概念–基于测序的转录组学方法•EST•全长cDNA文库•生物信息学分析–基于杂交的转录组学方法•基因芯片•生物信息学分析本堂课内容•Ct:thresholdcycleReal-timePCR基本原理SYBR-Green荧光染料标定dsDNA•理论上N1/N2=2^ΔCt•实际上PCR扩增的效率并非100%ΔCtN1N2什么是转录组、转录组学•转录组(Transcriptom):细胞所包含mRNA的总和。与基因组不同的是,转录组的定义中包含了时间和空间的限定。•转录组学(Transcriptomics):研究细胞在某一功能状态下所含mRNA的类型与拷贝数;比较不同功能状态下mRNA表达的变化,搜寻与功能状态变化紧密相关的重要基因群。转录组学的研究方法•基于测序:全长cDNA文库、EST文库、SAGE•基于杂交:cDNA芯片(GeneChip,microarray)•基因表达聚类cDNA文库•cDNA:为具有与某RNA链呈互补的碱基序列的单链DNA即complementaryDNA之缩写。•以mRNA为模板,经反转录酶在体外反转录成cDNA,与适当的载体(常用噬菌体或质粒载体)连接后转化受体菌,则每个细菌含有一段cDNA,并能繁殖扩增,这样包含着细胞全部mRNA信息的cDNA克隆集合称为该组织细胞的cDNA文库。全长cDNA文库构建EST•90年代初CraigVenter提出了EST的概念,并测定了609条人脑组织的EST,宣布了cDNA大规模测序的时代的开始(Adamsetal.,1991)。•EST(ExpressedSequencetags,表达序列标签)是从已建好的cDNA库中随机抽取克隆,从5’末端或3’末端对插入的cDNA片段进行一轮单向自动测序,所获得的约60-500bp的一段cDNA序列。●1993年前EST数据收录于GenBank,EBI和DDBJ。●1993年NCBI(NationalCenterofBiotechnologyInformation)建立了一个专门的EST数据库dbEST来保存和收集所有的EST数据。●95年中期GenBank中EST的数目超过了非EST的数目。●现在GenBank中EST的数目已经超过了三千五百万,约占GenBank中序列数的60%.GrowthofdbEST051015202530354019931994199519961997199819992000200120022003200420051-Jun-06YearNumberofESTs(millions)EST相关数据库储存EST原始数据的一级数据库◆EMBL◆GenBank(dbEST)◆DDBJ◆UniGene()◆TIGRGeneIndices()◆STACK()对EST进行聚类拼接的二级数据库EST已经被广泛的应用于基因识别,因为EST的数目比GenBank中其它的核苷酸序列多,研究人员更容易在EST库中搜寻到新的基因(Boguskietal.,1994).●在同一物种中搜寻基因家族的新成员(paralogs)。●在不同物种间搜寻功能相同的基因(orthologs)。●已知基因的不同剪切模式的搜寻。【注:不过很难确定一个新的序列是由于交替剪切产生的或是由于cDNA文库中污染了基因组DNA序列(Wolfsbergetal.,1997)】EST的应用1:EST与基因识别因为EST序列是从某特定组织的cDNA文库中随机测序而得到,所以可以用利用未经标准化和差减杂交的cDNA文库EST分析特定组织的基因表达谱。标准化的cDNA文库和经过差减杂交的cDNA文库则不能反应基因表达的水平。◆CGAP为研究癌症的分子机理,美国国家癌症研究所NCI的癌症基因组解析计划(CancerGenomeAnatomyProject,CGAP)构建了很多正常的或是癌症前期的和癌症后期的组织的cDNA文库,并进行了大规模的EST测序,其中大部分的文库未经标准化或差减杂交处理。CGAP网站提供了多种工具用以分析不同文库间基因表达的差异,如:●DigitalGeneExpressionDisplayer(DGED)●cDNAxProfilerEST的应用4:利用EST大规模分析基因表达水平EST技术流程:一、cDNA文库构建◆非标准化的cDNA文库的构建。(可用于基因表达量的分析)◆经标准化或扣除杂交处理的cDNA文库。(富集表达丰度较低的基因)◆Oligod(T)cDNA文库。(非翻译区由于不含有编码序列,与编码区保守序列相比所受到的选择压力比较小,因而其多态性程度比较高,便于多态性位点的选择以用于遗传图谱的构建。)◆随机引物cDNA文库。(所获得的EST在基因功能的鉴定时具有更多的信息含量,并且在构建EST数据库时更有优势,同时有利于利用EST数据库聚类完整的基因和阅读框的寻找,便于利用更敏感的蛋白质比较来寻找同源基因。)二、序列测定及数据分析随机挑取克隆进行5’或3’端测序序列前处理聚类和拼接基因注释及功能分类后续分析EST软件平台EST序列库/序列的质量检查测序量监控聚类和拼接检查(借助于基因组信息)全长ORF寻找发现全长基因研究表达基因概况的主要实验手段(DNAchip、proteomics的先驱)功能分类表达量分析SAGE的先驱交替剪接检测EST特有信息测序方向的选择根据不同的实验目的选择不同的测序方向:◆5’端5’上游非翻译区较短且含有较多的调控信息。一般在寻找新基因或研究基因差异表达时用5’端EST较好,大部分EST计划都是选用5’端进行测序的,而且从5’端测序有利于将EST拼接成较长的基因序列。◆3’端3’端mRNA有一20-200bp的plyA结构,同时靠近plyA又有特异性的非编码区,所以从3’端测得EST含有编码的信息较少.但研究也表明,10%的mRNA3’端有重复序列,这可以作为SSR标记;非编码区有品种的特异性,可以作为STS标记.◆两端测序获得更全面的信息。基因注释及功能分类注释:◆序列联配Blastn,Blastx◆蛋白质功能域搜索(二结构比对)PfamInterproscan较好匹配InterproScanNtBlastnESTsequencesNrBlastx完成注释无理想匹配较好匹配完成注释无理想匹配较好匹配无理想匹配Newsequences域的注释后续分析常用的基因注释流程◆手工分类大部分以Adams95年的文章中的采用分类体系为标准。【Adams.MD,etal.Initialassessmentofhumangenediversityandexpressionpatternsbasedupon83millionnucleotidesofcDNAsequence.Nature.1995377(6547Suppl):3-174】◆计算机批量处理利用标准基因词汇体系GeneOntology,进行近似的分类(分子功能、生物学过程、分子组分)。()◆基因产物直系同源簇的分析(COG:ClusterofOrthologousGroupsofproteins)()基因功能分类表1:家猪脂肪组织的已知基因功能分类表2:猪脂肪组织与猪胚胎胸腺组织和猪甲状腺组织表达谱的比较参考文献:1、猪脂肪组织表达序列标签(ESTs)大规模测序及分析邓亚军等,遗传学报,Vol.31,NO.11,20042、两种家猪心脏组织基因表达谱的分析曾燕舞等,遗传学报,Vol.31,No.6,2004EST的代谢途径分析(KEGG)后续分析◆比较基因组学分析◆基因表达谱分析◆新基因研究◆基因可变剪切分析◆实验验证►MicroArray►GeneChip►RT-PCR►Northernblotting◆EST很短,没有给出完整的表达序列;◆低丰度表达基因不易获得;◆由于只是一轮测序结果,出错率达2%-5%;◆有时有外源的mRNA污染或是基因组DNA的污染;◆有时出现镶嵌克隆;◆序列的冗余,导致所需要处理的数据量很大。EST数据的不足基因芯片SpottedMicroarraysØcDNAArraysØOligoArraysInSituOligoSynthesisØPhotosynthesisØPlanersurfaceØMicrofluidicschipØE-fieldsynthesisIntegratedChipsØIntegrateduF,microarrayanddetectionchipswithPCR,fluorescenceore-detectionMicrofluidicsØPlasticsØCeramicsØSiliconØOthermaterials不同的生物芯片技术平台点样芯片原位合成芯片微流体芯片整合型芯片基因芯片的探针TaggedRNAfragmentsflushedoverarrayLaseractivationoffluorescenttagsOpticalscanningofhybridizationintensities基因芯片的杂交实验点样芯片非接触式接触式点样芯片•预先合成探针Oligo探针(GoArrays)PCR产物探针(Primegens)•点制芯片预先合成好的探针通过类似于喷墨打印机的技术喷射到玻璃基片表面,或者用针头点在片基上。芯片探针的设计•PCR产物设计软件(Primegens)•Oligo芯片设计软件(GoArrays)点制过程SelectivelyexposearraysitestolightFlushchip’ssurfacewithsolutionofprotectedA,C,G,TAffymetrix基因芯
本文标题:转录组学研究方法
链接地址:https://www.777doc.com/doc-5070687 .html