您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 个体的力量(全基因组研究为单细胞生物学开启新的维度)
每个细胞都是特殊的:全基因组研究为单细胞生物学提供了另一个维度单细胞分析为研究异质性,信号转导,以及随机基因表达提供了无比珍贵的了解手段。最近的技术进步打开了全基因组单细胞研究的大门Introduction从全体单细胞生物到复杂的组织,细胞与细胞间在基因型和/或表型特征上的变异似乎是普遍存在的。为了研究异质性及其生物学影响,研究者们用过低通量(low-throughput)方法——比如荧光指示剂,以及荧光原位杂交技术(FISH)——这些方法可以测定单细胞中为数有限的几个参数。另外一方面,基因组技术可以提供高通量方法,并且现在已被世界各地的实验室所用。但是到目前为止,基因组技术还是依赖于对总体均值的研究,总体均值是将成千上万的细胞集中在一起而得来的,摒除了对细胞与细胞间变异的全基因组分析。现在,测序技术及分子生物技术的进步正在引导单细胞全基因组定量分析的出现,也因此将基因组生物学与单细胞生物学集合到了一起(Figure1)。我们讨论用大规模,全基因组技术对细胞间变异性进行研究的重要性,同时特别突出了技术上的突破,以及单细胞生物学的新前沿。细胞个体间的变异可源自基因差异,发育及功能状态,以及环境信号。即使是在基因完全一样的细胞群中,调控分子波动以及随机的基因表达也可以引起细胞个体相对于群体平均值的显著偏离。我们也描述了在这些不同水平上研究单细胞异质性的方法及其选择性的应用(selectedapplications)。基因差异是细胞异质性的来源之一基因差异毫无疑问是细胞变异性的最根本的基础。对单细胞中的全基因组DNA测序是一个挑战,在样本中取出的DNA有限的情况下,比如在单细胞的情况下,为了确保初始物质足够多得可以用来测序,全基因组扩增法通常十分重要。但是,扩增的误差会使基因组覆盖率不能达到最佳。多重置换扩增(Multipledisplacementamplification,MDA)先用随机六碱基引物(hexamer,原意为六聚物)与变性DNA进行退火,然后进行DNA产物的等温链置换合成(Deanetal.,2002)。多重退火环状循环扩增技术(MALBAC,Zongetal.,2012)是一种全基因组扩增的新技术,有可能更进一步地减少误差,办法是确保扩增产物不会成为扩增的新模板,从而实现拟线性的扩增。但是从单细胞DNA测序中能有什么收获呢?我们简单讨论一下几种有吸引力的应用。最近,Rinkle等人(2013)用MDA技术从3300个,未经培养的单个微生物细胞中获取了基因组信息,这些细胞取自不同的地方。他们对其中一部分细胞做了16SrRNA分析,得以发现了新的系统发育关系,以及预料之外的代谢能力,这种代谢能力可能是由远古时期真核生物与古生菌发生了侧向的基因转移所致。肿瘤是由各种遗传异质性的细胞类型组成的。Navin等人(2011)利用一种新的全核分离及测序技术确定了取自乳腺癌样本中的细胞个体间的拷贝数变异,并识别出截然不同的细胞群,这些细胞群可能跟细胞克隆扩张时产生不同的方向(separatewaves)有关。重要的是,作者在分离细胞之前,将肿瘤在大体上分成几个不同的部分,从而得以保留空间信息,并测定这个克隆结构在空间上是如何变异的。单细胞基因组还被用于研究单个生殖细胞的同源重组。通过在同源染色体间同源重组在生殖细胞个体中产生了唯一的杂合单倍型。Wang等人(2012)对单个精细胞的全基因组扩增,利用微射流做并行全基因组扩增处理(Usingmicrofluidicsforparallelizedwhole-genomeamplificationofsinglespermcells),从而在91个人类精细胞中绘出了重组位点。在粗略的层面上,作者发现的重组位点分布类型,与过去对谱系数据做的群体水平分析(population-levelanalyses)所得出的类型是一样的。但是,更为详细的分析揭示出了个体特异性重组热点,并使得研究者可以对种系新生突变率进行直接测定。在一项体细胞嵌合型的研究中,McConnell等人(2013)在单细胞水平上研究了神经元中的拷贝数变异,这些神经元是从人诱导多能干细胞及死后人体大脑中取出的。与以前的大数量实验相比,发现少见拷贝数变异的能力是单细胞分析的一个重要优势。作者发现神经元与其它细胞类型相比,拷贝数变异明显更高,其缺失比复制更频繁。神经元中的拷贝数变异可能在功能多元化中起作用的设想十分有趣。但是,人类神经元中的嵌合拷贝数变异的生理学影响目前仍然不清楚。全基因组单细胞技术也为了解细胞核的组织带来了很大的希望。通过对大细胞群的总体均值进行研究,染色体构象捕获(3C)已经展示出了染色体折叠的一些基本原则。但是,到目前为止对细胞核组织的单细胞分析仅有可能用显微镜完成,并受限于选定的基因位点。通过发展3C技术的单细胞变体技术,Nagano等人(2013)发现了T辅助细胞中染色体内及染色体间接触阵型(contactformation)的大量细胞间变异性。尽管受相对稀松的基因组覆盖率限制,单细胞实验的平均结果还是与总体研究吻合得很好。在本技术的一项有趣的应用中,作者用他们的单细胞染色质相互作用数据重建了X染色体的完整3D拓扑结构。表型状态及发育状态是细胞异质性的来源之一多细胞生物由不同类型的细胞组成,这些细胞有着同样的基因组DNA,但表现出相当不同的形态及表型特性。对细胞个体的转录组分析是单细胞生物学的一个主要焦点。人们已经用微阵列,高通量实时PCR联合微射流技术做过单细胞表达分析实验,而不久之前,又用上了单细胞RNA测序技术(RNA-seq)Guo等人(2010)将并行实时PCR(paralizedreal-timePCR)做了一次有趣的应用,分析了从小鼠胚胎的单细胞期到64细胞期之间,500多个细胞中48个基因的表达情况。作者识别出了三个不同谱系(滋养外胚层,原始内胚层,以及上胚层)的早期标志物,并发现在早期,细胞中三种谱系的标志物共同表达。谱系的特化似乎是通过对应谱系的转录因子下调来进行的,而不是特定转录因子的上调。作者用一种被称之为主要成分分析(PCA)的数学方法(Figure.2A)以区别64细胞期的不同表型细胞群,在该期时,3个细胞谱系已经可以被清楚识别出了。之后这种方法使他们得以识别出细胞谱系特化的早期标志物,并显示出桑椹胚中,早期标志物的表达在细胞内和细胞外是显著不同的,确定了它们在早期胚胎图式形成中的作用。Buganim等人(2012)用同样的高通量方法研究了细胞重编程的动态情况,方法是分析数千个细胞中48个基因的表达情况,这些细胞是在不同的时间点上从克隆细胞群中提取出来的。作者识别出了重编程的两个截然不同的时期,较早的“随机”期和较晚的“分级”期,并发现了能预测重编程已经成功的基因。利用Bayesian网络分析,作者从实时PCR数据中直接推断出了控制着重编程晚期的转录网络的拓扑结构。重要的是,这个网络的结构被基于单分子RNAFISH(Rajetal.,2008)的共表达分析及经过基因修饰的细胞谱系所证实。大规模实时PCR允许研究者对数千个细胞中许多基因进行分析。但是,在这类分析中,全部基因组不能被一次性探测出来,这意味着研究者必须在假说或假设的基础上选择感兴趣的基因。单细胞RNA测序的优势是可以提供全基因组信息,从而能够无偏差地,完整地描述细胞群中转录的异质性。人们已经发表了一些单细胞RNA测序的方法(reviewedinShapiroetal.,2013)。在Surani实验室做的一项开创性研究中,在源自细胞个体的细胞裂解液中,研究者利用oligo-dT引物直接进行了逆转录(Tangetal.,2009)。然后用PCR对cDNA文库进行扩增,分段,做成标本进行深度测序。但是,这一方法有两个重要的缺陷:当应用在大量细胞时,此法很贵;还有PCR扩增可以引起mRNA计数上的偏差。最近的两份出版文献解决了第一个问题,即利用单细胞条形码来实现倍增(Hashimoshonyetal.,2012;Islametal.,2011):在逆转录期间向mRNA分子加入细胞特异性条形码。倍增的费用接近全转录覆盖的费用,因为这类技术限定于从mRNA的5端或3端进行测定(Multiplexingcomesattheexpenseofwholetranscriptcoveragebecausethesetechniquesarelimitedtosequencingeitherthe50or30endofmRNAs)。对第二个问题,有人提出通过离体转录的线性扩增可能是减少PCR误差所致技术性噪音的一种办法(Hashimshonyetal.,2012)。用随机条形码与引物结合来进行逆转录是另一种有希望的选择(Kivojaetal.,2012)。建立在全转录覆盖基础上的应用,比如用来发现基因同工型,需要能够减少3端误差的方法(例如,通过使用模板开关来减小误差)(Picellietal.,2013)。Shalek等人(2013)将单细胞RNA测序做了一次非常有意思的应用,研究了从小鼠骨髓中取得的树突细胞对脂多糖反应的异质性。作者发现细胞对脂多糖反应的多种生物模式。利用PCA,他们识别出了密切相关而又有所区别的亚群。这些亚群分别属于不同成熟状态的细胞。然后他们通过计算所有单个细胞的诱导基因的成对相关性,识别出了属于同一调控分子的基因簇(Figure.2C)。对这种分析识别出来的共同调控基因,作者使用实时PCR及FISH进行了选择性地确认,从而对调控线路的系统性识别和全基因组识别提供了重要的原理验证,这种识别是基于单细胞RNA测序的。这些实验仅仅基于18个细胞,我们预测这一技术上的进步,以及测序费用的降低,将会使得大量细胞测序成为可能,使得人们对细胞分化程序及调控分子有更详细的了解。然而,在单细胞RNA测序工作可靠,并且现在被常规运用时,单细胞蛋白质组学还落在后面。单细胞质谱流式细胞技术(single-cellmasscytometry,Bendalletal.,2011)使用被重金属标记的特殊抗体,可以并行发现单个细胞中大量的蛋白质。与截然不同的各种过渡元素的同位素结合的抗体被结合到其抗原决定基上。然后细胞个体在一种浆液(plasma)中被汽化及电离,元素离子被基质辅助激光电离解吸飞行时间质谱(time-of-flightmassspectroscopy)观察到。尽管与基于荧光的流式细胞技术相比,这种方法的敏感性较低,但这种新方法有能力同时发现数量多得多的不同蛋白质,并因此可以对细胞状态进行更为详细的分析。相邻捆绑试验(Proximityligationassay)是将两种受唯一DNA标记序列标记的抗体与同一种蛋白分子结合,使得标记序列可以被滚环扩增,这使得通过光镜或下一代测序技术对多倍数量的蛋白质进行观察成为可能(Leuchowiusetal.,2013)。随机基因表达是细胞异质性的来源之一基因的表达本质上是随机的。mRNA结构及蛋白质产物的随机波动在细胞群中造成了异质性,而这些细胞群在其它方面是一样的(RajandvanOudenaarden,2008)。研究同一类型细胞的随机基因表达需要对上百个细胞进行分析,同时也要精确定量。目前为止,所需的细胞数量及精度是全基因组技术达不到的。因此,使用的是基于影像的技术,比如单分子FISH或GFP技术。我们预计在不久的将来,对基因表达杂音的全基因组分析会成为可能,我们讨论一下这类分析数据的两种可能的应用。mRNA或蛋白分子的分布情况,可以用来理解基因的调控。如Figure.2B所述,一种启动子“开/关”状态间的转变率(transitionrate)对mRNA拷贝数量的分布有直接的影响。因此,对mRNA分布进行定量全基因组测量,将会产出一些参数,这些参数是描述启动子功能的。对选定基因的单细胞基因表达数据进行精确定量分析已经揭示了这种方法阐明基因调控的潜力(Neuertetal.,2013)。尽管对单个基因的mRNA拷贝数量分布进行分析,可以提供有关启动子开关状态动力学的
本文标题:个体的力量(全基因组研究为单细胞生物学开启新的维度)
链接地址:https://www.777doc.com/doc-2795849 .html