您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学研究方法的调控
生物信息学研究方法的调控人类复杂疾病涉及多基因、多层面的复杂调控,且与环境因素、共生微生物等具有密切的相互作用。在全基因组水平准确地鉴定疾病发生过程中的组学调控变化,对从整体水平理解复杂疾病、发现新药靶、创新治疗手段具有重要意义。现代生物信息学的一个重要任务,便是立足于多层次的组学调控,发现整体层面的动态变化,并最终揭示复杂疾病的分子机制。近年来,新一代测序技术的出现极大地提高了组学研究的效率,为该领域研究创造了新机遇。首先,在基因组研究层面,发现人类疾病的遗传致病基因或易感基因,是当前遗传学研究的主要问题。针对受单基因控制的孟德尔遗传疾病,遗传学研究基于“稀有疾病,稀有突变”(rarediseaserarevariant)的理论假设,以患病家系为研究对象,有针对性地鉴定致病基因。对于此类问题,早期研究主要通过对有限个遗传标记的基因型测定,确定致病基因的大致位置,然后在候选区域内进一步精细定位致病突变。近年来,新一代测序技术的出现使低成本地实现全基因组测定成为可能,而针对基因组外显子区域的捕获和测序技术更是显著地降低了研究成本。根据该领域的最新进展,目前仅需对少数家系成员或独立的患病个体进行测序,利用生物信息学工具(如BWA等短序列回帖软件、GATK突变分析流程、Samtools软件包等)进行序列回帖、突变鉴定和个体间比较,便可以快速发现孟德尔遗传疾病的致病基因。针对复杂疾病,“共有疾病,共有突变”(commondisease,commonvariant)理论认为每个突变的致病效应较弱,但多个共有突变的累加效果会显著影响疾病发病易感性。三个关键技术的突破为在全基因组水平鉴定这些疾病易感基因提供了基础,人类基因组计划的完成为在整体层面研究遗传突变提供了背景;HapMap计划则解决了遗传多态性位点的连锁问题,实现了仅通过对有限个多态性位点的测定,完成对全基因组范围内基因型的确定;而高密度的DNA芯片技术则可以一次性地完成对多达100万个遗传多态性位点的基因分型。这三项技术使全基因组关联分析(GWAS)成为可能。目前,GWAS研究己完成对上百种人类复杂疾病的遗传易感因子鉴定,极大地拓宽了人们探寻复杂疾病遗传机制的视野,成为研究复杂疾病遗传机制的主流工具。然而,近年来这些耗资巨大的GWAS研究在研究策略和临床意义上受到质疑。随着新一代测序技术的发展,在全基因组范围内检测稀有突变,甚至个体特有的遗传突变成为可能,而如何采用生物信息学的方法,研究稀有突变对复杂疾病的贡献,同时探讨它们与GWAS易感基因的调控关系,是该领域研究的前沿问题,目前仍处于探索前行阶段。转录组作为遗传因素与环境因素共同作用的对象,其动态变化对理解复杂疾病调控意义重大。SAGE,AffymrtrixGeneChipArray等技术的出现,实现了在全基因组水平对基因表达的精确定量。通过生物信息学分析(如利用Bioconductor软件的标准分析流程),可以发现疾病组与对照组的差异表达基因集合;而通过生物信息学方法,选取合适的背景对这些集合进行功能富集分析,可进一步发现这些差异表达基因所富集的功能单元和分子通路。外显子表达芯片的引入进一步拓展了上述转录组研究,使得在全基因组水平对可变剪切进行定量成为可能。已有研究采用生物信息学比较分析,发现疾病相关的剪切变化,而一些针对肿瘤组织的剪切谱分析,发现大量异常的剪切变体(包括发生在转录本层面的基因融合)。这些调控为理解人类复杂疾病提供了新线索。此外,结合了染色质免疫沉淀技术和高密度芯片技术的ChIP-chip研究,从染色质修饰的角度,为理解环境因素通过表观遗传调控影响人类疾病提供了基础。年来,新一代测序技术的出现进一步拓展了上述几个方面的研究:首先,通过对RNA反转录后的cDNA进行测序,RNA-seq技术可实现对基因表达的精确定量:相较传统的表达定量技术,RNA-seq成本低、通量高、定量准确;此外,回帖至基因组的RNA-seq测序片段可同时用于可变剪切分析:由于这些测序片断来源于不含有内含子的成熟mRNA,通过检测跨越多个外显子的测序片断即可精确判定切点位置(即内含子外显子边界),实现在全转录组水平对可变剪切进行定量;而基于新一代测序技术的ChIP-seq和DNA甲基化测定使得在全基因组水平低成本、可重复地研究表观遗传修饰成为可能,为理解环境因素对疾病发生发展的影响,及其与遗传因素的相互作用提供了新的机遇。此外,新兴的ChIP-seq、CLIP-seq和CLASH技术实现了在全基因组范围内对转录因子结合位点、microRNA结合位点进行准确鉴定,为理解基因表达谱变化提供了准确的调控依据。最后,在转录后调控、蛋白组学、代谢组学、宏基因组(meta-genomics)等方面,近年来在技术上都有了重要的改进,而生物信息学在对这些海量数据的分析和解读中均发挥了重要的作用。值得一提的是,如能合理地运用生物信息学方法,对多个调控层面的数据进行综合分析,往往可以系统地解释疾病发生的整体规律。首先,综合mRNA-seq,smallRNA-seq和CLASH技术产生的基因表达定量数据、microRNA表达定量数据以及microRNA结合靶点信息,不但可以发现疾病发生中基因表达谱的变化,而且可以从microRNA表达的角度解释上述变化,为创新小核酸治疗药物提供理论依据;其次,针对同一样本,综合基因组测序和转录组测序,一方面可以发现基因多态性与基因表达的相关性,使基因表达作为一种数量性状(eQTL),用于解释遗传致病基因引起表型的分子机制;另一方面,通过在单碱基水平寻找基因组与转录组的差异,可以实现在全基因组水平鉴定RNA编辑事件(RNAediting),为揭示复杂疾病提供全新的角度。此外,通过整合基因表达定量数据和表观遗传学调控数据,可以从环境因素刺激的角度,解释疾病发生发展过程中基因表达谱的动态变化,为疾病治疗提供新思路。这些综合分析,集中体现了生物信息学立足于整体的研究理念:随着多组织、多个体、多物种、多疾病状态、多发育时期的高通量组学数据的迅速积累,在未来的研究中,生物信息学有望进一步在疾病网络构建、拓扑分析、动态系统模拟、生物系统的建模和仿真等问题的研究中取得实质性突破,加速探索未知生命世界的进程。
本文标题:生物信息学研究方法的调控
链接地址:https://www.777doc.com/doc-2199603 .html