您好,欢迎访问三七文档
生物信息学参考书1、生物信息学教程,蔡禄,2006,化学工业出版社2、简明生物信息学教程,钟扬张亮赵琼2001,高等教育出版社3、生物信息基础,孙啸陆祖宏谢建民,清华大学出版社,20044、IntroductiontoBioinformatics,TKAttwoodDJParry-Smith(罗静初等译)(2002)北京大学出版社5、Bioinformatics:Apracticeguidetotheanalysisofgenesandproteins(李衍达孙之荣译)(2000)清华大学出版社6、Biologicalsequenceanalysis-ProbabilisticmodelsofproteinsandnucleicacidsR.DurbinS.EddyA.KroghG.Mitchison(2002)清华大学出版社(引进版)第1章生物信息学引论§1.1引言•综合论与还原论•生物并非只是物质的简单堆积,生物体的生长发育是生命信息控制之下的复杂而有序的过程。•如果说物理学是研究物质和能量的学科,那么生命科学就是研究生命物质基础上的信息的学科。•目前,我们对生命的奥秘还不甚了解,对生命信息的组织、传递和表达还知之甚少。既然这牵涉到信息的组织、传递和表达,我们就可以用信息科学的方法和技术来尝试认识和分析生命信息。•随着基因组计划的迅速发展,生物数据的积累速度不断加快。因此,也就对生物数据的科学分析方法和实用分析工具提出了更新、更高的要求。在这个过程中,需要对实验数据进行处理并及时进行理论分析,在此基础上解释实验现象,认识导致实验现象发生的本质,在“整合”、“系统”等全新理念下探索固有的生物学规律,进而了解和掌握生命的物质基础和生命的本质。•最近10余年来,生物科学与技术迅猛发展,生物学及相关数据的积累速度已大大超出了人们的想象。面对生物信息的爆炸性增长,现有的信息收集、储存、处理和分析方法与工具已远远不能满足实际研究的需要,亟待更新。–例如,人类基因组计划(humangenomeproject,HGP)在1990年正式启动后,科研人员用10年时间完成了人类基因组的工作草图(包含3×109亿个碱基对,并对30000余个基因进行了注释)–越来越多的微生物和其他模式生物(如秀丽新小杆线虫C.elegans)也已完成了全基因组测序工作。humanThermotogamaritima海栖热袍菌Escherichiacoli大肠杆菌Buchnerasp.APSRickettsiaprowazekii普氏立克次体Ureaplasmaurealyticum溶脲脲原体Bacillussubtilis枯草芽孢杆菌DrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparum恶性疟原虫Helicobacterpylori幽门螺杆菌mouseCaenorhabitiselegansratBorreliaburgorferi伯氏疏螺旋体BorreliaburgorferiAquifexaeolicus嗜热菌Neisseriameningitidis脑膜炎奈瑟菌Mycobacteriumtuberculosis结核杆菌Arabidopsis拟南芥•这些大型国际合作项目不仅产生出巨大的数据量,而且对数据处理工作也提出了前所未有的要求。人们已经充分认识到,如果不能及时分析和有效利用这些信息,那么这些耗费巨资所获得的数据也无异于增加了一堆垃圾。1.1.1生物信息学基本概念•广义的生物信息学是指以核酸蛋白质等生物大分子为主要研究对象,以信息、数理、计算机科学为主要研究手段,以计算机网络为主要研究环境,以计算机软件为主要研究工具,对序列数据进行存储、管理、注释、加工,对各种数据库进行查询、搜索、比较、分析,构建各种类型的专用数据库信息系统,研究开发面向生物学家的新一代计算机软件;并利用数理统计、模式识别、动态规划、密码解读、语意解析、信令传递、神经网络、遗传算法以及隐马氏模型等各种方法,对序列、结构数据进行定性和定量分析,从中获取基因编码、基因调控、序列-结构-功能关系等理性知识,阐明细胞、器官和个体的发生、发育、病变、衰亡的基本规律和时空联系,探索生命起源、生物进化、生命本质等重大理论问题,最终建立“生物学周期表”1.1.2生物信息学的研究目标和任务揭示生物分子数据隐含的生物学信息是其长远目标和根本任务。•目前生物信息学的主要任务第一是收集和管理生物分子数据第二是进行数据处理和分析第三个方面是开发分析工具和实用软件1.1.3生物信息学的研究意义生物信息学研究是从理论上认识生物本质的必要途径生物信息学的出现将改变生物学的研究方式随着分子生物学研究的深入,必然需要生物信息学生物信息学在指导实验、精心没计实验方面将会发挥重要的作用生物信息学研究在医学上也有重要的意义§1.2生物信息学的产生与发展1.2.1生物信息学的发展历史•10余年来,生物信息学的发展大致经历了3个阶段:(1)前基因组时代早在20世纪50年代,生物信息学就已经开始孕育。20世纪60年代是生物信息学形成雏形的阶段从20世纪70年代初期到80年代初期,出现了一系列著名的序列比较方法。20世纪80年代以后,出现了一批生物信息服务机构和生物信息数据库标志性工作包括生物数据库的建立、检索工具的开发以及DNA和蛋白质序列分析。例如,20世纪80年代即并始建立GenBank,但数据量增长较慢;Needleman和Wunsch(1970)以及Smith和Waterman(1981)分别提出了全局和局部的序列对位排列(sequencealignment)算法等。(2)基因组时代生物信息学的真正发展则是在20世纪90年代,在人类基因组计划的推动下,生物信息学才得以迅猛发展,标志性工作包括基因寻找和识别,网络数据库系统的建立和交互界面的开发等。例如,建立与发展表达序列标签(expressedsequencetag,EST)数据库以及电子克隆(virtualcloning)技术等。(3)后基因组时代随着后基因组时代的到来,生物信息学研究的重点逐步转移到功能基因组信息研究。标志是大规模基因组分析、蛋白质组分析以及各种数据的比较和整合。例如,蛋白质组学(proteomics)的产生、药物基因组学、比较基因组学以及分析人类基因组草图等。其具体表现在:(1)将已知基因的序列与功能联系在一起进行研究;(2)从以常规克隆为基础的基因分离转向以序列分析和功能分析为基础的基因分离;(3)从单个基因致病机理的研究转向多个基因致病机理的研究;(4)从组织与组织之间的比较来研究功能基因组和蛋白质组,组织与组织之间的比较主要表现在:正常与疾病组织之间的比较,正常与激活组织之间的比较,疾病与处理(或治疗)组织之间的比较,不同发育过程的比较等。1.2.2我国生物信息学发展现状•20世纪80年就有若干科研院所的生物、物理、信息、数学等学科的工作者从事生物信息学的研究工作。•近几年来,国内对生物信息学的研究和应用越来越重视。•我国在基因组信息的收集与发布方面开展了一些工作1.2.3我国生物信息学研究的发展方向•在2000年度国家自然科学基金委员会主持召开的“生物信息学前沿方向”研讨会上,与会专家讨论拟定了目前我国生物信息学研究的主要方向:1、建立国家生物医学数据库与服务系统已有专家建议在我国尽快建立国家级的“生物医学信息中心”,其首要任务是从国际上引进生物医学数据库和免费共享软件,同时把我国在生物信息方面有特色的成果提供给国际科学界。需要开发适合我国用户的接口和界面系统,同时开展数据库管理、模型和算法等方面的研究以及教育培训等工作。2、人类基因组的信息结构分析•利用EST数据库(如dbEST)并采用大规模并行计算,发现新的基因和单核苷酸多态性(SNP)以及各种功能位点;•研究占人类基因组95%的非编码区的信息结构,建立理论模型以阐明非编码区的重要生物学功能;•进行模式生物完整基因组的信息结构分析和比较研究。例如,对酵母(微生物)、线虫(动物)和拟南芥(植物)等模式生物进行比较基因组学研究。3、功能甚因组相关信息分析•研究开发大规模基因表达谱分析相关的算法与软件,特别是研究基因表达调控网络;•预测和模拟与基因组信息相关的核酸、蛋白质空间结构,进而预测蛋白质功能。4、遗传密码起源与生物进化(尤其是分子进化)的过程与机制5、非编码区分析和DNA语言研究6、基于结构的药物设计•此外,结合重大科学问题的研究,发挥我国在理论生物学和信息科学领域的研究特色,发展生物信息学的新理论、新方法、新技术和新软件也是重要的发展方向之一•在我国,有关生物信息学的研究已逐渐引起大家的重视,例如,在HGP1%的测序工作、“中华民族基因组中若干位点基因结构的研究”和“重大疾病相关基因的定位、克隆、结构与功能研究”等项目中,生物信息学分析均发挥了重要作用。如何进一步根据我国在生物学方面的特点,建立高水平的理论与实验体系,加快培养优秀的青年人才,是发展我国生物信息学研究最为迫切的任务之一•理论物理与生命科学交叉的理论研究科学目标:围绕生物大分子理论及生物信息学中关键问题,在DNA链复杂性、基因组序列信息分析、编码区和非编码区的统计分析、基因组全信息的生物进化等方面提出新理论、建立新方法;开展多重时空尺度上的生物大分子和生物凝聚体的结构、相互作用、性质及其调控理论的创新研究。资助方向:(1)生物信息学研究:基因识别(包括编码区和启动子区域识别)的新方法;分析多个基因组新方法并应用于分子进化;基因网络与系统生物学研究。(2)计算分子生物学与计算细胞生物学研究:单分子生物物理理论;蛋白质二、三级结构预测新方法;生物大分子的自组装(如生物膜、肌纤、蛋白微管等)理论等。•物理科学一处•项目申请人应主持完成过国家级项目,研究队伍要有一定规模。优先支持在研究目标引导下的包含新能源中的物理问题、先进材料制备、物理实验测量与表征的新技术和新方法、以及新的计算方法和模拟软件等内容的申请项目,支持理论与实验密切结合的申请。在申请书的附注说明中务请注明申请针对那个方向。2008年拟资助14-15个重点项目,平均资助强度200万元/项。•5.生物信息、生物大分子结构和功能的新物理问题(A0401)(与信息科学部和化学科学部交叉)•1)非编码RNA、DNA功能片断及蛋白质分子的三维结构的功能模拟与预测;•2)生物大分子(DNA、RNA及酶蛋白)相互作用网络动力学及系统生物学;•3)生物分子自组装和生物纳米体系的物理、力学性质;•4)生物分子的操纵、分析与测量的新原理、新方法和新技术。•生命科学三处•生命科学三处包括生物物理、生物化学与分子生物学、遗传学与发育生物学、细胞生物学和免疫学5个一级学科,集中了生命科学最基础和最前沿的研究领域,并体现学科交叉的特点。是生命科学最活跃的研究领域之一。•生物物理学、生物化学与分子生物学•从2006年开始,生物物理学科中的理论生物物理、环境生物物理、分子生物物理、膜与细胞生物物理合并到生物化学与分子生物学学科。由此,本学科主要资助方向集中在生物大分子结构与功能、生物大分子之间的相互作用、物理环境对生物体的影响和作用以及生物化学、生物物理学新技术和新方法等方面。生物大分子特别是蛋白质结构功能研究是本学科重要领域。历年受理和资助的课题最多。从受理项目内容来看,蛋白质晶体学、包括蛋白质复合物的课题有比较好的基础和深度;核酸生物化学、生物膜与膜生物物理有比较优秀的课题;理论生物物理研究比较好地体现了学科交叉的特点;运用NMR、电子显微镜等结构生物学研究国内实验比较少;多糖与糖复合物、环境生物物理方面的课题基础稍弱,电离、电磁辐射等对机体的生物效应及作用机制仍集中在细胞或整体水平;生物声学、生物光学等方面的研究以及生物物理、分子生物学新技术新方法方面的申请不多。•今后本学科重点资助方向主要包括以下几个方面:•蛋白质结构与功能和蛋白质折叠是生物物理、生物化学领域的重要研究方向。本学科鼓励和
本文标题:生物信息学第一章
链接地址:https://www.777doc.com/doc-3413167 .html