您好,欢迎访问三七文档
12019/8/14生物信息学主讲教师:高雪峰E-mail:gaoxf@jlu.edu.cn吉林大学生命科学学院2019/8/142课程安排1、时间:每周一下午5~8节教室:第三教学楼第二阶梯教室学时:每周4学时(总计44=16学时)2、学分:2学分3、成绩考核方式(笔试)4、E-mail:gaoxf@jlu.edu.cn(办公室地址:理三341室)32019/8/14参考文献1、《生物信息学概论》罗静初北京大学北京大学出版社2、《生物信息学》D.R.Westhead科学出版社3、《生物信息学—基因和蛋白质分析的使用指南》李衍达清华大学清华大学出版社4、《生物信息学中的计算机技术》孙超中国电力出版社5、《生物信息学手册》郝柏林中科院物理所上海科学技术出版社6、《简明生物信息学》钟扬复旦大学高等教育出版社42019/8/14第一章生物信息学引论2019/8/145简介一.引言二.生物信息学的发展历史三.人类基因组计划和基因组信息学四.蛋白质结构与功能关系的研究五.目前生物信息学主要研究内容六.生物信息学所用的方法和技术2019/8/146第一节引言生命信息的组织、传递、表达物理化学分子生物学遗传学信息技术2019/8/1471、生物信息学概念HGP生物数据的激增(每15个月翻一番)生物学家数学家计算机科学家生物信息学(bioinfomatics)的诞生2019/8/148概念(广义)生物体系和过程中信息的存贮、传递和表达细胞、组织、器官的生理、病理、药理过程的中各种生物信息信息科学生命科学中的信息科学2019/8/149概念(狭义)深层次生物学知识分子生物信息学MolecularBioinformatics挖掘获取生物分子信息的获取、存贮、分析和利用生物分子数据2019/8/1410Bioinformatics生物分子数据计算机计算+2019/8/1411高性能计算服务器,图形工作站2019/8/1412高端的计算集群2019/8/1413高度灵活的可扩展的计算集群2019/8/14142019/8/14152、生物分子信息细胞分子存贮、复制、传递和表达遗传信息的系统生物信息的载体2019/8/1416•生物信息学主要研究两种信息载体–DNA分子–蛋白质分子2019/8/14172019/8/1418ProteinMachines2019/8/1419FromtheCelltoProteinMachines2019/8/1420生物分子至少携带着三种信息–遗传信息–与功能相关的结构信息–进化信息212019/8/14(1)遗传信息的载体——DNA遗传信息的载体主要是DNA控制生物体性状的基因是一系列DNA片段生物体生长发育的本质就是遗传信息的传递和表达222019/8/14DNA通过自我复制,在生物体的繁衍过程中传递遗传信息基因通过转录和翻译,使遗传信息在生物个体中得以表达,并使后代表现出与亲代相似的生物性状。基因控制着蛋白质的合成DNARNA蛋白质转录翻译2019/8/1423基因的DNA序列DNA前体RNAmRNA多肽链蛋白质序列对应关系遗传密码2019/8/1424(2)蛋白质的结构决定其功能•蛋白质功能取决于蛋白质的空间结构•蛋白质结构决定于蛋白质的序列(这是目前基本共认的假设),蛋白质结构的信息隐含在蛋白质序列之中。2019/8/1425(3)DNA分子和蛋白质分子都含有进化信息•通过比较相似的蛋白质序列,如肌红蛋白和血红蛋白,可以发现由于基因复制而产生的分子进化证据。•通过比较来自于不同种属的同源蛋白质,即直系同源蛋白质,可以分析蛋白质甚至种属之间的系统发生关系,推测它们共同的祖先蛋白质。2019/8/1426生物分子信息DNA序列数据蛋白质序列数据生物分子结构数据生物分子功能数据最基本直观复杂生物分子数据类型2019/8/1427DNA核酸序列蛋白质氨基酸序列蛋白质结构蛋白质功能最基本的生物信息维持生命活动的机器遗传密码生命体系千姿百态的变化生物分子数据及其关系2019/8/1428•第一部遗传密码已被破译,但对密码的转录过程还不清楚,对大多数DNA非编码区域的功能还知之甚少•对于第二部密码,目前则只能用统计学的方法进行分析•无论是第一部遗传密码,还是第二部遗传密码,都隐藏在大量的生物分子数据之中。生物分子数据是宝藏,生物信息数据库是金矿,等待我们去挖掘和利用。2019/8/1429生物分子信息的特征•生物分子信息数据量大•生物分子信息复杂•生物分子信息之间存在着密切的联系2019/8/14303、生物信息学的目标和任务•收集和管理生物分子数据•数据分析和挖掘•开发分析工具和实用软件生物分子序列比较工具基因识别工具生物分子结构预测工具基因表达数据分析工具2019/8/1431实验数据信息知识收集表示分析建模刻画特征比较推理应用基因工程蛋白质设计疾病诊断疾病治疗开发新药生物分子信息处理流程2019/8/1432分子生物学的三大核心数据库•GenBank核酸序列数据库•SWISS-PROT蛋白质序列数据库•PDB生物大分子结构数据库2019/8/1433数据源数据量生物信息学任务DNA序列11.5百万条序列125.0亿个碱基分离编码与非编码区域识别内含子与外显子基因产物预测基因功能注释基因调控信息分析蛋白质序列40.0万条序列(每条序列平均有300氨基酸)序列比较多重序列比对识别保守的序列模式进化分析大分子结构1.5万个结构(每个结构平均1000个原子坐标)二级结构、空间结构预测三维结构比对蛋白质几何学度量表面和形态计算分子间相互作用分析分子模拟基因组300个基因组标注重复序列基因结构分析系统发生分析基因与疾病的连锁分析基因组比较遗传语言分析基因表达酵母6000个基因在约20时间点表达值达模式相关分析基因表基因调控网络分析表达调控信息分析表1.1至2001年初已经得到的各类数据及基本数据处理任务2019/8/1434生物信息学研究意义•认识生物本质–了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系。•改变生物学的研究方式–改变传统研究方式,引进现代信息学方法•在医学上的重要意义–为疾病的诊断和治疗提供依据–为设计新药提供依据生物信息学将是21世纪生物学的核心352019/8/14主要研究内容破译遗传语言、识别基因预测蛋白质结构和功能认识生物界信息存贮和传递的本质研究药物作用机制和开发新药2019/8/1436第二节生物信息学的发展历史生物信息学基本思想的产生生物信息学的迅速发展二十世纪50年代二十世纪80-90年代生物科学和技术的发展人类基因组计划的推动2019/8/143720世纪50年代,生物信息学开始孕育20世纪60年代,生物分子信息在概念上将计算生物学和计算机科学联系起来20世纪70年代,生物信息学的真正开端20世纪70年代到80年代初期,出现了一系列著名的序列比较方法和生物信息分析方法20世纪80年代以后,出现一批生物信息服务机构和生物信息数据库20世纪90年代后,HGP促进生物信息学的迅速发展2019/8/1438关于生物信息学发展历程中的重要大事,请参见下面两个网站的介绍:、。2019/8/1439生物信息学发展现状PubMed中与生物信息学相关论文统计90002%2019/8/1440第三节人类基因组计划和基因组信息学1、人类基因组计划简介人类基因组计划准备用15年时间,投入30亿美元,完成人类全部24条染色体的3×109脱氧核苷酸对(bp)的序列测定,主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别。其中还包括模型生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。作图和测序是基本的任务,在此基础上解读和破译生物体生老病死以及和疾病相关的遗传信息2019/8/1441模式生物酵母大肠杆菌果蝇线虫老鼠2019/8/1442曼哈顿原子弹计划(1942-46)阿波罗登月计划(1961-69)人类基因组计划(1990-2003)20世纪三大科学计划2019/8/14431961年,美国总统Kennedy提出两个科学计划:登月计划攻克肿瘤计划人类遗传信息的复杂性人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息的奥秘“我们选择登月”(1962年Kennedy在Rice大学演讲)为什么提出HGP?2019/8/1444生命活动三要素:物质、能量、信息DNA:遗传物质(遗传信息的载体)双螺旋结构A,C,G,T四种基本字符的复杂文本基因(Gene):具有遗传效应的DNA分子片段DNA、基因、基因组2019/8/1445基因组(Genome):包含细胞或生物体的全套遗传信息的全部遗传物质原核生物(细菌、病毒等)真核生物(真菌、植物、动物等)人类基因组:含有约3万个基因2019/8/14461984.12犹他州阿尔塔组织会议,初步研讨测定人类整个基因组DNA序列的意义1986.3杜尔贝科(Dulbecco)在《Science》撰文“肿瘤研究的转折点:人类基因组的测序”美国能源部(DOE)提出“人类基因组计划”草案1987美国能源部和国家卫生研究院(NIH)联合为“人类基因组计划”下拨启动经费约550万美元1989美国成立“国家人类基因组研究中心”,Watson担任第一任主任1990.10经美国国会批准,人类基因组计划正式启动JamesWatsonWalterGilbertHGP历史回顾2019/8/1447尽管比之于人类登月,HGP的投入资金要少得多,但HGP对人类生活的影响要更为深远。因为随着这个计划的完成,DNA分子中编码的遗传信息将对人类存在的化学基础作出最终的回答。这将不仅帮助我们理解我们是如何作为健康的人发挥正常功能的,而且也将在化学水平上解释遗传因子在各种疾病,如癌症、早老痴呆症、精神分裂症等一些严重危害人类健康的疾病中的作用。毕竟对人类自身更深入的了解是人类活动中最重要的一个部分。——Watson,1990,《Science》2019/8/1448HGP的最初目标通过国际合作,用15年时间(1990~2005)至少投入30亿美元,构建详细的人类基因组遗传图和物理图,确定人类DNA的全部核苷酸序列,定位约10万基因,并对其它生物进行类似研究。4张图:遗传图物理图序列图基因图HGP的终极目标阐明人类基因组全部DNA序列;识别基因;建立储存这些信息的数据库;开发数据分析工具;研究HGP实施所带来的伦理、法律和社会问题。2019/8/14491995第一个自由生物体流感嗜血菌(H.inf)的全基因组测序完成1996完成人类基因组计划的遗传作图启动模型生物基因组计划H.Inf全基因组Saccharomycescerevisiae酿酒酵母Caenorhabditiselegans秀丽线虫2019/8/14501997大肠杆菌(E.coli)全基因组测序完成1998完成人类基因组计划的物理作图开始人类基因组的大规模测序赛立拉(Celera)公司加入,与公共领域竞争启动水稻基因组计划1999.7第5届国际公共领域人类基因组测序会议,加快测序速度大肠杆菌及其全基因组水稻基因组计划2019/8/14512000Celera公司宣布完成果蝇基因组测序国际公共领域宣布完成第一个植物基因组——拟南芥全基因组的测序工作2000.6.26公共领域和Celera公司同时宣布完成人类基因组工作草图2001.2.15《Nature》刊文发表国际公共领域结果2001.2.16《Science》刊文发表Celera公司及其合作者结果Drosophilamelanogaster果蝇Arabidopsisthaliana拟南芥2019/8/14522001年2月15日《Nature》封
本文标题:生物信息学
链接地址:https://www.777doc.com/doc-292608 .html