您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学现状和重要研究方向
生物信息学生物信息学主讲教师:刘吉平E-MAIL:Liujiping@scau.edu.cn艺术设计学院蚕桑分子生物学研究室亚太地区蚕桑培训中心2003年2月生物信息学一、概述•二十一世纪是生命科学的时代,也是信息时代•近年来,随着现代分子生物学的发展,特别是人类基组计划的实施,不断产生出巨量的分子生物学数据,这些数据有着数量巨大、关系复杂,以至于不利用计算机根本无法实现数据的存储和分析。这样,生物信息学最终形成一门独立的学科并被推上了生物科学发展的最前沿。生物信息学Bioinformatics:科技界一颗耀眼的新星•在BIOINFORMATICS没有诞生之前,一个新药的问世需要十年时间,数亿美元的R&D,而BIOINFORMATICS已将这个过程减少三分之二,R&D的费用也相应大大减少。许多中小BIOTECH公司也看到了BIOINFORMATICS的巨大作用和潜在的商机,纷纷投资BIOINFORMATICS研究项目。生物信息学美国电脑执照--高薪阶层•“BIOINFORMATICSCERTIFICATION”,这是目前最新的一门生物化学工程与电脑技术相结合的课程。•VisualBasic--$1195•VisualC++--$1295•BioInformatics--$2500•MIT(MassachusettesInstituteofTechnology)•(美国)麻省理工学院:Course:20.01sDate:June24-28,2002Tuition:$2,500生物信息学第二讲生物信息学现状和研究方向刘吉平生物信息学主要内容•1、背景•2、定义•3、现状•1)生物数据库的发展•2)人类基因组计划逐步完成•3)科研文献的增长•4、研究目标生物信息学一.什么是生物信息学?•Genomeinformaticsisascientificdisciplinethatencompassesallaspectsofgenomeinformationacquisition,processing,storage,distribution,analysis,andinterpretation.它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。(TheU.S.HumanGenomeProject:TheFirstFiveYearsFY1991-1995,byNIHandDOE)•从美国的三个国家计划说起:曼哈顿计划;阿婆罗计划;人类基因组计划。•破译人类遗传密码就要读懂由30亿符号组成的100万页的“天书”生物信息学生物信息学的发展历程生物信息学自诞生以来,经历了三个阶段:•基因组前期的生物信息学:主要是序列分析、数据库的查询、计算机操作和PC的应用;•基因组年代的生物信息学:主要是基因的寻找、数据与数据之间的比较、网络相互界面(Interface);•后基因组年代的生物信息学:主要是数据的挖掘、表达、数据多样性的分析、相互交叉数据分布的总结与分析。其研究的内容不仅包括基因的查寻和同源性分析;而且进一步到基因和基因组的功能分析,即所谓的功能基因组学研究。生物信息学二、生物信息学及其发展•生物信息学(Bioinformatics)----采用信息科学、计算机科学、生物数学、比较生物学等学科的观点和方法对生命的现象及其组成分子(核酸、蛋白等)进行研究。主要研究生命中物质的组成、进化、结构与功能的规律、以及这些物质在生命体中能量和信息的交换或传递。该学科以计算机和生物电子设备为工具,对生物信息进行提取、储存、加工和分析,用信息理论技术及生物数学的方法去理解和阐述生物大分子的存在和生命价值,最终对它们进行各种处理与应用。通过这些处理和应用,科学家不仅能理解已有的核酸和蛋白质序列及其功能,而且能更好地着手研究新的基因和蛋白序列及其功能。生物信息学计算机运算速度:18个月增长一倍;DNA序列数据:14个月增长一倍;生物信息学近年来GenBank中的DNA碱基数目呈指数增加,大约每14个月增加一倍。到1999年12月其数目已达30亿,它们来自47000种生物。2000年4月DNA碱基数目是60亿。现在,2001年初这一数目已达110亿。各种生物的EST序列已达600多万条,其中人类的EST序列已超过300万条,估计覆盖人类基因90%以上;自全长1.8Mb的嗜血流感杆菌(HaemophilusinfluenzaeRd)基因组序列于1995年发表(Fleischmannetal.,1995)以来,已有54个模式生物的完整基因组被测序完成,它们中有9个古细菌、31个原核真细菌、14个真核生物的完整基因组或它们的完整染色体,其中包括酿酒酵母和线虫。还有另外的70余个微生物基因组正在测试当中。生物信息学美国的核酸数据库GenBank从1979年开始建设,1982年正式运行;欧洲分子生物学实验室的EMBL数据库也于1982年开始服务;日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。从那个时候以来,DNA序列的数据已经从80年代初期的百把条序列,几十万碱基上升至现在的110亿碱基!这就是说,在短短的约18年间,数据量增长了近十万倍。生物信息学Dbcat统计的生物信息数据库的数目分类数据库数目分类数据库数目DNA87RNA30蛋白质94基因组58基因图谱30蛋白质结构18文献43其他153生物信息学果蝇基因组包括1.2亿碱基对的编码区已于2000年2月测序并组装完成;人类基因组研究的标志性工作,包含3300万碱基对的人第22号染色体已于1999年11月完成测序,结果发表在1999年12月2日的Nature上。从第22号染色体已鉴定出679个基因,其中55%的基因是未知的。有35种疾病与该染色体突变相关,像免疫系统疾病、先天性心脏病和精神分裂症。作为人类基因组研究的里程碑性的工作,覆盖率为90%的人完整基因组的“工作草图”已经在2000年4月底完成,到2003年将获得覆盖率为99%的人类基因组全部序列。对人的大约3万个基因。到目前为止已定位在染色体上的基因数目有14015个(见)生物信息学Howmanycharactersareinthe“HeavenBook”?3*10910,000books1book100pages1page3,000characters•CCGGTCTCCCCGCCCGCGCGCGAAGTAAAGGCCCAGCGCAGCCCGCGCTCCTGCCCTGGGGCCTCGTCTTTCTCCAGGAAAACGTGGACCGCTCTCCGCCGACAGTCTCTTCCACAGACCCCTGTCGCCTTCGCCCCCCGGTCTCTTCCGGTTCTGTCTTTTCGCTGGCTCGATACGAACAAGGAAGTCGCCCCCAGCGAGCCCCGGCTCCCCCAGGCAGAGGCGGCCCCGGGGGCGGAGTCAACGGCGGAGGCACGCCCTCTGTGAAAGGGCGGGGCATGCAAATTCGAAATGAAAGCCCGGGAACGCCGAAGAAGCACGGGTGTAAGATTTCCCTTTTCAAAGGCGGGAGAATAAGAAATCAGCCCGAGAGTGTAAGGGCGTCAATAGCGCTGTGGACGAGACAGAGGGAATGGGGCAAGGAGCGAGGCTGGGGCTCTCACCGCGACTTGAATGTGGATGAGAGTGGGACGGTGACGGCGGGCGCGAAGGCGAGCGCATCGCTTCTCGGCCTTTTGGCTAAGATCAAGTGTAGTATCTGTTCTTATCAGTTTAATATCTGATACGTCCTCTATCCGAGGACAATATATTAAATGGATTGATCAATCCGCTTCAGCCTCCCGAGTAGCTGGGACTACAGACGGTGCCATCACGCCCAGCTCATTGTTGATTCCCGCCCCCTTGGTAGAGACGGGATTCCGCTATATTGCCTGGGCTGGTGTCGAACTCATAGAACAAAGGATCCTCCCTCCTGGGCCTGGGCGTGGGCTCGCAAAACGCTGGGATTCCCGGATTACAGGCGGGCGCACCACACCAGGAGCAAACACTTCCGGTTTTAAAAATTCAGTTTGTGATTGGCTGTCATTCAGTATTATGCTAATTAAGCATGCCCGGTTTTAAACCTCTTAAAACAACTTTTAAAATTACCTTTCCACCTAAAACGTTAAAATTTGTCAAGTGATAATATTCGACAAGCTGTTATTGCCAAACTATTTTCCTATTTGTTTCCTAATGGCATCGGAACTAGCGAAAGTTTCTCGCCATCAGTTAAAAGTTTGCGGCAGATGTAGACCTAGCAGAGGTGTGCGAGGAGGCCGTTAAGACTATACTTTCAGGGATCATTTCTATAGTGTGTTACTAGAGAAGTTTCTCTGAACGTGTAGAGCACCGAAAACCACGAGGAAGAGAGGTAGCGTTTTCATCGGGTTACCTAAGTGCAGTGTCCCCCCTGGCGCGCAATTGGGAACCCCACACGCGGTGTAGAAATATATTTTAAGGGCGCG(1250characters)关键是先要从一个个序列片段中得到这本天书生物信息学已测序的重要模式生物:人家鼠果蝇线虫拟南芥水稻大鼠斑马鱼酿酒酵母番茄玉米布氏锥虫菜豆河豚大肠杆菌HIV牛疟原虫生物信息学1.分子生物学和遗传学的文献积累从60年代中期的接近10万篇迅速增长至60年代末期的20多万篇,即在3-4年间,翻了一番。2.此后,至80年代中期,上升至约30万篇,即平均每年增长6-7千篇。3.至90年代中,文献数已上升至40多万篇;即在10年中,平均每年增长1万篇。4.到2000年,则增长至约50万篇,即在约5年间,又增长了10万篇(根据数据整理)。生物信息学1、发展现状•生物信息学的发展将会对生命科学带来革命性的变革。它的成果不仅对相关基础学科起巨大的推动作用,而且还将对医药、卫生、食品、农业等产业产生巨大的影响,甚至引发新的产业革命。生物信息学生物医药工业推动生物信息学的发展•生物医药工业也是推动生物信息学发展的重要动力。HGP所推动的大规模DNA测序也为生物医药工业提供了大量可用于新药开发的原材料。有些基因产物可以直接作为药物,而有些基因则可以成为药物作用的对象。生物信息学为分子生物学家提供了大量对基因序列进行分析的工具,不但可以从资料的获取、基因功能的预测、药物筛选过程中的信息处理等方面大大加快新药开发的进程,而且可以大大加快传统的基因发现和研究,因而成为各赢利性研究机构和医药公司争夺基因专利的重要工具,这一竞争又反过来极大的刺激了生物信息学的发展。生物信息学2、国外发展现状•因此,各国政府和工业界对此极为重视,投入了大量资金。欧美各国及日本相继成立了生物信息中心,如美国的国家生物技术信息中心(NationalCenterforBiotechnologyInformatics,NCBI)、欧洲生物信息学研究所(EuropeanBioinformaticInstitute,EBI)、日本信息生物学中心(CenterforInformationBiology,CIB)等。NCBI、EBI和CIB相互合作,共同维护着GenBank、EMBL、DDBJ三大基因序列数据库。它们每天通过计算机网络互相交换数据,使得三个数据库能同时获得最新数据。此外,他们每年召开两个年会讨论合作事宜。生物信息学3、国内发展现状•在我国,生物信息学随着人类基因组研究的展开才刚刚起步,但已显露出蓬勃发展的势头。在政
本文标题:生物信息学现状和重要研究方向
链接地址:https://www.777doc.com/doc-292659 .html