您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学1-陈润生
生物信息学现状和重要研究方向陈润生E-mail:crs@sun5.ibp.ac.cnrunshengc@hotmail.comTel:86-10-64888543Fax:86-10-64871293凌伦奖E-mail:ling@sun5.ibp.ac.cnTel:86-10-64888544中国科学院生物物理研究所北京朝阳区大屯路15号背景NormalMaleFISHDifferentprobesusedtomarkeachchomosomeComputeridentifiesprobeandgivechromosomeafalsecolorTrisomy13PatauSyndromePatauSyndromeCleftlipandpalateExtrafingers&toes–polydactylismDefects–Heart–Brain–KidneyMostabortLivespan1month一.什么是生物信息学?Genomeinformaticsisascientificdisciplinethatencompassesallaspectsofgenomeinformationacquisition,processing,storage,distribution,analysis,andinterpretation.它是一个学科领域,包含着基因组信息的获取、处理、存储、分配、分析和解释的所有方面。(TheU.S.HumanGenomeProject:TheFirstFiveYearsFY1991-1995,byNIHandDOE)从美国的三个国家计划说起:曼哈顿计划;阿婆罗计划;人类基因组计划。破译人类遗传密码就要读懂由30亿符号组成的100万页的“天书”GenomeshighlighttheFinitenessofthe“Parts”inBiologyBacteria,1.6Mb,~1600genes[Science269:496]Eukaryote,13Mb,~6Kgenes[Nature387:1]199519971998Animal,~100Mb,~20Kgenes[Science282:1945]Human,~3Gb,~100Kgenes[???]2000?realthing,Apr‘00‘98spoofADraftSequenceoftheRiceGenome(OryzasativaL.ssp.indica)JunYu,1,2,3,4*SongnianHu,1*JunWang,1,2,5*GaneKa-ShuWong,1,2,4*SonggangLi,1,5BinLiu,1YajunDeng,1,6LiDai,1YanZhou,2,7XiuqingZhang,1,3MengliangCao,8JingLiu,2JiandongSun,1JiabinTang,1,3YanjiongChen,1,6XiaobingHuang,1WeiLin,2ChenYe,1WeiTong,1LijuanCong,1JianingGeng,1YujunHan,1LinLi,1WeiLi,1,9GuangqiangHu,1XiangangHuang,1WenjieLi,1JianLi,1ZhanweiLiu,1LongLi,1JianpingLiu,1QiuhuiQi,1JinsongLiu,1LiLi,1TaoLi,1XuegangWang,1HongLu,1TingtingWu,1MiaoZhu,1PeixiangNi,1HuaHan,1WeiDong,1,3XiaoyuRen,1XiaoliFeng,1,3PengCui,1XianranLi,1HaoWang,1XinXu,1WenxueZhai,3ZhaoXu,1JinsongZhang,3SijieHe,3JianguoZhang,1JichenXu,3KunlinZhang,1,5XianwuZheng,3JianhaiDong,2WanyongZeng,3LinTao,2JiaYe,2JunTan,2XideRen,1XueweiChen,3JunHe,2DaofengLiu,3WeiTian,2,6ChaoguangTian,1HongaiXia,1QiyuBao,1GangLi,1HuiGao,1TingCao,1JuanWang,1WenmingZhao,1PingLi,3WeiChen,1XudongWang,3YongZhang,1,5JianfeiHu,1,5JingWang,1,5SongLiu,1JianYang,1GuangyuZhang,1YuqingXiong,1ZhijieLi,1LongMao,3ChengshuZhou,8ZhenZhu,3RunshengChen,1,9BailinHao,2,10WeimouZheng,1,10ShouyiChen,3WeiGuo,11GuojieLi,12SiqiLiu,1,2MingTao,1,2JianWang,1,2LihuangZhu,3†LongpingYuan,8†HuanmingYang1,2,3†Science2002296:79-92ADraftSequenceoftheRiceGenome(OryzasativaL.ssp.indica)JunYu,1,2,3,4*SongnianHu,1*JunWang,1,2,5*GaneKa-ShuWong,1,,24*………Science2002296:79-92Riceisthemostimportantcropforhumanconsumption,providingstaplefoodformorethanhalftheworld'spopulation.Theeuchromaticportionofthericegenomeisestimatedtobe430Mbinsize(1-3),whichisthesmallestofthecerealcrops.Itis3.7timeslargerthanthatofA.thaliana(4-6),and6.7timessmallerthanthatofthehuman(7,8).Thewell-establishedprotocolsforhigh-efficiencygenetictransformation,widespreadavailabilityofhigh-densitygeneticandphysicalmaps(9,10),andhighdegreesofsyntenyamongcerealgenomes(11-15)combinetomakericeauniqueorganismforstudyingthephysiology,developmentalbiology,genetics,andevolutionofplants.TheInternationalRiceGenomeSequencingProject(IRGSP)(16)hasalreadydeliveredasubstantialamountofsequenceforthejaponica(Nipponbare)subspecies,inbacterialartificialchromosome(BAC)andP1-derivedartificialchromosome(PAC)-sizedcontigs.Workingindependently,MonsantoandSyngenta(17,18)establishedproprietaryworkingdraftsforjaponica,inApril2000andFebruary2001,respectively.TheMonsantosequencehasbeenusedtoassistintheeffortsoftheIRGSP.Figure9.Functionalclassificationofricegenes,accordingtoGeneOntologyConsortium,andassignedbyhomologytocategorizedA.thalianagenes.Inthisontology,biologicalprocess,cellularlocation,andmolecularfunctionaretreatedasindependentattributes.Only36.3%ofthe25,426predictedgenesforA.thalianaareclassified.Forrice,only20.4%ofthe53,398completepredictions,withbothinitialandterminalexons,couldbeclassified.计算机运算速度:18个月增长一倍;DNA序列数据:14个月增长一倍;代表基因组研究进展的数据近年来GenBank中的DNA碱基数目呈指数增加,大约每14个月增加一倍。到1999年12月其数目已达30亿,它们来自47000种生物。2000年4月DNA碱基数目是60亿。现在,2002年2月13日这一数目已达171亿(15465000记录)。各种生物的EST序列已达1082万条(2002年3月8日),其中人类的EST序列已超过417万条(小鼠2525645),估计覆盖人类基因90%以上;自1999年初单核苷酸多态性(SNPs,SingleNucleotidePolymorphisms)数据库出现以来,到2000年3月20日SNP的总数是26569,现在已超过412万(2002年1月24日);自全长1.8Mb的嗜血流感杆菌(HaemophilusinfluenzaeRd)基因组序列于1995年发表(Fleischmannetal.,1995)以来,到2002年3月12日已有83个模式生物的完整基因组被测序完成,它们中有13个古细菌、63个原核真细菌、7个真核生物的完整基因组,其中包括酿酒酵母、线虫、拟南芥、果蝇和人。还有另外的100余个微生物基因组正在测试当中;果蝇基因组包括1.2亿碱基对的编码区已于2000年2月测序并组装完成;人类基因组研究的标志性工作,包含三千三百万碱基对的人第22号染色体已于1999年11月完成测序,其结果发表在1999年12月2日的Nature杂志上。从第22号染色体已鉴定出679个基因,其中55%的基因是未知的。有35种疾病与该染色体突变相关,象免疫系统疾病、先天性心脏病和精神分裂症。作为人类基因组研究的里程碑性的工作,覆盖率为90%的人完整基因组的“工作草图”已经在2000年4月底完成,到2003年将获得覆盖率为99%的人类基因组全部序列。分子生物学和遗传学的文献积累从60年代中期的接近10万篇迅速增长至60年代末期的20多万篇,即在3-4年间,翻了一番。此后,至80年代中期,上升至约30万篇,即平均每年增长6-7千篇。至90年代中,文献数已上升至40多万篇;即在10年中,平均每年增长1万篇。到2000年,则增长至约50万篇,即在约5年间,又增长了10万篇(根据数据整理)。美国的核酸数据库GenBank〖Banson,D.A.etal.(1998)NucleicAcidsRes.26,1-7〗从1979年开始建设,1982年正式运行;欧洲分子生物学实验室的EMBL数据库也于1982年开始服务;日本于1984年开始建立国家级的核酸数据库DDBJ,并于1987年正式服务。从那个时候以来,DNA序列的数据已经从80年代初期的百把条序列,几十万碱基上升至现在的110亿碱基!这就是说,在短短的约18年间,数据量增长了近十万倍。Howmanycharactersareinthe“HeavenBook”?3*10910,000boo
本文标题:生物信息学1-陈润生
链接地址:https://www.777doc.com/doc-6311498 .html