您好,欢迎访问三七文档
当前位置:首页 > 行业资料 > 其它行业文档 > 生物信息学01-导论
生物信息学Bioinformatics•先修课–遗传学、分子生物学、细胞生物学等•生命科学相关专业的本科生–考研–毕业论文–工作•生命科学相关专业的研究生–课题研究–发表文章先修课及适用对象32学时平时成绩(20%)论文总结/其他(80%)课程考核了解、掌握和利用Internet上各种生物数据库、软件何处查找所需各种生物数据信息如何分析和解释所得数据信息学习本课程的目的SequenceanalysisGenomeannotationAnalysisofgeneexpressionAnalysisofregulationPredictionofproteinstructureComparativegenomics理论课讲授内容第一讲生物信息学导论第二讲生物信息数据库第三讲数据库检索第四讲DNA序列分析第五讲基因预测和基因结构分析第六讲蛋白质序列分析第七讲生物文献查找和下载第八讲常用生物软件的使用第一讲生物信息学导论生物信息学简介生物信息学的历史与发展趋势生物信息学的研究内容生物信息学当前的主要任务生物信息学的研究意义生物信息学所用的方法和技术生物信息学的相关文献主要内容什么是生物信息学?一、生物信息学简介生物信息学(Bioinformatics)这一名词的来由八十年代末期,马来西亚的美籍学者林华安(HwaA.Lim)认识到将计算机科学与生物学结合起来的重要意义,开始留意要为这一领域构思一个合适的名称。起初,考虑到与将要支持他主办一系列生物信息学会议的佛罗里达州立大学超型计算机计算研究所的关系,他使用的是“CompBio”;之后,又将其更改为“bioinformatique”,但是看起来仍有些古怪。因此不久,他便进一步把它更改为“bio-informatics(或bio/informatics)”。但由于当时的电子邮件系统与今日不同,名称中的-或/符号经常会引起许多问题,林博士于是将其去除,“bioinformatics”就正式诞生了,林博士也因此赢得了“生物信息学之父”的美誉。Dr.HwaA.LimWhatisbioinformatics?fromfttp://en.wikipedia.org/wiki/Bioinformatics•Bioinformaticsandcomputationalbiologyinvolvetheuseoftechniquesincludingappliedmathematics,informatics,statistics,computerscience,artificialintelligence,chemistry,andbiochemistrytosolvebiologicalproblemsusuallyonthemolecularlevel.Researchincomputationalbiologyoftenoverlapswithsystemsbiology.Majorresearcheffortsinthefieldincludesequencealignment,genefinding,genomeassembly,proteinstructurealignment,proteinstructureprediction,predictionofgeneexpressionandprotein-proteininteractions,andthemodelingofevolution.生物信息学•说文解字:生物+信息+学(bioinformatics)biology+information+theory•广义:应用信息科学的方法和技术,研究生物体系和生物过程中信息的存贮、信息的内涵和信息的传递,研究和分析生物体细胞、组织、器官的生理、病理、药理过程中的各种生物信息,或者也可以说成是生命科学中的信息科学。•狭义:应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。广义概念图示狭义概念图示生物信息学的生物学基础生物信息学的历史生物信息学的发展趋势二、生物信息学的生物学基础、历史与发展趋势•分子水平•细胞•个体生命•环境(一)生物信息学的生物学基础生命活动的基本单位是什么?生命活动的执行者是什么?蛋白质结构与功能的关系一级结构氨基酸顺序高级结构生物学功能蛋白质一级结构是高级结构的基础蛋白质的高级结构决定其功能符号含义说明GG鸟嘌呤AA腺嘌呤TT胸腺嘧啶CC胞嘧啶RGorA嘌呤YTorC嘧啶MAorC氨基KGorT酮基SGorC强氢键(3个氢键)WAorT弱氢键(2个氢键)HAorCorT非GBGorTorC非AVGorCorA非T(非U)DGorAorT非CNGorAorTorC任意碱基核酸DNA结构RNA和核糖体RNA是单链分子,RNA主要有三种:信使RNA(mRNA)-转录遗传信息核糖体RNA(rRNA)-蛋白质合成转运RNA(tRNA)-转运氨基酸核糖体是蛋白质合成的场所,核糖体主要由蛋白质分子和rRNA组成RNA和核糖体反密码子氨基酸新生肽链核糖体mRNAmRNA,tRNA,rRNAtRNA16SrRNA可识别mRNA起始位点中心法则基因(Gene):具有遗传效应的DNA分子片段原核生物真核生物基因与基因组原核生物ipoZYA操纵子模型结构基因调节基因操纵基因操纵子真核生物基因组(Genome):一个细胞或者生物体所携带的全部遗传信息。人类基因组:3.2×109bp人类基因数:~30000个思考题:基因组就是所有基因的集合???从人类基因组计划(HGP)说起(二)生物信息学的历史60年代初,美国总统Kennedy提出两个科学计划:登月计划攻克肿瘤计划人类遗传信息的复杂性人类基因组计划(HGP,HumanGenomeProject)目标:整体上破解人类遗传信息的奥秘1990年人类基因组计划(HGP)启动;2000年完成了基因组草图;2004年绘制出341个空隙、覆盖基因组99%、碱基错误率十万分之一的完整基因图;耗时10余年、花费约30亿美元、6个国家的16所实验室的约1100多名生物学家和计算机专家参与。HGP的历史回顾HGP完成后,我们将进入“后基因组学”(post-genomics)时代;基因组学研究重心已开始从揭示生命的所有遗传信息转移到在分子整体水平对功能的研究上,即功能基因组学(functionalgenomics)。功能基因组学的任务是:进行基因组功能注释(Genomeannotation)认识基因与疾病的关系掌握基因的产物及其在生命活动中的作用研究基因的表达调控机制功能基因组学HumanArabidopsisThermotogamaritimaEscherichiacoliBuchnerasp.APSRickettsiaprowazekiiUreaplasmaurealyticumBacillussubtilisDrosophilamelanogasterThermoplasmaacidophilumPlasmodiumfalciparumHelicobacterpylorimouseCaenorhabitiselegansratBorreliaburgorferiBorreliaburgorferiAquifexaeolicusNeisseriameningitidisZ2491Mycobacteriumtuberculosis小麦、西瓜、牡蛎、梨、棉花、白菜、木薯、花生、柑橘、甜橙、蓖麻、油菜……大规模基因组测序带来的科学挑战•随着实验数据和可利用信息急剧增加,信息的管理和分析成为一项非常重要的工作发现生物学规律解读生物遗传密码认识生命的本质研究基因组数据之间的关系分析现有的基因组数据利用数学模型和计算技术1、信息的整合2、信息的储存3、信息的比较4、信息的分析5、信息的分解基因组学功能基因组学这些过程都需要生物信息学的帮助!大规模基因组测序带来的科学挑战尽管最近十年来,高通量检测技术与信息技术的结合让人们认识了大量的基因和蛋白质,但是和物理学、化学相比较,生物学仍旧是一门不成熟的学科,因为对于生命过程,我们无法根据一般性原理做出像卫星轨道那样精确的预测。随着数据的不断膨胀和知识的积累,借助于生物信息学,这种情形很有可能发生改变。生物信息学最终目标:从大规模数据中抽象出知识与原理;提出细胞以至整个生物体的完整数学与计算机表示;进而预测高度复杂的生物系统的基本原理,例如,预测在细胞过程中相互作用网络和整个生物体的表型。(三)生物信息学的发展趋势生物信息学的过去、现在和将来主要内容目的二十世纪90年代的生物信息学大规模基因组学与蛋白质组学的实验数据形成的一级数据库及其相应的分析方法与工具了解单个基因和蛋白质的功能与用途当前的生物信息学由一级数据库分类、归纳、注释得到的基因组学与蛋白质组学二级数据库及其相应的分析方法与工具在分子、细胞和生物体水平了解功能与用途未来的生物信息学细胞和生物体的完全计算机表示了解生物系统高度复杂性的基本原理三、生物信息学的研究内容1、生物分子数据的收集与管理2、数据库搜索及序列比较3、基因组序列分析4、基因表达数据的分析与处理5、蛋白质结构预测生物分子信息的特征•生物分子信息数据量大•生物分子信息复杂•生物分子信息之间存在着密切的联系1、生物分子数据的收集与管理生物分子信息DNA序列数据蛋白质序列数据生物分子结构数据生物分子功能数据最基本直观复杂生物分子数据类型基因组数据库蛋白质序列数据库蛋白质结构数据库DDBJEMBLGenBankSWISS-PROTPDBPIR数据库!搜索!2、数据库搜索及序列比较搜索同源序列在一定程度上就是通过序列比较寻找相似序列(Blast搜索工具)序列比较的一个基本操作就是比对(Alignment),即将两个序列的各个字符(代表核苷酸或者氨基酸残基)按照对应等同或者置换关系进行对比排列,其结果是两个序列共有的排列顺序,这是序列相似程度的一种定性描述多重序列比对研究的是多个序列的共性。序列的多重比对可用来搜索基因组序列的功能区域,也可用于研究一组蛋白质之间的进化关系。数据库搜索及序列比较3、基因组序列分析•遗传语言分析——天书•基因组结构分析•基因识别•基因功能注释•基因调控信息分析•基因组比较4、基因表达数据的分析与处理基因表达数据分析是目前生物信息学研究的热点和重点。目前对基因表达数据的处理主要是进行聚类分析。将表达模式相似的基因聚为一类,在此基础上寻找相关基因,分析基因的功能。5、蛋白质结构预测蛋白质的生物功能由蛋白质的结构所决定,蛋白质结构预测成为了解蛋白质功能的重要途径。蛋白质结构预测分为:二级结构预测空间结构预测蛋白质折叠当前生物信息学界的大部分人都把注意力集中在基因组、转录组、蛋白质组、蛋白质结构等的研究上,随蛋白组学、代谢组学等进一步的发展,将在整体水平进行。四、生物信息学当前的主要任务基因组是一个细胞或者生物体所携带的全部遗传信息;转录组是一个细胞或组织内全部转录产物的集合;蛋白质组是一个细胞或组织内所有类型蛋白质的集合;代谢组是生物体内源性代谢物质的集合。以此类推,我们还可以定义其它的“组”,例如蛋白质相互作用组就是一个细胞或组织内蛋白质间所有相互作用的集合。几个概念MochidaK,ShinozakiK.PlantCellPhysiol2011;52:2017-2038.生物信息学将是21世纪生物学的核心认识生物本质–了解生物分子信息的组织和结构,破译基因组信息,阐明生物信息之间的关系改变生物学的研究方式–改变传统研究方式,引进现代信息学方法在医学上的重要意义–为疾病的诊断和治疗提供依据–为设计新药提供依据五、生物信息学的研究意义生物信息学系统化概图生物信息学不仅仅是一门科学学科,它更是一种重要的研究开发工具。从科学的角度来讲,它是一门研究生物和生物相关系统中信息内容物和信息流向的综合系统科学,只有通过生物信息学的计算处理,我们才能从众多分散的生物学观测数
本文标题:生物信息学01-导论
链接地址:https://www.777doc.com/doc-6311497 .html