您好,欢迎访问三七文档
一、名词解释(每小题4分,共20分)1、生物信息学广义:生命科学中的信息科学。生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。狭义:生物分子信息的获取、存贮、分析和利用。2、基因:有遗传效应的DNA片断,是控制生物性状的基本遗传单位。3、中心法则是指遗传信息从DNA传递给RNA,再从RNA传递给蛋白质,即完成遗传信息的转录和翻译的过程。也可以从DNA传递给DNA,即完成DNA的复制过程。这是所有有细胞结构的生物所遵循的法则。4、一级数据库数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释5、基因芯片基因芯片(genechip),又称DNA微阵列(microarray),是由大量cDNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。二、选择题(每小题2分,共20分)1、BLAST教案所程序中,哪个方法是不存在的?(D)A:BLASTPB:BLASTNC:BLASTXD:BLASTQ2、下列哪个软件不是常用来观察蛋白质结构视图的?(D)A:AVSB:ChimeraC:MICED:HMM3、下列哪个不是点突变的类型?(A)A:染色体畸变B:错义突变C:无义突变D:移码突变4、基因突变的效应不包括:(C)A:有利突变B:中性突变C:移码突变D:遗传多态现象5、人类基因组的结构特点不包括:(A)A:基因进化B:基因数目C:基因重复序列D:基因组复制6、世界上三大数据库不包括:(B)A:NCBIB:BLASTC:UCSCD:Ensembl7、常用序列比对方法错误的是:(C)A:编辑距离B:点阵描图C:局部比对D:记分模式8、下列哪个不是蛋白质结构模型?(D)A:同源性模型B:折叠识别C:abinitio折叠D:MoLScript结构9、下列哪个选项不是微阵列实验设计的内容?(A)A:贝叶斯网络法B:对照组的选择C:重复样本的使用D:随机化原则10、构建序列进化树的一般步骤不包括:(A)A:建立DNA文库B:建立数据模型C:建立取代模型D:建立进化树三、填空题(每空2分,共20分)1、数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。2、按碱基配对原则将DNA分子的遗传信息拷贝到mRNA分子中,称为转录。3、线粒体基因组含有细胞核基因组之外的遗传信息,有其独特的遗传特点表现为:mtDNA具有半自主性、线粒体基因组所用的遗传密码与核基因的通用密码有所不同、mtDNA呈母系遗传、mtDNA具有异质性与均质性、mtDNA具有阀值效应、mtDNA的进化率极高。4、分子生物学数据库中的信息可以是DNA序列,保守的DNA结构域、基因组、基因表达、蛋白质序列、蛋白质家族、基因突变、基因多态性和代谢途径。5、BLAST是一种快速序列比较工具,采用启发式方法根据优化的局部相似性构建比对关系。四、解答题(每小题4分,共20分)1、生物信息学分析的数据对象主要有哪几种?这些数据之间存在着什么关系?其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能。生物信息学以基因组DNA序列信息分析作为出发点,破译遗传语言,认识遗传信息的组织规律,辨别隐藏在DNA序列中的基因,掌握基因调控信息,对蛋白质空间结构进行模拟和预测,依据蛋白质结构和功能的关系进行药物分子设计。2、生物信息学的主要研究任务是什么?目前生物信息学的主要研究内容是什么?A.收集和管理生物分子数据;数据分析和挖掘;开发分析工具和实用软件:生物分子序列比较工具、基因识别工具、生物分子结构预测工具、基因表达数据分析工具。B.(1)生物分子数据的收集与管理;(2)数据库搜索及序列比较;(3)基因组序列分析;(4)基因表达数据的分析与处理;(5)蛋白质结构预测。3、在基因组序列分析方面,科学家关注哪些信息?就人类基因组而言,编码区域在人类基因组所占的比例不超过3%。其余97%是非编码序列。对于非编码序列,人们了解得比较少,尚不清楚其含义或功能。然而,非编码区域对于生命活动具有重要的意义。这部分序列主要包括内含子、简单重复序列、移动元件(mobileelement)及其遗留物、伪基因(pseudogene)等。4、为什么要进行序列片段组装?在进行序列片段组装时会遇到哪些问题?大规模基因组测序得到待测序列的一系列序列片段,这些序列片段覆盖待测序列,序列片段之间也存在着相互覆盖或者重叠。遇到的问题:碱基标识错误;不知道片段的方向;存在重复区域;缺少覆盖。5、简述分子生物学中的“中心法则”DNA是遗传物质,是携带遗传信息的载体。信息从基因的核苷酸序列中被提取出,用来指导蛋白质合成的过程对地球上的所有生物都是相同的,分子生物学家称之为中心法则(centraldogma)。五、辨析题(每小题20分,共20分)1、简述人类基因组计划与生物信息学之间的相互促进关系。人类基因组计划(HumanGenomeProject,HGP)是美国在1990年提出实施的一项伟大的科学计划,与阿波罗登月计划、曼哈顿原子弹计划同称为人类自然科学史上的三大计划。自实施以来,该计划在世界各国引起了很大反响。在人类基因组计划中,人们准备用15年时间,投入30亿美元,完成人类全部24条染色体中3×109个碱基对(bp,basepair)的序列测定,其主要任务包括作图(遗传图谱、物理图谱的建立及转录图谱的绘制)、测序和基因识别,还包括模式生物(如大肠杆菌、酵母、线虫、小鼠等)基因组的作图和测序,以及信息系统的建立。随着人类基因组计划的提出和实施,实验数据和可利用信息急剧增加,人类基因组计划提供了以往不可想象的巨量的生物学信息资源。基因组信息的收集、储存、分发、分析显得越来越紧迫和重要,信息的管理和分析成为人类基因组计划实施过程中的一项重要工作,人类基因组计划向信息学提出了巨大的挑战。值得庆幸的是,人类基因组计划一开始就与计算机技术、信息高速公路同步发展,信息技术为生物信息学的发展提供了非常好的条件,为生物信息学的研究和应用提供了非常好的支撑。生物信息学与人类基因组计划紧密结合,互相渗透,生物信息学成为基因组计划不可分割的一部分。事实证明,人类基因组计划在生物信息学的支持下,前进步伐大大加快,已经提前完成计划,功能基因组研究也已经全面展开。而人类基因组计划反过来又大大促进了生物信息学的发展,HGP丰富了生物信息学的研究内容,促进生物信息学新思想、新方法的产生,生物信息学在最近10年迅速发展的历程证明了这一点。一.名词解释201.一级数据库:数据库中的数据直接来源于实验获得的原始数据,只经过简单的归类整理和注释2.序列基序:指的是一组序列所共有的一段局部保守区域或短的序列模式3.微丝:是指真核细胞中由肌动蛋白组成的骨架纤维4.遗传图:根据减数分裂过程中同源染色体的连锁或交换现象,在后代中可观察到两个比邻的分子标记可以出现连锁或分离现象。5.分子系统学:从生物大分子(氨基酸、核苷酸)的遗传信息推断生物进化的历史,并以系统树(谱系)的形式表达出来。6.动态规划:是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法。7.TDT分析:比较某些特殊等位基因由亲代向子代的传递频率的差别的方法。8.蛋白质结构视观:是在实验测定其结构或通过结构生物信息学进行结构预测的基础上,对蛋白质结构利用计算机图形处理方法显现出来,便于研究人员对其二维或三维结构有一感性认识,更重要的是有助于理解蛋白与蛋白或其配体的相互作用。9.基因芯片:又称DNA微阵列,是由大量DNA或寡核苷酸探针密集排列所形成的探针阵列,其工作的基本原理是通过杂交检测信息。10.生物信息学:广义:生命科学中的信息科学。生物体系和过程中信息的存贮、传递和表达;细胞、组织、器官的生理、病理、药理过程的中各种生物信息。狭义:生物分子信息的获取、存贮、分析和利用。二.填空201.药物基因组学中的三大技术平台:SNP分型,基因表达芯片和生物信息学2.数据格式的建立、数据的准确性和质量控制、方便的数据搜寻方式以及数据的及时更新是数据库建立和维护中的重要问题。3.蛋白质的折叠预测方法:同源性模型,折叠识别和从头开始折叠4.生物膜的特性:流动性和不对称性5.分子生物学数据库中的信息可以是DNA序列,保守的DNA结构域、基因组、基因表达、蛋白质序列、蛋白质家族、基因突变、基因多态性和代谢途径。三.选择101.下列中属于一级蛋白质结构数据库的是:(C)A.EMBLB.DDBJC.PDBD.SWISS-PROT2.蛋白质结构预测分为:(B)A.一级和三级结构预测B.二级和空间结构预测C.三级和空间结构预测D.二级和三级结构预测3.数据挖掘的四个步骤不包括下列哪个:(C)A.数据选择B.数据转换C.数据记录D.结果分析4.下列哪项不是生物学研究必备的工具:(A)A.数据分析B.数据统计C.因素分析D.多元回归分析5.Linux中rmdir命令的功能是:(D)A.改变工作目录B.删除工作目录C.创建目录D.删除空目录6.BLAST教案所程序中,哪个方法是不存在的?(D)A:BLASTPB:BLASTNC:BLASTXD:BLASTQ7.下列哪个不是蛋白质结构模型?(D)A:同源性模型B:折叠识别C:abinitio折叠D:MoLScript结构8.人类基因组的结构特点不包括:(A)A:基因进化B:基因数目C:基因重复序列D:基因组复制9、下列哪个选项不是微阵列实验设计的内容?(A)A:贝叶斯网络法B:对照组的选择C:重复样本的使用D:随机化原则10、构建序列进化树的一般步骤不包括:(A)A:建立DNA文库B:建立数据模型C:建立取代模型D:建立进化树四.简答301.简述多序列比对在生物信息学研究中的应用序列结构域和基序的寻找;基因调节因子预测;基因组组装;系统发生遗传学分析2.简述蛋白质次级结构特征的主要用途预示折叠方式;蛋白质结构视观中的直觉方式;影响序列的比对;与功能密切相关3.生物信息学分析的数据对象主要有哪几种?这些数据之间存在着什么关系?其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能。生物信息学以基因组DNA序列信息分析作为出发点,破译遗传语言,认识遗传信息的组织规律,辨别隐藏在DNA序列中的基因,掌握基因调控信息,对蛋白质空间结构进行模拟和预测,依据蛋白质结构和功能的关系进行药物分子设计。4.为什么要进行序列片段组装?在进行序列片段组装时会遇到哪些问题?大规模基因组测序得到待测序列的一系列序列片段,这些序列片段覆盖待测序列,序列片段之间也存在着相互覆盖或者重叠。遇到的问题:碱基标识错误;不知道片段的方向;存在重复区域;缺少覆盖。5.简述图像处理的步骤(1)图像预处理(2)网格定位(3)背景滤除(4)荧光信号提取(5)归一化处理6.简述古生物遗体、化石保存的三种信息:(1)形态学信息(2)化学信息(生物的代谢产物和一般的生物化学分子)(3)遗传信息(保存的一级结构生物大分子,即基因产物和基因片段)五.论述201.论述动物克隆的重要意义动物体细胞克隆可以应用于畜牧业育种上,复制出的数量巨大的优良个体;将个体克隆技术用于生物医学方面,提供基因工程产品,如人乳铁蛋白、抗凝血酶、血清白蛋白等医用蛋白质;提供移植器官;利用个体克隆技术,可以建立起稳定的动物模型。这将有利于揭示基因结构和功能间的关系,揭示生命的本质。动物克隆技术还有可能用于延缓珍稀濒危动物的灭绝。2.论述折叠识别的原因(1)趋异同化,即本来相关的蛋白质,进化过程中序列变化较大,但其折叠方式变化不大(2)趋同进化,即由于功能上的需要,功能相同或相近的蛋白质其结构具有相似性(3)序列变化千千万万,但折叠方式屈指可数,导致不相关的蛋白质,其折叠结构也具有某种相似性(4)折叠分类方法的错误,产生结构的相似性,即得到所谓假阳性结果
本文标题:生物信息试题
链接地址:https://www.777doc.com/doc-6663426 .html