您好,欢迎访问三七文档
当前位置:首页 > 临时分类 > 生物信息学数据库答案
生物信息学数据库答案一、名词解释1、生物信息学(bioinformatics):指应用信息科学的理论、方法和技术,管理、分析和利用生物分子数据。通过收集、组织、管理生物分子数据,得到深层次的生物学知识,加深对生物世界的认识。2、核磁共振(NMR):核磁共振是指原子核吸收外界能量而产生一种能级跃迁现象,其实质是共振吸收。3、开放式阅读框(ORF):是基因的起始密码子开始到终止密码子为止的一个连续编码的序列。4、外显子(exon):指导合成mRNA时的DNA片断,用于形成mRNA前体。也就基因的编码序列。5、中心法则:包括DNA的自我复制,转录形成RNA并翻译成蛋白质,RNA的自我复制和逆转录的过程。6、算法分析:评价一个算法的优劣,通过时间复杂度和空间复杂度来确定。7、数据库管理系统:(databasemanagementsystem,DBMS)对DB进行管理的系统工程,提供DB的建立、查询、更新以及各种数据控制功能。8、数据库:统一管理的相关数据的集合。9、搜索软件:对内容进行筛选,从中选择出符合用户的检索要求的内容同时进行分级排序,将结果显示出来。10、人类基因组计划(HGP):是对人类24条染色体上的3X109个碱基对(basepair,bp)序列进行测定,完成图谱绘制、测序、基因识别,及信息系统的建立。二、选择题(20分)1、GenBank数据库的网址是(B)A.:、PDB蛋白质数据库结构文件中上标的表示S2+方法是(D)A:S^2+BS=2+C:S2+D:S==2+==3、生物学文献数据库中可免费使用的是(C)A:OVIDB:CBIC:PUBD:BIOSISPreviews4、GBFF的数据格式中结尾标识是(A)A://B:!C:*D:5、NCBI数据库中查询使用的是(D)。A:GoogleB:BaiDUC:YahooD:EntreZ6、遗传密码特点(D)A:密码无标点。B:密码简并性。C:密码通用性。D:三者都是。7.生物信息学主要是利用哪种工具实现对生命科学研究中生物信息的存储、检索和分析的科学(B)A.人造卫星B.计算机C.手机D.以上均是E.以上均不是8.人类基因组中真正编码蛋白质的区域仅占DNA序列的(B)。A.1~2%B.3~5%C.5~10%D.10~20%9.序列文件常用的三种格式是(A)。A:NBRF/PIR、FASTA和GDE.B:PIR、FASTA和GDEC:NBRF、FASTA和GDE.D:NBRF/PIR、FASTA和GBFF10.国际上最大的公共蛋白质序列数据库是(C)A.PIRB.MIPSC.PSDD.JIPID三、填空题(20分)1、.生物信息学研究的重点是核酸与蛋白质两方面,包括了___序列__、___结构__、__功能___。以___基因组DNA序列信息__为出发点,破译___遗传语言_,认识_遗传信息___,辩别___DNA中的基因__,掌握基因的_调控信息____,对__蛋白质空间结构___进行模拟和预测,发现___蛋白结构和功能__,揭开生物生命的神秘面纱。2、生物分子携带的三种信息分别为:___遗传信息,结构信息,进化信息。3、人类基因组计划完成的4张图谱分别是___遗传图谱、物理图谱、序列图谱、转录图谱。4、多维数据库分析又称数据挖掘是对数据进行_归纳推理和联想,寻找数据之间的关系,从中发掘有价值的信息。其基本步骤为:数据选择、数据比较_、数据挖掘和结果分析。5、域名由以机构性质命名的域和_以国家地区代码命名的域_两种基本类型组成。6、双绞线的接法按照10/100BASET的规定有T568A_和T568B两种固定的标准,其中T568B的接线顺序为_橙白、橙、绿白、蓝_、蓝白、绿、_棕白、棕。遵循同级交叉异级平行的规律。7、数据模型:(datamodel)数据库结构和语义的一抽象描述,由数据结构、数据操作和完整性约束三部分组成。8、NCBI有四个核心元素_文献出处,DNA序列,蛋白质序列和三维结构。另外两个项目(分类和基因图),以及为序列服务的Entrez.Blast,Cn3D,VAST软件其同组成一个有机的数据库系统。9、常用的分子生物学技术包括限制性酶消化_、凝胶电脉、_印迹和杂交、DNA测序、_克隆及聚合酶链式反应。10、三大数据库是指:美国国家生物技术信息中心(NCBI)的_GenBank数据库;欧洲生物信息学研究所(EBI)所维护的EMBL数据库_;日本国立遗传学研究所的DDBJ数据库。11、网络信息检索中高级检索技术有_加权检索,相似性检索和智能化检索。四、简答题(20分)1、简述生物信息数据库的功能。答:1.收集和管理生物分子数据;2、生物学数据库的查询、搜索和数据的通信;3、生物学数据库实现生物学数据的一般分析和处理。2、简述生物学数据库目前发展的特征有哪些?答:a生物分子数据库的更新速度不断加快,数据量成指数增加。b数据库使用频率增长快,数据库的价值被人们逐渐认识到。c数据库的复杂程度不断增加。d数据库网络化。可以通过internet直接进行访问,公共数据库之间相互链接。e面向应和,不简单的只是数据集,加入了检索和分析工具,可以完成基本的分析功能。f先进的软件与硬件配置。服务器增多,服务软件也增加。3、GBFF格式是由哪三部分组成的?答:第一部分是描述符,从第一行LOCUS行到ORIGIN行,包含了整个记录的信息;第二部分是物性表,从FEATURES行开始,包含了注释这一记录的特性,是条目的核心,中间使用一批关键字;第三部分是序列本身,以//符号结尾。4、生物信息学建立的四类数据库都有哪些?答::一级数据库,是由国际组织建设和维护的数据库。这类数据库优点是完整,更新及时,提供了较好服务平台,但存在精确性、准确性没有经评估,数据过多,重复,分类较粗。一级数据库上开发的二级库,其专一性强,数据量相对少,但质量高,数据库结构设计更合理。专家库,经验专家进行人工校对标识后建立的。质量高,使用可靠,更新慢。整合的数据库。是将不同数据内容按一定的要求整合而成。商业和内部数据库是整合数据库。五、论述题(20)1、谈一谈数据库中三种常见序列文件格式的相同点和不同点。答:数据库的三种常用序列文件格式是NBRF/PIR、FASTA和GDE。一、相同点1、每种格式不仅能够表示序列本身,还可以插入唯一的代码来识别序列,并对序列进行说明,包括序列的名称,序列所属物种,序列的长度及功能等。2、虽然三种格式的扩展名不同,可是其实质都是文本文件。3、在序列中10个残基空一格,60个残基换一行,核酸残基有A、T、G、C、U五种碱基;蛋白质为二十种基本氨基酸符号。4、序列中存在的特别符号—代表不明长度的空位(gap);不明核酸用N,不明蛋白质是X;R代表G或A的嘌呤;Y代表T或C的嘧啶;K代表G或T(带酮基);M代表A或C(带氨基);S代表G或C氢键强;W代表A或T弱;B代表G、T或C;D代表G、A或T;H代表A、C或T;V代表G、C或A;N代有A、G、C、T任意一种;*代表翻译结束。二、不同点1、NBRF/PIR格式;第一行以P1开头是蛋白质序列N1开头是核酸序列。分号后跟一个编号是序列的唯一标识号;_后是标识来源,之后是说明行,扩展名是”。Pir”or”.seq”。2、FASTA格式:第一行以开头但没有指明是蛋白质还是核酸序列后的代码,接着注释,通常注释以“|”分开,第一行没有长度限制。FASTA格式允许以小写字母代表序列。扩展名为“.fasta”3、GDE格式:与FAST格式基本相同,但是行首是%号,扩展名为“.gde”。2、生信与生物学数据库的关系?此题学生根据自己对专业的认识结合自己的想法作答,无固定答案。
本文标题:生物信息学数据库答案
链接地址:https://www.777doc.com/doc-8501147 .html