您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 质量控制/管理 > Hadoop试题题库.doc
..袇1.以下哪一项不属于Hadoop可以运行的模式___C___。羇A.单机(本地)模式芃B.伪分布式模式螀C.互联模式羀D.分布式模式肇2.Hadoop的作者是下面哪一位__B____。蚄A.MartinFowler蒂B.Dougcutting虿C.KentBeck膇D.GraceHopper肅3.下列哪个程序通常与NameNode在同一个节点启动__D___。衿A.TaskTracker蒈B.DataNode芇C.SecondaryNameNode蒆D.Jobtracker薁4.HDFS默认BlockSize的大小是___B___。薀A.32MB芇B.64MB薂C.128MB莃D.256M艿5.下列哪项通常是集群的最主要瓶颈____C__。莇A.CPU羃B.网络..螁C.磁盘IO肈D.内存蒇6.下列关于MapReduce说法不正确的是_____C_。莄A.MapReduce是一种计算框架蒃B.MapReduce来源于google的学术论文袇C.MapReduce程序只能用java语言编写薆D.MapReduce隐藏了并行计算的细节,方便使用袅8.HDFS是基于流数据模式访问和处理超大文件的需求而开发的,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是__D____。羁A.一次写入,少次读袀B.多次写入,少次读蚆C.多次写入,多次读羂D.一次写入,多次读蚃9.HBase依靠__A____存储底层数据。虿A.HDFS螆B.Hadoop莃C.Memory膁D.MapReduce莈10.HBase依赖___D___提供强大的计算能力。袆A.Zookeeper螄B.Chubby袂C.RPC蒁D.MapReduce..袆11.HBase依赖___A___提供消息通信机制膅A.Zookeeper芀B.Chubby腿C.RPC羆D.Socket薅12.下面与HDFS类似的框架是___C____?羂A.NTFS羈B.FAT32肆C.GFS蚂D.EXT3蒀13.关于SecondaryNameNode下面哪项是正确的___C___。螇A.它是NameNode的热备膆B.它对内存没有要求肃C.它的目的是帮助NameNode合并编辑日志,减少NameNode启动时间膂D.SecondaryNameNode应与NameNode部署到一个节点螀14.大数据的特点不包括下面哪一项___D___。芅A.巨大的数据量蒄B.多结构化数据蚀C.增长速度快蕿D.价值密度高莅HBase测试题袅1.HBase来源于哪一项?C莂ATheGoogleFileSystem..芈BMapReduce蒅CBigTable芆DChubby螀2.下面对HBase的描述哪些是正确的?B、C、D莁A不是开源的蒅B是面向列的蒃C是分布式的薁D是一种NoSQL数据库膀3.HBase依靠()存储底层数据A薅AHDFS袃BHadoop芃CMemory袈DMapReduce蚅4.HBase依赖()提供消息通信机制A芄AZookeeper蚁BChubby蚇CRPC螅DSocket蚅5.HBase依赖()提供强大的计算能力D莃AZookeeper蚀BChubby袄CRPC螂DMapReduce..袁6.MapReduce与HBase的关系,哪些描述是正确的?B、C葿A两者不可或缺,MapReduce是HBase可以正常运行的保证羄B两者不是强关联关系,没有MapReduce,HBase可以正常运行膃CMapReduce可以直接访问HBase薃D它们之间没有任何关系蒆7.下面哪些选项正确描述了HBase的特性?A、B、C、D蒆A高可靠性螂B高性能艿C面向列葿D可伸缩薆8.下面与Zookeeper类似的框架是?D膃AProtobuf羀BJava芈CKafka蚆DChubby薃9.下面与HDFS类似的框架是?C莈ANTFS羆BFAT32螆CGFS螀DEXT3膀10.下面哪些概念是HBase框架中使用的?A、C螅AHDFS袆BGridFS..膁CZookeeper薈DEXT3螈第二部分:HBase核心知识点袅11.LSM含义是?A薂A日志结构合并树芀B二叉树薇C平衡二叉树羅D基于日志结构的合并树羃12.下面对LSM结构描述正确的是?A、C螈A顺序存储莆B直接写硬盘肅C需要将数据Flush到磁盘肀D是一种搜索平衡树蒀13.LSM更能保证哪种操作的性能?B肅A读膅B写蒁C随机读羇D合并膈14.LSM的读操作和写操作是独立的?A芅A是。袂B否。虿CLSM并不区分读和写羆DLSM中读写是同一种操作..莅15.LSM结构的数据首先存储在()。B节A硬盘上肇B内存中蚅C磁盘阵列中蒅D闪存中蚃16HFile数据格式中的Data字段用于()。A蝿A存储实际的KeyValue数据螈B存储数据的起点蒅C指定字段的长度螀D存储数据块的起点薁17HFile数据格式中的MetaIndex字段用于()。D蒇AMeta块的长度薄BMeta块的结束点芁CMeta块数据内容罿DMeta块的起始点芆18HFile数据格式中的Magic字段用于()。A蚄A存储随机数,防止数据损坏蚂B存储数据的起点蚁C存储数据块的起点肅D指定字段的长度螄19HFile数据格式中的KeyValue数据格式,下列选项描述正确的是()。A、D肃A是byte[]数组腿B没有固定的结构..肈C数据的大小是定长的袄D有固定的结构膀20HFile数据格式中的KeyValue数据格式中Value部分是()。C袁A拥有复杂结构的字符串袇B字符串羄C二进制数据薁D压缩数据莈第三部分:HBase高级应用介绍薅31HBase中的批量加载底层使用()实现。A肄AMapReduce羁BHive肀CCoprocessor蚈DBloomFilter肄32.HBase性能优化包含下面的哪些选项?A、B、C、D莂A读优化蒈B写优化莇C配置优化膄DJVM优化螃33.Rowkey设计的原则,下列哪些选项的描述是正确的?A、B、C膀A尽量保证越短越好膆B可以使用汉字芃C可以使用字符串袀D本身是无序的..蚈34.HBase构建二级索引的实现方式有哪些?A、B羅AMapReduce莃BCoprocessor芁CBloomFilter莀DFilter羈35.关于HBase二级索引的描述,哪些是正确的?A、B蒃A核心是倒排表羆B二级索引概念是对应Rowkey这个“一级”索引肂C二级索引使用平衡二叉树羁D二级索引使用LSM结构螇36.下列关于BloomFilter的描述正确的是?A、C莇A是一个很长的二进制向量和一系列随机映射函数袄B没有误算率螀C有一定的误算率袇D可以在BloomFilter中删除元素羅第四部分:HBase安装、部署、启动葿37.HBase官方版本可以安装在什么操作系统上?A、B、C肀ACentOS膅BUbuntu肂CRedHat膁DWindows蝿38.HBase虚拟分布式模式需要()个节点?A芅A1..蒃B2袃C3薈D最少3个莄39.HBase分布式模式最好需要()个节点?C羄A1莁B2莇C3蒄D最少莅关于hadoop的选择题肃1、DougCutting所创立的项目的名称都受到其家人的启发,以下项目不是由他创立的项目是莀A.Hadoop薄B.Nutch蒂C.Lucene薁D.Solr腿答案:D薄2、配置Hadoop时,JAVA_HOME包含在哪一个配置文件中袃A.hadoop-default.xml芃B.hadoop-env.sh袈C.hadoop-site.xml羈D.configuration.xsl芄答案:B蚀知识点:hadoop配置羁3、Hadoop配置文件中,hadoop-site.xml显示覆盖hadoop-default.xml里的内容。在版本0.20中,hadoop-site.xml被分离成三个XML文件,不包括..肈A.conf-site.xml蚄B.mapred-site.xml蒂C.core-site.xml虿D.hdfs-site.xml膈答案:A肅知识点:hadoop配置袀4、蒈A.mapred-site.xml膈B.core-site.xml膂C.hdfs-site.xml薂D.以上均不是芇答案:B芇知识点:hadoop配置薃5、关于Hadoop单机模式和伪分布式模式的说法,正确的是肀A.两者都起守护进程,且守护进程运行在一台机器上芀B.单机模式不使用HDFS,但加载守护进程莇C.两者都不与守护进程交互,避免复杂性羄D.后者比前者增加了HDFS输入输出以及可检查内存使用情况螂答案:D聿知识点:hadoop配置蒇6、下列关于HadoopAPI的说法错误的是莅A.Hadoop的文件API不是通用的,只用于HDFS文件系统芀B.Configuration类的默认实例化方法是以HDFS系统的资源配置为基础的..螈C.FileStatus对象存储文件和目录的元数据薇答案:A薂//HDFS羂7、HDFS的NameNode负责管理文件系统的命名空间,将所有的文件和文件夹的元数据保存在一个文件系统树中,这些信息也会在硬盘上保存成以下文件:薇A.日志蚇B.命名空间镜像羃C.两者都是荿答案:C蚀知识点:螇8、HDFS的namenode保存了一个文件包括哪些数据块,分布在哪些数据节点上,这些信息也存储在硬盘上。莃A.正确肁B.错误莈答案:B螇知识点:在系统启动的时候从数据节点收集而成的螄9、Secondarynamenode就是namenode出现问题时的备用节点蕿A.正确膇B.错误袇答案:B膅知识点:它和元数据节点负责不同的事情。其主要功能就是周期性将元数据节点的命名空间镜像文件和修改日志合并,以防日志文件过大。合并过后的命名空间镜像文件也在Secondarynamenode保存了一份,以防namenode失败的时候,可以恢复。芁10、出现在datanode的VERSION文件格式中但不出现在namenode的VERSION文件格式中的是膀A.namespaceID..羆B.storageID节C.storageType羃D.layoutVersion罿答案:B肆知识点:其他三项是公有的。layoutVersion是一个负整数,保存了HDFS的持续化在硬盘上的数据结构的格式版本号;namespaceID是文件系统的唯一标识符,是在文件系统初次格式化时生成的;storageType表示此文件夹中保存的是数据节点的类型蚃11、Client在HDFS上进行文件写入时,namenode根据文件大小和配置情况,返回部分datanode信息,谁负责将文件划分为多个Block,根据DataNode的地址信息,按顺序写入到每一个DataNode块蒁A.Client螈B.Namenode膆C.Datanode肄D.Secondarynamenode膃答案:A蒇知识点:HDFS文件写入芆12、HDFS的是基于流数据模式访问和处理超大文件的需求而开发的,默认的最基本的存储单位是64M,具有高容错、高可靠性、高可扩展性、高吞吐率等特征,适合的读写任务是蒅A.一次写入,少次读写蚁B.多次写入,少次读写薀C.一次写入,多次读写莆D.多次写入,多次读写蚂答案:C莂知识点:HDFS特性芈13、HDFS无法高效存储大量小文件,想让它能处理好小文件,比较可行的改进策略不包括..莆A.利用SequenceFile、MapFile、Har等方式归档小文件芆B.多Master设计肄C.Block大小适当调小莁D.调大namenode内存或将文件系统元数据存到硬盘里螀答案:D蚇知识点:HDFS特性螆14、关于HDFS的文件写入,正确的是莄A.支持多用户对同一文件的写操作袀B.用户可以在文件任意位置进行修改肈C.默认将文件块复制成三份存放芄D.复制的文件块默认都存在同一机架上膃答案:C羀知识点:在HDFS的一个文件中只有一个写入者,而且写操作只能在文件末尾完成,即只能执行追加操作。默认三份文件块两块在同一机架上,另一份存放在其他机架上。葿15、Hadoopfs中的-get和-put命令操作对
本文标题:Hadoop试题题库.doc
链接地址:https://www.777doc.com/doc-6301621 .html