您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据挖掘与识别 > 大数据技术原理与应用
一:判断题(每小题5分)1:Pig是一个基于Hadoop的大规模数据分析平台,它为复杂的海量数据并行计算提供了一个简单的操作和编程接口。A:对B:错答案:A正确2:所有的MapReduce程序都需要经过Map和Reduce这两个过程A:对B:错答案:B错误3:一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。A:对B:错答案:A正确4:简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的概率可能会有差异。A:对B:错答案:B错误5:信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。A:对B:错答案:B错误二:单选题(每小题5分)6:YARN的http端口默认是______A80B8080C8090D8088ABCD答案:D错误7:HBase系统基本架构中主服务器Master的作用是______A包含访问HBase的接口,同时在缓存中维护着已经访问过的Region位置信息,用来加快后续数据访问过程B可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一一个Master在运行C主要负责表和Region的管理工作D是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求ABCD答案:C错误8:支撑大数据业务的基础是______A数据科学B数据应用C数据硬件D数据人才ABCD答案:B错误9:Heartbeat间隔默认______A1SB2SC3SD4SABCD答案:C错误10:下列关于HadoopAPI的说法错误的是______AHadoop的文件API不是通用的,只用于HDFS文件系统BConfiguration类的默认实例化方法是以HDFS系统的资源配置为基础的CFileStatus对象存储文件和目录的元数据DFSDataInputStream是java.io.DataInputStream的子类ABCD答案:A正确11:数据仓库的最终目的是______A收集业务需求B建立数据仓库逻辑模型C开发数据仓库的应用分析D为用户和业务部门提供决策支持ABCD答案:D正确12:下列关于大数据的分析理念的说法中,错误的是______A在数据基础上倾向于全体数据而不是抽样数据B在分析方法上更注重相关分析而不是因果分析C在分析效果上更追究效率而不是绝对精确D在数据规模上强调相对数据而不是绝对数据ABCD答案:D正确13:云数据库的特性不包括______A动态可扩展B高可用性C高性能D较高的使用代价ABCD答案:D正确14:在数据生命周期管理实践中______是执行方法A数据存储和备份规范B数据管理和维护C数据价值发觉和利用D数据应用开发和管理ABCD答案:B错误15:Hbase中的批量加载底层使用______实现AMapReduceBHiveCCoprocessorDBloomFilterABCD答案:A正确三:多选题(每小题5分)16:数据再利用的意义在于______A挖掘数据的潜在价值B实现数据重组的创新价值C利用数据可扩展性拓宽业务领域D优化存储设备,降低设备成本ABCD答案:ABC错误17:数据研究经历了几种范式,包括______A实验B理论C计算D数据ABCD答案:ABCD错误18:大数据产业包含______关键技术A批处理计算B流计算C图计算D查询分析计算ABCD答案:ABCD正确19:在网络爬虫的爬行策略中,应用最为基础的是______A深度优先遍历策略B广度优先遍历策略C高度优先遍历策略D反向链接策略ABCD答案:AB错误20:大数据产业发展特点______A规模较大B规模较小C增速较快D增速缓慢E多产业交叉融合ABCDE答案:ACE正确一:判断题(每小题5分)1:信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。A:对B:错答案:B正确2:Hbase可以为Hadoop提供类似于BigTable规模的服务,因此它不能容错地存储海量稀疏数据。A:对B:错答案:B正确3:大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事件必然会发生。A:对B:错答案:B正确4:一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上的可扩展性等特点。A:对B:错答案:A正确5:具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。A:对B:错答案:B错误二:单选题(每小题5分)6:大数据关键技术中,Hbase主要被应用于______A数据采集B数据分析C数据存储D数据挖掘ABCD答案:C错误7:HDFS中当前block大小为128M,如果当前要上传到HDFS中的文件大小为300M,那么在存储时会分配_______个block进行存储A1B2C3D4ABCD答案:C正确8:下列______程序通常与NameNode在一个节点启动ASecondNameNodeBDataNodeCTaskTrackerDJobTrackerABCD答案:D正确9:下列关于聚类挖掘技术的说法中,错误的是______A不预先设定数据归类类目,完全根据数据本身性质将数据聚合成不同类别B要求同类数据的内容相似度尽可能小C要求不同类数据的内容相似度尽可能小D与分类挖掘技术相似的是,都是要对数据进行分类处理ABCD答案:B错误10:下面______程序负责HDFS数据存储。ANameNodeBJobtrackerCDatanodeDSecondaryNameNodeABCD答案:C正确11:下列关于大数据的分析理念的说法中,错误的是______A在数据基础上倾向于全体数据而不是抽样数据B在分析方法上更注重相关分析而不是因果分析C在分析效果上更追究效率而不是绝对精确D在数据规模上强调相对数据而不是绝对数据ABCD答案:D正确12:支撑大数据业务的基础是______A数据科学B数据应用C数据硬件D数据人才ABCD答案:B正确13:下面与HDFS类似的框架是______ANTFSBFAT32CGFSDEXT3ABCD答案:C正确14:HDFS中的block默认保存______份A1B2C3D4ABCD答案:C错误15:配置Hadoop时,JAVA_HOME包含在______配置文件中Ahadoop-default.xmlBhadoop-env.shChadoop-site.xmlDconfiguration.xsABCD答案:B错误三:多选题(每小题5分)16:按照涉及自变量的多少,可以将回归分析分为______A线性回归分析B非线性回归分析C一元回归分析D多元回归分析ABCD答案:CD错误17:大数据产业包含______关键技术A批处理计算B流计算C图计算D查询分析计算ABCD答案:ABCD正确18:数据再利用的意义在于______A挖掘数据的潜在价值B实现数据重组的创新价值C利用数据可扩展性拓宽业务领域D优化存储设备,降低设备成本ABCD答案:ABC正确19:大数据人才整体上需要具备______等核心知识A数学与统计知识B计算机相关知识C马克思主义哲学知识D市场运营管理知识E在特定业务领域的知识ABCDE答案:ABE错误20:数据研究经历了几种范式,包括______A实验B理论C计算D数据ABCD答案:ABCD正确一:判断题(每小题5分)1:Pig是一个基于Hadoop的大规模数据分析平台,它为复杂的海量数据并行计算提供了一个简单的操作和编程接口。A:对B:错答案:A正确2:决策树是一种基于树形结构的预测模型,每一个树形分叉代表一个分类条件,叶子节点代表最终的分类结果,其优点在于易于实现,决策时间短,并且适合处理非数值型数据。A:对B:错答案:A正确3:具备很强的报告撰写能力,可以把分析结果通过文字、图表、可视化等多种方式清晰地展现出来,能够清楚地论述分析结果及可能产生的影响,从而说服决策者信服并采纳其建议,是数据分析能力对大数据人才的基本要求。A:对B:错答案:B正确4:Spark是一个高效的分布式计算系统,它有MapReduce所有优点,同时性能与Hadoop一样高。A:对B:错答案:B错误5:信息生命周期管理是据生命周期管理的来源,最早由英国企业提出。A:对B:错答案:B正确二:单选题(每小题5分)6:下列关于大数据的分析理念的说法中,错误的是______A在数据基础上倾向于全体数据而不是抽样数据B在分析方法上更注重相关分析而不是因果分析C在分析效果上更追究效率而不是绝对精确D在数据规模上强调相对数据而不是绝对数据ABCD答案:D正确7:Hadoop具有特性不包括______A高可靠性B高效性C高可扩展性D低容错性,ABCD答案:D正确8:下面与HDFS类似的框架是______ANTFSBFAT32CGFSDEXT3ABCD答案:C正确9:YARN的http端口默认是______A80B8080C8090D8088ABCD答案:D正确10:大数据关键技术中,Hbase主要被应用于______A数据采集B数据分析C数据存储D数据挖掘ABCD答案:C正确11:大数据时代,数据使用的关键是______A数据收集B数据存储C数据分析D数据再利用ABCD答案:D错误12:HBase系统基本架构中主服务器Master的作用是______A包含访问HBase的接口,同时在缓存中维护着已经访问过的Region位置信息,用来加快后续数据访问过程B可以帮助选举出一个Master作为集群的总管,并保证在任何时刻总有唯一一个Master在运行C主要负责表和Region的管理工作D是HBase中最核心的模块,负责维护分配给自己的Region,并响应用户的读写请求ABCD答案:C正确13:支撑大数据业务的基础是______A数据科学B数据应用C数据硬件D数据人才ABCD答案:B正确14:在数据生命周期管理实践中______是执行方法A数据存储和备份规范B数据管理和维护C数据价值发觉和利用D数据应用开发和管理ABCD答案:B正确15:下列关于HadoopAPI的说法错误的是______AHadoop的文件API不是通用的,只用于HDFS文件系统BConfiguration类的默认实例化方法是以HDFS系统的资源配置为基础的CFileStatus对象存储文件和目录的元数据DFSDataInputStream是java.io.DataInputStream的子类ABCD答案:A正确三:多选题(每小题5分)16:数据研究经历了几种范式,包括______A实验B理论C计算D数据ABCD答案:ABCD正确17:下列关于大数据的说法中,错误的是______A大数据具有体量大、结构单一、时效性强的特征B处理大数据需采用新型计算架构和智能算法等新技术C大数据的应用注重相关分析而不是因果分析D大数据的应用注重因果分析而不是相关分析ABCD答案:AD错误18:大数据应用需依托的新技术有______A大规模存储与计算B数据分析处理C智能化D云计算ABCD答案:ABCD错误19:数据再利用的意义在于______A挖掘数据的潜在价值B实现数据重组的创新价值C利用数据可扩展性拓宽业务领域D优化存储设备,降低设备成本ABCD答案:ABC正确20:大数据产业发展特点______A规模较大B规模较小C增速较快D增速缓慢E多产业交叉融合ABCDE答案:ACE正确
本文标题:大数据技术原理与应用
链接地址:https://www.777doc.com/doc-5638138 .html