您好,欢迎访问三七文档
当前位置:首页 > 高等教育 > 其它文档 > 云计算概论复习提纲及提示
云计算技术复习提纲及提示1.根据你的理解,说明什么是并行计算,什么是分布式计算。答:并行计算:基于分而治之的思想,将一个大问题分解成多个小问题,并发地求解各小问题,使得多个运算得以同时运行的计算模式。分布式计算:是研究分布式系统中如何进行计算的计算机科学。分布式系统有多个由网络连接的计算机组成。这些计算机能够联合完成共同的计算目标。一个计算问题可以分解成许多小任务,分散到不同的计算机上处理,在处理过程中进行消息通信,最后汇总成最终结果。2.简述并行程序设计过程。1首先开发求解一个应用问题的具体算法2程序员在并行计算模型上用高级语言编程实现3编译器将源代码转换成可在并行平台上运行的目标代码(并行库函数)4借助于OS和硬件平台运行(运行时库函数)3.并行计算模型分类。隐式并行模型、数据并行模型、消息传递模型、共享变量模型4.什么是PVM?说明PVM系统由哪两部分组成。PVM软件提供一种使用现有硬件进行高效和直观的并行程序开发的统一框架。守护进程、库函数5.MPI的最小子集由那六个基本函数组成,分别实现什么功能?答见课件6.MPI通信模式(四种)?答:同步模式、缓冲模式、标准模式、就绪模式7.MPI群集通信按照通信方向不同可分为三种,并举例?答:一对多(MPI_Bcast)、多对一(MPI_Gather)、多对多MPI_Allgather)8.MPI归约操作(MPI_Reduce)的主要功能?课件没找到答案(该答案来自百度)1)数据划分和计算任务调度2)数据/代码互定位3)系统优化4)出错检测和恢复9.说明MPICH-G2和MPICH的区别和联系。MPICH-G2和MPICH是MPI标准的两个开源实现;MPICH-G2适用于网格环境,MPICH适用于集群环境;MPICH-G2基于MPICH架构,采用Globus技术实现。10.什么是NFS和NIS,根据你的理解说明它们的主要作用?网络文件系统NFS:让应用程序在客户端通过网络访问位于服务器磁盘中的数据,是在Unix系统间实现磁盘文件共享的一种方法。网络信息系统NIS:为一套用来管理电脑网络中所有与电脑系统管理相关之设置档,如用户帐号、密码、主机名称或组群等的主从式目录服务协定。11.画图说明LSFBatchJob的生命周期(LifeCycle)。12.12、说明LSF中Queue的功能和作用。Queue(队列)既是作业的容器,又同时是调度策略的容器。不同的队列可以配置不同的调度策略。一个队列在不同的时间段可以执行不同的调度策略。13.根据你的理解,说明什么是虚拟化、什么是虚拟机。虚拟化是表示计算机资源的抽象方法,通过虚拟化可以用与访问抽象前资源一致的方法访问抽象后的资源。这种资源的抽象并不受实现、地理位置或底层资源的物理配置的限制。虚拟机(VM)是物理机的一种高效、隔离的复制,其应该具有三个特征:同质,高效,资源受控14.主要的CPU虚拟化技术分哪几类?各有什么优缺点?三类:非虚拟化、半虚拟化、全虚拟化各自的优缺点未找到15.在内存虚拟化技术中,逻辑上将内存划分为那三层?主要的实现技术有哪些?答:三层:虚拟内存、物理内存、机器内存;主要实现技术有:影子页法和页表写入法。16.根据你的理解,说明什么是虚拟机在线(Live)迁移,在线迁移需要保存那些状态?主要技术主要有哪些,有何优缺点?答:在线迁移是在虚拟机运行过程中,将整个虚拟机的运行状态完整、快速地从原宿主机迁移到新宿主机上,整个过程对用户透明,不影响应用程序运行。主要保存CPU状态和内存状态,主要技术有pre-copy和post-copy迁移。17.根据你的理解,说明什么是虚拟化基础设施(VI),建立虚拟化基础设施的目的是什么?定义:“一个基于虚拟化技术的分布式共享基础设施,它能利用OS级别虚拟化技术以及高级分布式系统功能的虚拟化技术(如虚拟网络、虚拟集群、虚拟化资源管理器等)为用户提供可定制的、高性能的、独立的和可靠的虚拟化应用程序运行环境。目的:1共享资源:节约成本2隔离软硬件:提高可用性和灵活性3细粒度的资源管理:高效率18.”说明MapReduce模型的设计目标,一个MapReduce作业分哪两部分?主要功能是什么?设计目标:大型机群上的大规模数据处理两个部分及功能:Map:对输入文件中每一个逻辑输入记录进行用户自定义的操作;Reduce:根据用户定义的方式汇总数据19.举例(画图)说明如何利用Map和Reduce过程计算WordCount?20.说明Hadoop平台架构有哪两部分组成,其功能分别是什么?第二问的答案存疑两部分:HDFS和MapReduceHDFS将文件分割成固定大小的块(64MB),这些块存到工作机(DataNodes)中,MapReduce引擎是运行在HDFS之上的计算引擎,使用HDFS作为它的数据存储管理器。MapReduce引擎也有一个主/从(9master/slave)体系结构,由一个单独的JobTracker作为主服务器并由许多的TaskTracker作为服务器(slaves)。JobTracker在一个集群上管理MapReduce作业,并负责监视作业和分配任务给TaskTracker。(调度器)TaskTracker管理着集群上单个计算节点的映射和化简任务的执行。(运行环境)21.说明PageRank算法的主要思想和设计原则。主要思想:依据网页之间的链接关系评价网页重要程度,被许多优质网页所链接的网页,多半也是优质网页。设计原则:一个网页要想拥有较高的PR值的条件:1、有很多网页链接到它;2、有高质量的网页链接到它22.从初始网页链接关系和PageRank值出发,基于PageRank简化模型(或随机游走模型),计算某次迭代后的PageRank值。利用上面公式,具体算法见课件
本文标题:云计算概论复习提纲及提示
链接地址:https://www.777doc.com/doc-2740301 .html