您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 计算机高性能体系结构复习资料整理
本资料是鹤鹤精心整理,仅限内部使用!!!计算机高性能体系结构复习资料名词解释第一章高性能计算与高性能计算机MPP:大规模并行处理计算机:MassiveParallelProcessor。由大量通用微处理器构成的多处理机系统,适合多指令流多数据流处理。SMP:(SymmetricMulti-Processing)对称多处理结构的简称,是指在一个计算机上汇集了一组处理器(多CPU),各CPU之间共享内存子系统以及总线结构。在这种技术的支持下,一个服务器系统可以同时运行多个处理器,并共享内存和其他的主机资源。DSM:分布共享存储,内存模块物理上局部于各个处理器内部,但逻辑上(用户)是共享存储的;这种结构也称为基于Cache目录的非一致内存访问(CC-NUMA)结构;高性能计算机:(也称作巨型计算机、超级计算机)由多个计算单元组成,运算速度快、存储容量大、可靠性高的计算机系统。并行计算机:由多个处理单元组成的计算机系统,这些处理单元相互通讯和协助,能够告诉、高效地求解大型复杂问题。共享存储器多处理机:第二章高性能计算机性能测评并行度:指令并行执行的最大条数。在指令流水中,同时执行多条指令称为指令并行。并行性:计算机系统在同一时刻或者同一时间间隔内进行多种运算或操作。只要在时间上相互重叠,就存在并行性。它包括同时性与并发性两种含义。加速比:(speedup),是同一个任务在单处理器系统和并行处理器系统中运行消耗的时间的比率,用来衡量并行系统或程序并行化的性能和效果。绝对加速比:将最好的串行算法与并行算法相比较.定义一(与具体机器有关)将最好的串行算法在一台处理机上的运行时间与并行算法在N台处理机上运行的时间相比。定义二(与具体机器无关)将最好的串行算法在最快的顺序机上的执行时间与并行算法在并行机上的运行时间相比。相对加速比:同一并行算法在单节点上运行时间与在多个相同节点构成的处理机系统上的运行时间之比。这种定义侧重于描述算法和并行计算机本身的可扩展性。并行机的可扩展性:对任意数量级的处理机和任意规模的问题,若所有算法的系统效率都为1,则系统是可扩展的。第三章高级流水线与指令并行基本(程序)块:如果一串连续的代码除了入口和出口以外,没有其他分支指令和转入点,则称之为一个基本程序块。指令相关:是指指令之间存在的相互依赖的关系,属于程序固有的属性。指令级并行:简称ILP。是指指令之间存在的一种并行性,利用它,计算机可以并行执行两条或两条以上的指令。指令调度:为了充分发挥流水线的作用,必须设法让它满负荷的工作,这就要求充分开发指令之间存在的并行性,找出不相关的指令序列,让它们在流水线上重叠并行执行,这一工作就是指令调度。指令的静态调度:是指依靠编译器对代码进行静态调度,以减少相关和冲突。它不是在程序执行的过程中、而是在编译期间进行代码调度和优化的。指令的动态调度:是指在保持数据流和异常行为的情况下,通过硬件对指令执行顺序进行重新安排,以提高流水线的利用率且减少停顿现象。是由硬件在程序实际运行时实施的。乱序执行技术:乱序执行(out-of-orderexecution)是指CPU采用了允许将多条指令不按程序规定的顺序分开发送给各相应电路单元处理的技术。推测执行:允许在处理器还未判断指令是否执行之前就提前执行。分支预测:(BranchPrediction):从P5时代开始的一种先进的,解决处理分支指令(if-then-else)导致流水线失败的数据处理方法,由CPU来判断程序分支的进行方向,能够加快运算速度。保留站:在采用Tomasulo算法的MIPS处理器浮点部件中,在运算部件的入口设置的用来保存一条已经流出并等待到本功能部件执行的指令(相关信息)。记分牌:是一集中控制部件,其功能是控制数据寄存器与处理部件之间的数据传送。在记分牌中保存有与各个处理部件相联系的寄存器中的数据装载情况。当一个处理部件所要求的数据都已就绪(装载完毕),记分牌允许处理部件开始执行。当执行完成后,处理部件通知记分牌释放相关资源。所以在记分牌中记录了数据寄存器和多个处理部件状态的变化情况,通过它来检测和消除或减少数据相关性,加快程序执行速度。流水线:是多条指令同时执行的一种实现技术,是一种在连续指令流中开发指令级并行性的技术。流水线技术:将一个重复的时序过程,分解成为若干个子过程,而每一个子过程都可有效地在其专用功能段上与其它子过程同时执行。数据竞争:当指令在流水线中重叠执行时,因需要用到前面指令的执行结果而发生的冲突。控制竞争:流水线遇到分支指令或其它会改变PC值的指令所引起的冲突。结构竞争:因硬件资源满足不了指令重叠执行的要求而发生的冲突。反相关:(Anti-dependence)(硬件出现冒险的WAR)指令j写入一个指令I将读取的寄存器或存储器位置,并且指令I首先执行名相关:(namedependence)两条指令使用相同名字(寄存器或存储器位置),但是却不交换数据输出相关:(Outputdependence)(硬件出现冒险的WAW)指令i和指令j写入相同的寄存器或存储器位置;必须保证指令的执行顺序控制相关:是指由分支指令引起的相关。它需要根据分支指令的执行结果来确定后面该执行哪个分支上的指令。真数据相关:数据相关(真相关)。如果满足以下两个条件,则称指令j与指令i是数据相关的:A.指令i产生的结果被指令j使用;B.指令j与指令k数据相关,而指令k与指令i数据相关。数据相关:考虑两条指令i和j,i在j的前面,如果下述条件之一成立,则称指令j与指令i数据相关:(1)指令j使用指令i产生的结果;(2)指令j与指令k数据相关,而指令k又与指令i数据相关精确异常:(所谓不精确异常,是指:当执行指令i导致发生异常时,处理机的现场(状态)与严格按照程序顺序执行时指令i的现场不同。反之,如果发生异常时,处理机的现场跟严格按程序顺序执行时指令i的现场相同,则称为精确异常。)VLIW:超长指令字(Verylonginstructionword)指的是一种被设计为可以利用指令级并行(ILP)优势的CPU体系结构。一个按照顺序执行指令的非超标量处理器不能充分的利用处理器的资源,有可能导致低性能。超标量:一种多指令流出技术。它在每个时钟周期流出的指令条数不固定,依代码的具体情况而定,但有个上限。超流水:在一个时钟周期内分时流出多条指令。超长指令字:一种多指令流出技术。VLIW处理机在每个时钟周期流出的指令条数是固定的,这些指令构成一条长指令或者一个指令包,在这个指令包中,指令之间的并行性是通过指令显式地表示出来的。全局指令调度:需要在多个基本块间移动指令的调度被称为全局指令调度。路径(踪迹)调度:(tracescheduling),踪迹是程序执行的指令序列,通常有一个或多个基本块组成,踪迹内可以有分支,但不一定包含循环。踪迹调度会优化执行频率高的踪迹,减少其执行开销,踪迹调度包括踪迹选择和踪迹压缩两个步骤。关键路径:是指根据指令间相关关系构成的数据流图中延迟最长的一条路径。循环展开:是一种增加指令间并行性最简单和最常用的方法。它将循环展开若干遍后,通过重命名和指令调度来开发更多的并行性。循环级并行:循环的不同叠代之间存在的并行性。谓词执行:(predicatedexecution)是显式并行技术(EPIC)的一个重要的组成部分,是条件执行技术的一种实现,它为每条指令增加一个源操作数(即谓词)作为指令执行条件,当谓词为真时执行指令中的操作,否则将其转换为空操作处理。软件流水:软件流水是一种重组循环体的技术,在软件流水循环(Softwarepipelineloop)的每一次迭代(即新的重组后的循环)体是由原循环的不同迭代中选出的指令组成的,可以达到消除相关性的目的。软件流水技术是通过对循环重新进行建构,使得每次迭代执行的指令是属于原循环不同迭代过程的,是用来安排循环指令,是这个循环的多次迭代并行执行的一种技术。结构冒险(冲突Hazard):在流水线处理机中,如果某种指令组合因为资源冲突不能正常执行则称该处理机有结构冲突,这种情况发生在功能部件不是完全流水或者资源份数不够时。第四章互连与通信互连网络:由开关元件按一定拓扑结构和控制方式构成的网络以实现计算机系统内部多个处理机或多个功能部件间的相互连接。网络直径:是指互联网络中任意两个结点之间距离的最大值。虚拟通道:是两个节点间的逻辑链接,它是由源结点的片缓冲区、结点间的物理通道以及接收结点的片缓冲区组成。第五章CacheCoherence简述题第一章高性能计算与高性能计算机何为高性能计算,研究高性能计算有何意义?高性能计算(英文highperformancecomputing,缩写HPC)指通常使用很多处理器(作为单个机器的一部分)或者某一集群中组织的几台计算机(作为单个计算资源操作)的计算系统和环境。意义:1)高性能计算的内在含义2)高性能计算的应用需求3)高性能计算的战略地位何为并行计算机?简述当代几种主流的并行计算机系统并行计算机是由多个处理单元组成的计算机系统,这些处理单元相互通讯和协助,能够高速、高效地求解大型复杂问题。流行的并行计算机系统:对称多处理机系统(SMP)、分布式共享存储系统(DSM)、大规模并行计算机系统(MPP)、集群系统(Cluster)、并行向量机(PVP)工作站机群(COW)等。何为CMP?请简单说明CMP与SMP的关系CMP:单芯片多处理器(Chipmultiprocessors,简称CMP),也指多核心。是由美国斯坦福大学提出的,其思想是将大规模并行处理器中的SMP(对称多处理器)集成到同一芯片内,各个处理器并行执行不同的进程。CMP相当于集成的SMP。简述MPP和集群系统之间的主要区别(异同点)MPP系统多于100个PE,消息传递、分布存储,峰值可达到3Tperformance,可扩展,价格昂贵,市场有限,可解决高难度问题,是国家综合实力的象征;Culster:包括NOW和COW两种;其特点是:投资风险小,软件财富继承性好,可构成异构系统,资源利用率高,通信开销大等特点MPP(巨型并行处理):这种系统的节点都有自己的CPU,并有自己的专有资源。此种结构相对独立,但各个节点一般没有完全存取I/O的能力。集群:集群系统是由独立的计算机组成,但有控制管理工具统一管理。现有的高性能计算机有哪几种典型结构对称多处理机系统(SMP)、分布式共享存储系统(DSM)、大规模并行计算机系统(MPP),节点可以是单处理器的节点,也可以是SMP、集群系统(Cluster)、并行向量机(PVP)、Constellation简述高性能计算机系统的应用领域以及几种典型的并行应用系统生物医学:蛋白质电子态的计算、药物发明中的筛选过程、蛋白质折叠航空航天制造:发动机燃烧模拟和机翼设计模拟气候环境:短期天气预报、长期天气预报、局部突发性灾难预报(如洪水、海啸)核能领域:完全等离子分析(包括电子结构分析)、核武器数值模拟、天然气燃烧纳米技术:复合材料的结构分析和功能预测、新材料发明天体物理:超新星三维模拟国防和国家安全等领域:密码破译、先进武器模拟并行计算机系统:对称多处理机系统(SMP)、分布式共享存储系统(DSM)、大规模并行计算机系统(MPP)、集群系统(Cluster)、并行向量机(PVP)工作站机群(COW)等。第二章高性能计算机性能测评简述(高性能)计算机性能评价的必要性1)发挥并行机长处,提高使用效率;测试评价优缺点,分别为计算密集型、网络密集型和数据密集型应用问题建议相应的并行机2)减少用户购机盲目性,降低投资风险3)改进系统结构设计,提高机器性能4)促进软、硬件结合,合理功能划分5)优化结构-算法-应用的最佳组合6)提供客观、公正的评价并行机的标准简述并行计算机性能测评的意义意义有:1)发挥并行机长处,提高并行机的使用效率。2)减少用户购机盲目性,降低投资风险。3)改进系统结构设计,提高机器的性能。4)促进软/硬件结合,合理功能划分。5)优化“结构-算法-应用”的最佳组合。6)提供客观、公正的评价并行机的标准。
本文标题:计算机高性能体系结构复习资料整理
链接地址:https://www.777doc.com/doc-7255561 .html