您好,欢迎访问三七文档
第1章引进先进计算机体系结构和并行处理计算机建筑师一直致力于提高其性能计算机体系结构。高性能可能来自快速密集的电路,包装技术,并行性。单处理器的超级计算机有实现了前所未闻的速度和一直在推动硬件技术的物理限制芯片的制造。然而,这一趋势将很快结束,由于受地理环境和建筑界的计算限制权力,可以用一个单处理器系统实现。在这本书中,我们将学习先进的计算机体系结构,利用多处理并行通过单位。并行处理器的电脑系统多重处理单元组成加上一些需要通过连接,使软件的互连网络处理单元协同工作。有两个主要用于分类等因素系统:自己加工单位和互连网络的关系他们在一起。加工单位的沟通和相互交流要么使用共享内存或消息传递方法。互连网络共享记忆体系统可分为基于总线与基于交换机的。在消息传递,互连网络分为静态和划分系统动态。静态连接有一个固定的拓扑结构不改变,而程序正在运行。动态连接上创建的程序飞行链接执行。对于使用多处理器的主要论点是建立强大的计算机的简单地连接多个处理器。阿多处理器预计将达到更快速度比最快的单处理器系统。此外,一个由多一个单处理器的数量预计将更具成本效益比建设一个高性能单处理器。另外一个好处是多处理器容错功能。如果一个处理器出现故障,其余的处理器应该能够继续提供服务,尽管性能下降。———————————————————————————————————————先进的计算机体系结构和并行处理,由H.EL系列Rewini和M.阿布杜拉萨尔瓦多,巴尔书号0-471-46740-5版权#2005威利父子公司1.140年的计算大多数计算机科学家都认为,有四种不同的模式或时代计算。它们是:批处理,分时,桌面和网络。表1.1由劳伦斯特斯勒修改建议表。在此表中,主要特征不同的计算模式都与每个十年计算,从1960年开始。1.1.1批量时代到1965年的IBMSystem/360大型主机为主的企业计算机中心。这是典型的批处理机打孔卡阅读器,磁带和磁盘驱动器,但没有超出电脑室连接。这台大型机建立大作为计算的标准形式集中电脑几十年。IBM的System/360了一个操作系统,多种编程语言和10兆字节的磁盘存储。在System/360填补了余地金属盒和人去执行。它的晶体管电路,相当快。电力用户可以以高达1兆字节的磁芯存储器32位字。本机是大到足以支持许多方案内存在同一时间,即使中央处理单元已转从一个程序到另一个。1.1.2分时时代在大型机时代的一批确立了20世纪60年代末由半导体技术的进步所取得的固态存储器和集成电路是可行的。在硬件技术的进步而出现的这些小型机时代。他们是小,快,价格低廉,足以在整个传播公司在师一级。然而,他们仍然太昂贵也太困难来交给最终用户。由DEC,PRIME和DataGeneral引领定义了一种新的计算:分时的方式。到20世纪70年代,显然存在着两种类型的商业或商业计算:(1)集中数据处理主机,以及(2)分时小型机。在小规模的并行机,超级计算机的未来发挥作用。第一这种超级计算机中,CDC6600,1961年引进了控制数据公司。克雷研究公司推出了最佳的成本/性能超级计算机中,Cray-1,于1976年。1.1.3桌面时代个人电脑(PC),其中由牛郎星,处理器1977年推出科技,北星,坦迪,准将,苹果和许多人一样,增强对最终用户在众多部门的生产力。从个人电脑康柏,苹果,IBM,戴尔,等等很快普遍开,并改变在计算的面貌。局域网络(LAN)的功能强大的个人计算机和工作站1990年开始取代大型机和小型机。在最有能力的权力大机器可以在桌面了模型之一的成本的十分之一。然而,这些个人台式电脑很快就被连接到更大的复合物计算所的广域网(WAN)。1.1.4网络时代第四个时期,或网络计算模式,是因为迅速全面展开在网络技术的进步。网络技术超过了处理器技术在整个20世纪90年代最。这说明网络的模式崛起列于表1.1。激增的网络容量从一个倾斜的平衡处理器为中心的观点,以网络计算为中心的观点。20世纪80年代和90年代目睹了许多商业并行介绍具有多个处理器的计算机。他们大致可以分为两个主要类别:(1)共享内存,以及(2)分布式存储系统。该处理器的数量在一台机器由数在共享计算机内存中的数以十万计的大规模并行系统。并行计算机的例子在这个时代,包括相继对称性,英特尔IPSC的,Ncube发生,英特尔的Paragon,思维机(的CM-2的CM-5),MsPar(议员),富士通(VPP500)等。1.1.5目前的发展趋势在计算了明显的趋势之一是替代昂贵的专门由工作站更具成本效益的集群并行机。群集是一的独立计算机的集合一些互连网络连接使用。此外,互联网的普及程度在网络计算利息以及最近在网格计算。网络成为地理上分布广泛的计算平台。他们应该提供可靠的,一致的,普遍的,廉价的方式进入到高端计算设施。1.2费林分类法计算机体系结构计算机体系结构的最流行的分类法是在1966年确定的弗林。弗林的分类方法是基于概念的信息流。二信息流为处理器类型:指令和数据。指令流被定义为所执行的指令序列处理单位。数据流被定义为内存之间交换的数据流量和加工单位。据Flynn的分类,或者指令的或数据流可以是单一或多个。计算机体系结构可分为分为以下四个不同的类别:。单指令单数据流(计划局);。单指令多数据流(SIMD)的;。多指令单数据流(MISD);及。多指令多数据流(型MIMD)。传统的单处理器冯诺依曼的计算机被列为计划局系统。不是的SIMD并行计算机或MIMD。只有当有一个控制单元和所有处理器执行同一指令在同步时尚,并行机被列为的SIMD。在1型MIMD机器,每个处理器有它自己的控制单元,可以在不同的执行不同的指令数据。在MISD类别,相同的数据流通过一个线性流阵列执行不同的指令流处理器。在实践中,有没有可行的MISD机,但是,一些作者已考虑流水线机(也许收缩阵列计算机)作为MISD例子。图1.1,1.2和1.3描绘计划局以及SIMD和框图型MIMD分别。一个弗林的分类延伸库克介绍了1978年的DJ。在他的分类,库克进一步扩展了指令流单(标量和阵列)和多(标量和数组)流。在库克的分类数据流所谓的执行流,也扩展到包括单(标量和阵列)和多(标量和数组)流。在库克的分类数据流所谓的执行流,也扩大到包括单(标量和数组)和多(标量和数组)流。这些组合在16类建筑总流的结果。1.3SIMD架构平行运算的SIMD模型包括两个部分:前端计算机通常的冯诺依曼的风格,和一个处理器阵列,如图1.4所示。该处理器阵列是相同的处理单元能够同步设置同时执行不同的数据相同的操作。每个处理器数组中有一个本地内存中驻留的分布式数据少量虽然它正在处理中并行。该处理器阵列连接到内存前端总线,使前端可以随意访问本地处理器记忆仿佛是另外一个记忆。因此,前端的问题导致记忆体部分特殊命令将同时运作或导致数据在内存中移动。一个程序可以开发处死前使用传统的串行编程语言结束。该应用程序执行由串行方式在通常的前端,但问题命令处理器阵列进行并行SIMD操作。数据之间的串行和并行编程的相似性是一个强并行的数据点。同步是由锁步不相关的同步该处理器。处理器要么什么也不做,完全一样行动在同一时间。在SIMD架构,是利用并行运用在大型数据集同步操作。这一模式是最有用为解决问题,有数据需要更新大量批发基础。这是特别强大,许多经常数值计算。主要有两种配置,已在使用的SIMD机(见图。1.5)。在第一个计划,每个处理器都有自己的本地内存。处理器可以沟通,通过互连网络中的其他。如果联网不提供网络之间的直接连接特定对处理器,那么这两人可以交换数据,通过一个中间的处理器。该髂骨四用这些联网计划。互连网络四是允许每个处理器髂直接沟通与四个邻国处理器188矩阵模式,使第Ith个处理器可以沟通直接与(i-1)th,(it+1)th,(i-8)th,和(i+8)th次处理器。在第二次的SIMD计划,处理器和内存模块沟通,其他通过互连网络。两个处理器之间的数据可以传送每个通过中间内存模块(S)或通过中间可能还有其他处理器(第)。的BSP(伯勒斯鈥科学处理器)所使用的第二的SIMD计划。1.4型MIMD体系结构多指令多数据流(型MIMD)并行体系结构是由多个处理器和多个内存模块连接到一起通过一些一些互连网络。它们分为两大类:共享内存或消息传递。图1.6说明了这两个类别的一般架构。处理器通过其中心交换信息,共享内存共享内存系统,并交换信息,通过联网在信息网络传递系统。一个共享存储系统通常完成内部进程协调通过全球所有处理器共享内存。这些都是典型的服务器系统通过总线通信的高速缓存和内存控制器。巴士/缓存架构减少了昂贵的多端口存储器和接口需要电路,以及需要采取的消息传递模式在发展应用软件。由于访问共享内存是平衡的,这些系统也被称为SMP(对称多处理器)系统。每个处理器有平等的机会,读/写存储器,包括享受速度。开关电源商业的例子是Sequent计算机上的平衡与对称,Sun微系统的多处理器服务器,多处理器和SiliconGraphics公司服务器。消息传递系统(也称为分布式内存)通常结合本地内存和处理器在每个互连网络节点。没有全球性的内存,因此有必要从一个地方移动到内存中的数据另一个消息传递手段。这通常是由一个发送/接收对命令,必须把应用软件的程序员写的。因此,程序员必须了解的信息传递模式,其中包括数据复制和处理与一致性问题。商业信息传递的例子架构角1990年是Ncube发生,IPSC的/2,以及各种的Transputer为本系统。这些系统最终让位给了互联网连接系统,使处理器/内存节点要么互联网服务器或客户对个人桌面上。显然,这也是分布式内存是唯一的方法有效地增加了一个并行处理器的数量和分布管理系统。如果更大的可扩展性和更大的系统(如处理器的数量来衡量)是继续,系统必须使用分布式存储器技术。这两个部队创造了一个冲突:在共享的内存模型编程更容易,并通过提供可扩展性的设计模型的信息系统。分布式共享内存(DSM)的架构,在系统开始出现,如SGI公司Origin2000等。在这样的系统,内存是物理分发;为例如,硬件结构如下信息传递的设计学校,但编程模型遵循思想共享内存学校。在实际上,软件包括了硬件。对于一个程序员来说,建筑看上去像一个共享内存机行为,而是一种消息传递软件体系结构下的生活。因此,帝斯曼机是一种混合这需要双方共同设计学校的优势。1.4.1共享内存组织共享的内存模式,是指通过阅读和通信处理器写在共享内存中的所有处理器同样方便的地点进行。每个处理器可能有寄存器,缓冲器,高速缓存,内存和本地银行作为额外的内存资源。一个在共享设计若干基本问题存储系统必须加以考虑。这些措施包括访问控制,同步,保护和安全。访问控制决定哪个进程访问是可能的资源。访问控制模型进行必要的检查由处理器发出的每一个共享内存访问请求,对访问控制表的内容。后者包含标志确定每个访问尝试的合法性。如果有机会尝试资源,然后直到完成所需的访问,访问尝试都不允许和非法进程被阻止。请从共享进程可能会改变访问控制表内容在执行过程中。访问控制的旗帜与同步规则确定了系统的功能。同步制约因素限制了共享进程的访问时间来共享资源。适当的同步,确保正确的信息流并确保系统的功能。保护是一个系统的功能,防止程序从制造任意获取资源属于其他进程。共享和保护是不相容的;共享允许访问,而保护限制它。最简单的共享存储系统包括一个内存模块,可访问从两个处理器。请到达内存模块通过两个端口。内存模块内的一个单位通过仲裁请求通过到一个内存控制器。如果内存模块不是很忙,一个请求到达时,然后通过该单位的仲裁请求的内存控制器和请求批准。该模块被放置在一个繁忙的状态,而请求正在维修。如果一个新的请求到达时的记忆是一个繁忙的服务以前的要求,请求处理器可能保持其上线请求,直至内存空闲,也可以重复它的要求较迟。根据不同的互连网络,共享存储系统导致系统可分为:统一内存接入(UMA),非均匀内存访问(NUMA)和缓存只有记忆体架构(昏迷)。在UMA系统,共享内存是所有的处理器可以通过互连网络以同样的方式单一处理器
本文标题:计算机系统结构
链接地址:https://www.777doc.com/doc-3661129 .html