您好,欢迎访问三七文档
当前位置:首页 > IT计算机/网络 > 数据库 > 第二章 微机体系结构
第2章微机体系结构目的要求:1、了解CPU的技术指标、指令系统、内部结构与封装技术。2、了解内存储器的分类、发展与应用。3、了解系统总线种类、性能批标。重点难点:1、CPU的技术指标与内部结构以及内存储器的分类、应用。2、系统总线PCI类型性能。内容:2.1微处理器CPU是微机系统的核心部件,其性能的高低往往代表了微机的档次。微机体系结构中的许多先进技术是在CPU中体现出来的。衡量CPU性能的主要技术指标有以下几方面:2.1.1主频主频是指CPU内部电路工作的时钟频率,主频越高,意味着CPU的运行速度越快。1.主频信号的产生CPU的工作频率是从主板上获得的。在主板上有一块时钟电路和一个石英振荡器,当给石英晶体两极加上电压后,便产生出某一固定频率的振荡信号,该周期信号先经过时钟电路进行放大和整波处理,再进行分频或倍频处理,最后产生出CPU所需要的主频信号。2.主频与系统频率的关系系统总线的工作频率一般称为系统频率,也叫基频或外频。CPU主频是通过倍频的方法来实现的,即时钟倍频电路将系统频率按某个倍数提高,这种倍数关系也叫倍频系数。CPU主频=系统频率×倍频系数3.主频与系统的稳定性一方面是由于制造工艺的限制,各器件的反应速度存在极限值,当达到或超过极限值后,器件就不能正常工作,机器会出现不稳定或死机现象。另一方面CPU在高速运行过程中随着主频的增高发热量也会加剧,热量的积累会导致CPU过热而不能正常工作。因此CPU在出厂前会标定出额定工作频率。4.超频让CPU在超出额定频率的条件下工作,这就是所谓的超频。5.前端总线频率前端总线(FrontSideBus,FSB)是指CPU的外部总线,也就是CPU与主板北桥芯片之间的数据传输通道,也可以认为它是CPU与主板之间的接口。2.1.2位宽位宽又叫基本字长,俗称线宽,是指CPU一次操作所能处理的二进制数据长度。通常用CPU内部ALU的位数来代表,字长往往与CPU内部寄存器以及地址线和数据线相当。数据线是CPU与内存及I/O端口交换数据的通道,宽度代表了一次交换数据的能力。地址线决定了CPU的寻址能力,内存访问控制方式在微机发展历史上起了重要作用。寄存器位数代表了各指令的功能和执行效率,是CPU具体能力的体现。2.1.3指令系统指令系统是CPU性能的集中体现,任何型号的CPU都有属于自己的指令系统,它是由CPU制造商设计决定的。指令的格式、种类、寻址方式、指令的多少以及完善程度和执行速度都能反映出该CPU的设计水平和性能优劣。1.8086/8088指令系统2.80286指令系统3.80386/80486指令系统4.Pentium/PentiumMMX指令系统5.K6-2指令系统6.PentiumPro/PentiumII指令系统7.PentiumIII指令系统8.Pentium4指令系统Pentium4指令系统在原MMX的基础上增加和扩充了144条用于多媒体的SIMD扩展指令集,简称SSE2指令集。其中68条是对原有指令的增强,并将64位的MMX指令扩展为128位操作,另外76条是新增加的。Prescott核心的新Pentium4处理器在SSE2指令集的基础上又增加了13条新指令,称为SSE3扩展指令集。其中一条指令专门用于视频解码,两条指令用于线程处理,另外10条指令则用于单指令多数据浮点运算以及其他更为复杂的运算。9.K7-4指令系统K7-4指令系统在原“增强型3Dnow!”的基础上,又增加了类似SSE的52条指令,这些指令称为“3Dnow!-Professional”,简称“3Dnow!-P”。10.Itanium指令系统Itanium是采用IA-64指令系统的第一代CPU。Itanium处理器具有64位寻址能力和64位的内部寄存器,所以称为64位CPU。Itanium指令长度固定为40位,其中指令操作码占13位,预测寄存器地址占6位(可寻址64个预测寄存器),每个寄存器地址占7位(可寻址128个寄存器)。三个寄存器地址中,两个输入寄存器,一个输出寄存器,指令只能对寄存器操作。如图2-1所示。指令1(40位)指令2(40位)指令3(40位)模板(8位)预测寄存器1寄存器2寄存器3操作码图2-1Itanium指令示意图Itanium采用超长指令字,每个指令字是一个128位长的指令数据包,它包含3条40位指令和1个8位模板。指令编译器分析各条指令的数据相关性和指令依赖情况,把能够并行执行的一系列指令放在一起,重新排序并打包后交给CPU执行。8位模板包含了不同指令间的并行信息,编译器使用模板来告诉CPU,哪些指令可以同时执行。模板还包含了包的结束位,以告知CPU这个包是否结束。2.1.4CPU内部结构1.内置协处理器在486之前,CPU中只有一个定点运算器。为了将CPU从繁重的计算任务中解脱出来,另外设计了一个专门进行数值计算的部件——协处理器。从486DX开始,协处理器直接与CPU制作在一块集成电路中,称为内置协处理器。一般来说,协处理器只担负那些计算过程相对复杂的浮点运算任务,所以又称之为浮点运算器。2.片内高速缓存技术随着CPU速度的不断提高,相比之下内存的工作速度显得越来越慢,因此CPU的高效率很难得以充分发挥。通常的解决办法是,在CPU和内存之间设置速度更快的存储器,称为高速缓冲存储器(Cache),虽然Cache的速度很快,但容量与普通内存相比要小得多。CPU内部高速缓存被称为一级高速缓存(L1),主板上安装的高速缓存被称为二级高速缓存(L2);从PII开始,又将二级高速缓存与CPU制作在一起,形成了一级高速缓存在CPU核心,二级高速缓存在CPU周边的局面。3.超标量设计标量就是指一个标准的运算处理部件。超标量设计就是在CPU内部设置多个相互独立的运算处理部件,使各部件能够并行或串行工作,目的是使CPU能够同时执行多条指令,在时钟频率不变的情况下,CPU执行程序的速度自然会大大增加,这是一种用增加部件来换取速度的方案。4.并行处理技术将原多任务的部件拆分成若干个并行的独立部件,每个部件只负责某个单一类型的任务,这样各部件就可以同时并行地进行各自的工作,CPU的效率自然成倍地增加,这就是并行处理技术。5.流水线技术每个部件在具体执行某条指令时必然要分成若干步骤,如何高效地执行各指令又是一个值得研究的问题,流水线技术是解决这一问题的好办法。流水线技术是另一种并行处理技术,其原理是将一条指令的执行过程分解成若干个更小的子过程,每个子过程的操作可以与其他子过程同时进行。由于这种工作方式类似于工厂中的生产流水线,因此,把它称为流水线工作方式。2.1.5CPU性能评价通过前面的介绍我们已经知道,主频的高低只反映了CPU电路动作的快慢。除此之外,其他方面也会对性能产生一定影响,因此应该更为全面客观地对CPU性能加以评价。1.运算速度运算速度,即每秒钟能够执行的指令数,单位为MIPS(百万条指令/秒)目前Pentium4的运算速度已经超过1000MIPS(10亿次/秒)。2.生产工艺集成电路的生产技术水平一般用“工艺线宽”来表示,即电路中线条的宽度。工艺线宽数值越小,电路的工作频率就越高,功耗和发热量也就越小,同时还可以进一步提高芯片的集成度,使CPU内部电路更趋复杂。目前的CPU生产工艺已经小于0.10微米。3.工作电压目前Pentium4工作电压已经降到1.5伏以下,并有可能进一步降低。CPU工作电压下降,芯片发热量自然减少,另一个好处是可以增大芯片的面积,提高集成度。4.封装技术(1)DIP封装双列直插式(DualIn-linePackage)封装(2)QFP封装四方扁平(QuadFlatPackage)封装(3)PGA封装针栅阵列(PinGridArrayPackage)封装(4)BGA封装球栅阵列(BallGridArrayPackage)封装(5)FC-PGA和mPGA封装反转芯片针栅阵列(FlipChipPGA)封装和微型针栅阵列(microPGA)封装(6)LGA封装栅格阵列(LandGradArray)封装2.1.6有关CPU的其他技术1.动态执行技术(1)数据流分析(dataflowanalysis)(2)多路分支预测(multiplebranchprediction)利用先进的转移预测技术,对译码后的几条指令进行分支预测,如需跳转,则将跳转处的指令调入处理器执行,一般情况下预测准确率可高达90%。(3)推测执行(speculativeexecution)根据数据流分析后得到的结果,将优化的指令序列送往处理器的执行部件,并推测出下一步需要执行的指令。2.双重独立总线技术其核心是采用两条总线,一条连接二级缓存,称为后端总线;一条连接系统内存,称为前端总线。这种结构称为双重独立总线(DualIndependentBus,DIB),优点是两条总线可同时独立工作,显著地提高了数据的传输速度。该技术也用于后续的PentiumIII和Pentium4处理器。如图2-2所示。3.执行跟踪缓存技术与一般的指令缓存不同的是,跟踪缓存中存放的不是原始指令,而是经过处理器解码单元解码后的微操作指令,这就避免了重复解码带来的延迟。4.SMP技术对称多处理器(SymmetricalMulti-Processing,SMP)技术就是在同一块主板上安装两个、四个、八个……处理器,各处理器协调工作,并行处理。5.TLB技术编译后备缓冲区(TranslationLookasideBuffer,TLB)技术的特点是处理器不直接访问数据的物理地址,而是先建立比较简单的虚拟地址,处理器直接访问的是虚拟地址,并将结果存放在编译后备缓存区中,由此来提高系统的性能。6.CISC技术和RISC技术CISC(ComplexInstructionSetComputer,复杂指令系统计算机)技术和RISC(ReducedInstructionSetComputer,精简指令系统计算机)技术是两种不同的指令系统设计风格。CISC是增加指令系统的复杂程度,使原来必须用几条指令才能完成的操作用一条指令来完成,这样的话,一方面减小了编程难度使源程序缩短,另一方面程序总指令数减少,自然就会加快程序的执行速度。RISC,其指导思想就是“简单性”,主要表现在指令数少且长度固定。由于指令系统简单,硬件设计和实现的难度大大降低。这样,指令可以直接用硬布线控制实现,绝大多数指令可以在一个时钟周期内执行完毕,而且简单的指令更易于采用流水线技术和实现并行处理。采用简单指令系统编程,无疑会增加指令条数,但综合上述各种因素,显然RISC技术更具优势。7.本地信号处理技术本地信号处理(NativeSignalProcessing),简称NSP技术。从PentiumMMX处理器开始,将音频和视频信息的处理功能也集成到CPU内部统一完成,为了与DSP技术相区别,通常把这种处理方式称为本地信号处理技术。8.超线程技术超线程技术可以简单地理解为,把微处理器中的多条流水线模拟成为多个独立的逻辑处理器,让每个逻辑处理器都能实现线程级并行计算,同时兼容多线程操作系统和软件,进一步提高微处理器的性能。9.双核、双芯技术双核技术就是将两个CPU核心集成在同一个微处理器电路中,而双芯技术是将原来的两个CPU芯片封装在同一个微处理器中。从理论上来说,这两种技术都能将处理器的性能提高一倍。目前的双核、双芯CPU都是基于0.09微米制造工艺,并且很快就会过渡到0.065微米工艺。2.1.7Pentium处理器技术特点Pentium是Intel的第五代芯片,在微处理器的发展中有重要意义。图2-3Intel的Pentium4CPU1.超标量设计奔腾内部有两个32位的ALU用来完成整数运算和逻辑运算,是一个标量为2的处理器,同时还有一个浮点运算部件FPU。两个整数单元(ALU)以及相应的地址生成电路分别组成两条并行流水线U和V,这种结构使得奔腾能够在每个时钟周期内同时执行两条整数运算指令,或者执行一条浮点运算指令(浮点运算指令由U流水线完成,此时V流水线空闲
本文标题:第二章 微机体系结构
链接地址:https://www.777doc.com/doc-3826633 .html