您好,欢迎访问三七文档
当前位置:首页 > 商业/管理/HR > 经营企划 > 第五章 中央处理器 - 精品课程平台-兰州理工大学
第五章中央处理器CPU的组成和功能指令周期时序产生器和控制方式微程序控制器硬布线控制器流水CPU如何提高计算机的速度?1.提高访存速度高速芯片、Cache、多体并行2.提高I/O和主机之间的传送速度中断、DMA、通道、多总线、I/O处理机3.提高运算器速度高速芯片、改进算法、快速进位链提高整机处理能力高速器件、改进系统结构,开发系统的并行性5.8流水CPU5.8.1并行处理技术不论微型机还是巨型机,并行处理技术已成为计算机技术发展的主流。并行处理技术可贯穿于信息加工的各个步骤和阶段。同时性——两个以上事件在同一时刻发生。如多机系统中,同一时刻多个进程在运行。并发性——两个以上事件在同一时间段发生。如并发程序,某一时刻CPU中只有一个进程在运行,而在一个时间段内,多个进程同时运行。时间上互相重叠。并行性的三种形式:时间并行:时间重叠,使用流水处理部件。流水CPU是以时间并行性为原理构造的处理器,是一种非常经济而实用的并行技术。目前的高性能微型机几乎无一例外地使用了流水技术。空间并行:资源重复,同时工作。在多处理器系统和多计算机系统中应用最多。时间并行+空间并行:时间重叠和资源重复的综合应用。奔腾CPU采用了超标量流水技术,在一个机器周期中同时执行2条指令。取指令3执行指令3指令的二级流水指令的串行执行取指令取指令部件完成总有一个部件空闲指令预取若取指和执行阶段时间上完全重叠,指令周期减半,速度提高1倍…执行指令执行指令部件完成取指令1执行指令1取指令2执行指令2取指令3执行指令3取指令2执行指令2取指令1执行指令1必须等上条指令执行结束,才能确定下条指令的地址,造成时间损失。影响指令流水效率加倍的因素(1)执行时间取指时间(2)条件转移指令对指令流水的影响取指令部件指令部件缓冲区执行指令部件5.8.2流水CPU的结构CPU按流水线方式组织,通常由指令部件、指令队列、执行部件组成了一个3级流水线。执行段速度匹配问题的解决方法:①定点执行部件,浮点执行部件②浮点加法部件,浮点乘/除部件③浮点运算部件都以流水线方式工作流水CPU的时空图WB非流水线处理器时空图EXWB流水线处理器时空图EXWB超标量流水线(Superscalarpipelining)EXWB标量流水计算机:只有一条指令流水线。超标量流水计算机:具有两条以上的指令流水线。流水线速度是原来速度的3倍IFIDEXWR012345678910111213t超流水线(Superpipelining)在一个时钟周期内再分段(3段)在一个时钟周期内一个功能部件使用多次(3次)不能调整指令的执行顺序靠编译程序解决优化问题采用多个处理部件IFIDEXWR012345678910111213t超长指令字(VeryLongInstructionWord)由编译程序挖掘出指令间潜在的并行性,将多条能并行操作的指令组合成一条具有多个操作码字段的超长指令字(可达几百位)常见的流水线形式:指令流水线(指令步骤的并行)算术流水线(运算操作步骤的并行)处理机流水线(程序步骤的并行)流水线的分类若流水线不出现断流1个时钟周期出1结果若不采用流水技术7个时钟周期出1结果理想情况下,7级流水的速度是不采用流水技术的7倍地址形成部件指令译码部件取操作数部件取指令部件操作执行部件回写结果部件修改指令指针部件锁存锁存锁存锁存锁存锁存指令流水线完成一条指令分7段,每段需一个时钟周期锁存器对阶功能部件第一段尾数加部件锁存器第二段规格化部件锁存器第三段算术流水线完成浮点加减运算可分对阶、尾数求和、规格化三段分段原则每段操作时间尽量一致流水过程中通常会出现资源相关、数据相关、控制相关这三种相关冲突,使流水线断流。为此需要采取相应的技术对策,才能保证流水线畅通而不断流。5.8.3流水线中的主要问题资源相关:指多条指令进入流水线后在同一机器时钟周期内争用同一个功能部件所发生的冲突。解决方法:指令推迟执行,或是设置重复资源。1.资源相关问题数据相关:在一个程序中,如果必须等前一条指令执行完毕后,才能执行后一条指令,这两条指令就是数据相关。解决方法:定向传送技术。2.数据相关问题【例4】(P.195)控制相关:当执行转移指令时,根据转移条件是否发生来控制指令的执行顺序。解决方法:延迟转移法、转移预测法。延迟转移法由编译程序重排指令序列来实现。基本思想是“先执行再转移”。转移预测法用硬件方法来实现,依据指令过去的行为来预测将来的行为。3.控制相关问题RISCCPU是继承CISC的成功技术,并在克服CISC机器缺点的基础上发展起来的。RISC机器的三个基本要素是:(1)一个有限的简单指令集(2)CPU配备大量的通用寄存器(3)强调指令流水线的优化。5.9RISCCPU注意,RISC机器一定是流水CPU,但流水CPU不一定是RISC机器。如奔腾CPU是流水CPU,但奔腾机是CISC机器。MC88110CPU结构框图MC88110的指令流水线由于MC88110是超标量流水CPU,所以指令流水线在每个机器时钟周期完成两条指令。流水线共分为三段:取指和译码(F&D)段、执行(EX)段、写回(WB)段。指令动态调度策略88110采用按序发射、按序完成的指令动态调度策略。为了判定能否发射指令,88110使用了计分牌方法。指令发射和定向传送是同时进行的。88110通过历史缓冲器实现FIFO指令按序完成。对于转移处理,88110使用了延迟转移法和目标指令cache(TIC)法。延迟转移通过编译程序来调度。TIC是一个32项的全相联cache,每项能保存转移目标路径的前两条指令。【例5】(P.201)【解】:(1)由于I1,I2间有RAW相关,I2要推迟一个时钟才能发射。类似的情况也存在于I5,I6之间。I3,I4之间有WAR相关,但按序发射,即使I3,I4I5,I6间还有WAW相关,只要I6的完成放在I5之后,就不会出错。注意,I5实际上已在时钟6执行完毕,但一直推迟到时钟9才写回,这是为了保持按序完成。超标量流水线完成6条指令的执行任务总共需要10个时钟周期。(2)根据各段推进情况图可画出流水线时空图5.10多媒体CPU多媒体CPU是带有MMX技术的处理器。MMX是一种多媒体扩展结构技术,特别适合于图像数据处理,极大地提高了计算机在多媒体和通信应用方面的功能。多媒体CPU以新一代奔腾CPU为代表,开始采用单指令流多数据流的新型结构。MMX技术集成到新一代pentiumCPU时,主要体现在:①采用4种新的数据类型;三种打包的数据类型和一种64位字长的数据类型。②使用8个64位宽的MMX寄存器;具有SIMD(单指令、多数据)的并行处理能力。③增设57条新指令。MMX指令的先进性体现在以下五个方面:SIMD结构、饱和运算方式、积和运算方式、比较指令特点、转换指令特点。作业3,5,14,16
本文标题:第五章 中央处理器 - 精品课程平台-兰州理工大学
链接地址:https://www.777doc.com/doc-3802608 .html